北京航空航天大学学报(社会科学版)  2017, Vol. 30 Issue (3): 9-16, 54   PDF    
人大代表民意回应度的计算机辅助测量
严行健     
华东政法大学 政治学研究院, 上海 201620
摘要:鉴于直接访谈成本较高,代表议案建议文本是评估人大代表回应民意质量的有效替代途径。基于词分法的自动内容分析技术解决了该领域传统人工评估法面临的效率瓶颈,可以实现对大量案例的快速评估。通过增加词分词数量等方法,该技术的评估准确度还可以进一步提升。运用该方法的案例研究发现,市级人大代表对民意能够做出较为积极的回应。虽然其回应度高于先前对于省级人大及全国人大的同类研究结论,但代表与民众的接触和互动仍有待加强。
关键词 人民代表大会      代表履职      内容分析      词分法      回应民意     
Evaluation of People's Congress Deputy-voter Contact: An Automated Content Analysis
YAN Xingjian     
Political Science Institute, East China University of Political Science and Law, Shanghai 201620, China
Abstract: The article applies the "word score" method of automated content analysis to the study of the 'deputy proposals' submitted by N city People's Congress (PC) deputies. The aim is to evaluate the quality of deputy-voter contact. The data illustrates that local PC deputies actively responded to local people's opinions and demands; however, a lack of direct contact is also witnessed. Eventually, the study testifies the methodological availability in the study of PC related texts. The automated content analysis has massive advantages in reducing time and material costs, offering a brilliant chance for PC researchers to create a national wide database of deputy-voter contact.
Key words: People's Congress     deputy performance     content analysis     word score     deputy responsiveness    
一、 引言

代议机构是代议民主制下民众沟通政治体系的重要桥梁。在人大制度中,各级人大代表除了履行立法、监督、重大事项决策等职能外,还要完成联系基层民众的工作。该工作的重要内容和目的是倾听、发现、总结并向政治体系传递民众的期望和诉求。文章将其简称为代表的民意回应度问题。

代表对民众诉求的回应度不足这一问题自改革开放以来一直存在。[1-2]产生这一问题的原因是多方面的。在现行代表选举模式下,人大代表在产生过程中竞争性不足,直接选举的层级不高,由此导致代表与民众间缺乏选举基础上的“授权-责任”关系。该问题往往被认为是阻碍代表回应度提高的主要制度障碍。[3]此外,人大制度宣传报道中往往刻意突出代表在职业、专业、行业、民族及性别上的占比。这种宣传方式虽有助于突出人大代表广泛的代表性,但会导致汉娜·皮特金(Hanna Pitkin)所谓的“描述性代表”现象。[4]如代表可能会专注于反映其所属行业或职业领域内的诉求或情况,而非其所属选区选民的诉求。此外,人大代表非专职且缺乏辅助工作人员的制度安排也会间接导致代表热衷围绕本行业,甚至基于个人经验提出议案建议。[5-6]可见,代表在工作中对民众的期望和诉求能够做出多大程度的回应,是衡量代表联系群众工作质量的重要依据。

近年来,学界对代表履职行为的研究可以大致分为行为研究和文本研究两个方向。行为研究往往聚焦某个人大案例中代表的履职行为,其研究方法主要是访谈、问卷及质性比较(QCA)等。研究发现,一部分人大代表在工作中开始更为积极地为选民反映他们的诉求。[7-9]然而也有研究表明,代表履职积极性的提高在很多情况下并不是制度激励的结果,而是取决于其身份背景、政治态度和个人特征等因素。[10]相应地,文本研究则普遍聚焦人大代表的议案及建议文本。通过对文本进行人工判断的方法,此类研究对代表履职情况进行了勾勒。[11]76-83[12]36-41然而,此类研究目前仍然采用人工判断的方法,在效率和成本上受到较大影响。

总的来说,无论是从代表行为还是从文本角度切入,上述研究的分析样本都不大,有些甚至属于个案研究。那么,在代表联系群众工作的研究中,是否能够通过计算机辅助的方式实现对大量样本,甚至全样本进行快速低成本分析?对此,文章构建一种基于人大代表议案建议文本的快速分析法。该方法的基本原理是通过人大代表议案建议文本间接评估人大代表对民众诉求的回应度,并以此描述人大代表联系群众工作的方式和质量。根据判断结果,学界首先可以尝试建立全国各级人大代表的民意回应度大样本数据。在此基础上,进一步的研究则可以针对数据的变化进行溯因分析,并以此探索提升代表联系群众工作效果的方法。

二、 词分法(word score)及其应用

基于计算机辅助自动编码技术下的自动内容分析法(Automated Content Analysis)为实现上述研究设想提供了可能的解决方案。内容分析是“客观地、系统地、定量地描述现行传播内容的一种研究方法。”[13]早期的内容分析法主要是对文本中特定段落的占比或是特定词所出现的词频进行统计。自20世纪70年代以来,针对内容分析法的研究在欧美学界蓬勃发展。在这其中,一些研究已经证明该方法能够有效地对代议机构中与议员行为相关的材料(如法案草案、议员发言、询问信乃至议院议事规则等)进行分析。[14-15]

自动内容分析技术包含一系列具体方法。在原始文本处理方法上,现有研究主要有两大类。一类是首先通过人工编码的方式为特定的词或句子赋予含义。这一过程将创造出一个文本集用以“训练”计算机(即编制算法),后者根据该算法大规模地对同类文本进行自动编码赋值。[16]1-31[17]另一类则强调编码过程客观性,其方法主要是通过聚类或因子分析等方法直接将被测文本中的词归为不同的类目,并对其内容展开分析。

在文本分类方式上,自动内容分析法包含“按类别归类”和“在光谱上定位”两大类方法。前者是将文本或更小的分析单元按类归档(如愤怒、喜悦、悲伤及无法分类)。[18]229-247后者则是将文本所反映出的某类特征在一个连续光谱上进行标识。

当前,针对人大议案建议等文本的内容分析研究基本采用简单的词频统计手段。适用于中文内容分析的赋值字典都是研究者根据所要研究的文本特征研发的,尚无专门针对人大的字典。相比而言,基于词频法和字典法基础上的词分法能够较好地解决上述问题。词分法属于“人工设定加自动处理”的连续光谱型内容分析法。其具体操作分为三个步骤。第一,研究者在全部待测文本中选定一定数量的文本作为参考文本,并通过人工判断的方式确定各篇文本的态度分值。第二,通过计算机软件辅助,统计各篇参考文本中一系列选定的词的词频。对于其中的某一词A来说,研究者需要分别将该词在每篇参考文本中的词频除以该词在所有参考文本中的总词频,以得出一个比例。第三,通过将词A在各篇文档中的比例乘以各篇文档的态度评分并加总,就可以得到词A的词分,即

(1)

其中:As为词A的总词分;ANr为词A在参考文本r文中出现的次数;为词A在所有参考文本中出现的次数;Prr文本在人工评估过程中获得的分数。

笔者以3篇文本和3个词为例,具体演示了这一过程,如表 1所示。

表 1 词分计算方法示例

确定参考文本中各词的词分后,研究者即可利用计算机对待测文本的态度分值展开快速的自动评估。由于该过程完全由计算机进行,因此,理论上可以对无限数量的待测文本进行快速评估,只要该待测文本与参考文本属于同类文本,且来自同一情境模式。评估方式如式(2) 所示,即首先计算待测文本中各词分词的词频及占比。其后,用这些比例乘以相应各词词分,加总后的总分即为该文态度分。

(2)

其中:St为待测文本中第t篇的态度分;ANt为词A在文本t中的出现次数;t文中所有词分词的总出现次数。

综上,词分法在逻辑上乃是一种通过人工判断并引入权重因素为文本中的词赋值的方法。与字典法相比,词分法实际上是通过对参考文本进行人工赋分的方式“量身打造”出一本词典。正是由于这一特征,词分法巧妙避免了内容分析法分析中文正式文本时所遇到的语言和功能两方面障碍。特别值得一提的是,字典法一般以形容词为依据判断文本的情感态度。然而,在分析缺少情感词及明显情感态度(甚至是仅具政治态度)的政党竞选纲领及议会报告等内容时,字典法就显得比较乏力。词分法则可以探索并筛选特定文本集中的词语和政治态度等非情感性内容之间的关联,较好地解决了这一问题。

三、 方法设计及数据

按照词分法流程,本研究的具体操作过程主要分为以下几步:

(一) 案例选择

研究使用N市市级人大代表建议作为分析样本。N市是中东部地区省会城市,代表参政议政热情较高,每次会议的代表意见建议在180~250件左右,议案数为3~10件。因议案数量太少,故只对建议做分析。本研究选择市级人大作为分析对象,主要原因是该级别人大代表在层级上来说与群众结合较为紧密。同时,由于市级及区级政府所做出的决策往往与民生直接相关,市级人大成为基层民众诉求进入政治体系的重要渠道。

本研究以该市十四届一次会议(2011年)代表建议为参考文本,以十四届二次会议和十三届四次会议作为待测文本。样本量分别为181、173、226。

(二) 选择词分词并计算词频

词分法通过计算各词词分的方法推断文本功能。因此,词分词越多,推断就越精确。理想状态下,词分法需要对参考文本中所有与文本功能可能相关的词进行赋分。[19]311-331然而,本研究所使用的文本具有两个特点。其一,文本长度很短,有的文本甚至只有百余字。其二,属于半结构化的文本。即无论内容如何,代表意见建议文本都具有相同功能(向人大传递意见、建议、诉求、看法)、相同文本结构(首先提出问题,再尝试提出解决建议),以及一套较为规范的用语(如表达某一亟待解决的社会问题,一定会使用民众“不满”,而非“怨声载道”等文学性词语)。因此,本研究尝试对词分词进行人工挑选而非基于全文词频的基础上挑选频数最高的词。

在具体操作中,本研究首先将词分词划分为“为民众代言”“基于职业或行业提建议”以及“提出宏观问题”三个类。笔者及三位研究生组成的团队对文本进行了试探性阅读和讨论,确定了一系列对应的词分词。在通过Nvivo软件对参考文本中各词的词频进行计算后,笔者排除了一些指示意义不大的词。这类词要么是在文本中出现较少(总词数小于50个或出现该词的文本未超过总文本数量的20%),要么是区分度不够(各篇词频之差小于5个)。具体情况如表 2所示。

表 2 词分词选择情况

(三) 编制赋值光谱并对参考文本进行人工赋值

对参考文本进行人工赋值是词分法的关键。本研究通过两个方法保证赋值的科学性和可重复性。一是由笔者在预赋值的基础上设定清晰明确的赋值规范(coding scheme),二是由笔者及三位研究生分别独立对参考文本进行赋值,并计算平均值。此外,笔者还对不同评估者赋分分差超过1的文本进行了复核。

本赋值光谱以-2~2为端点,并有-1、0、1三个中间点。其中,得分为正的建议以提出、反映具体社会问题为目的,且这些问题的解决将对民生有提升和改善作用。得分为负的意见建议不以具体问题为出发点,而是提出宏观性的发展建议或意见。“你是否同意该代表建议以提出和反映具体社会问题为目的”一题的五个参考点的简要赋值标准如表 3所示。该赋分规则能够涵盖所有的代表建议,且各标准间无重叠,符合内容分析中编码标准的基本要求。

表 3 参考文本赋分规则

需要指出的是,该表中分值的正负并不包含严格的价值判断,而是表示文本在功能属性上的差异。代表依据自己的判断对全市或某个领域的发展出谋划策,并不是履职能力弱的表现。但现阶段中国人大代表工作的主要问题是代表缺乏对民意的有效回应,一些代表缺乏联系群众的动力和意愿,无法为民意提供进入政治体系并得到解决的渠道,以至于出现所谓“闭门代表”“举手代表”等情况。从这个意义上来说,鼓励代表在议案建议中积极反映群众诉求和意见,应当是人大制度的一个发展方向。这意味着,得分为正的案例比例上升符合中国现阶段人大代表联系群众工作的发展方向。

(四) 计算各词词分并以此对待测文本做出推断

利用式(1),本研究首先计算上述15个词分词的总词分。完成该步骤后,通过计算待测文本中15个词的词频,即可利用式(2) 对待测文本的功能属性做出推断。

(五) 数据检验及分析

内容分析法的本质是探寻词汇及其表达功能之间的联系。这种联系即使存在,也仅具统计学意义,而不具逻辑意义。因此,数据检验是内容分析中极为重要的步骤。采用步骤三中的人工评估方法,本研究对已通过词分法做出评估的待测样本重新进行人工评估,并对两种评估方式得出的评估结果做对比分析,以探讨词分法运用于相关领域研究时的策略、注意事项和改进方法。

四、 统计及检验

参考文本中15个词分词的评估结果如表 4所示。其中,“总词频”为该词在全部182条代表建议中的出现次数。“总词分”通过式(1) 计算。“最低词分”和“最高词分”分别表示该词在各条建议文本中录得的最小及最大词分。“词分标准差”为该词在各条建议文本中得分的标准差,显示该词得分的离散度。

表 4 参考文本词分评估结果

基于上述15个词分词的词分,本研究以十四届人大二次会议和十三届人大四次会议的代表建议作为待测文本,对其进行了评估。两次会议的样本量分别为173和226件。同时,为检测评估效果,本研究对同样的样本进行了人工评估,并通过对比两组评估结果的方式对数据及词分法的运用进行检验和探讨。针对三组样本的人工评估中,简单信度率在70%~80%之间。

两种方法评估结果的总体情况如表 5所示,从中可见,词分法能够完成文章提出的基本研究目标--对代表建议文本进行快速自动化的量性计算,以此推断文本的性质。在本研究中,对十四届一次会议的词分法测量结果与人工法之间仅相差1.7个百分点。词分法对十三届四次会议的评估结果误差有所增加。其原因主要是待测文本与参考文本来自不同届的人大会议,两组文本的作者不同。不同作者语言习惯的差异放大了词分法的误差。同时,在同一届人大会议中,代表可能就某一议题连续多年提出建议,且该建议文本的文字表述和目的基本一致。这一因素也在客观上降低了词分法的分析误差。

表 5 待测样本总体评估结果

虽然文章所使用的词分法在总体推断上具有较高的可靠性,但在对具体个案进行评估时,词分法会暴露出一些问题。由于一些个案的得分差异悬殊,导致两方法的个案平均误差绝对值为0.74,处于一个较高的水平。这种差异同时表现在两种判断方式结果的频数分布上,如图 1所示,从中可见,词分法的评估值主要集中在-0.25~0.5的区间中。其中,得分落在“0~0.25”区间内的建议数量最多,占到了全部案例数的近四成。从整体形态来说,数据呈现以0~0.25区间为峰值的单峰偏左分布态势。人工法结果在频数分布状态上与自动评分结果有一些明显差异,其虽然也呈现出以0为峰值的正态分布,但该峰值较低,且在-1、-2、1和2这几个点上也有较高的频数。此外,自动评估的频数结果集中在-1~1.25的区间内。在全部案例中,没有一个案例的得分低于-1或高于1.25。而在人工法中,有21个案例得分到达两端点。针对十三届四次会议的评估结果也呈现类似特征。

图 1 人工法与词分法判断结果频数统计 (以十四届二次会议为待测样本)

导致区别的直接原因是赋分机制的差异。人工法中出现较多的极性评分反映出词分法对极性文本不敏感这一缺陷。在人工赋值过程中,文本中可能出现一个类似“对此问题群众反映强烈”或类似的语句就可以导致评估者打出2分的极性分值,但在词分法中,即使“群众”和“问题”这样的词分词具有较强的正向词分,也无法仅凭一两次的出现而显著增加文本的评分。

进一步的统计分析显示,下述三个因素也是词分法在进行个案评估时产生误差的原因。

第一,待测文本中可用于评估的词分词数量太少。词分法的操作过程决定了文本中各词的权重(出现次数)会对计算结果产生显著影响。这种影响在通过参考文本为词分词赋分,以及通过词分词评估待测文本功能两个过程中都十分明显。较少的词分词数量意味着每个词分词权重加大。因此,词分词过少所引起的直接后果是放大由语言使用上不可避免的随意性所造成的误差。待测文本中各篇文章词分词数量的频数如图 2所示,从中可见,绝大多数文本的词分词都在10个以内,这样小的词分词数量可能是导致个案评估出现较大误差的原因。为对此进行验证,研究以两种评估方式结果差值的绝对值为纵轴,以单篇文本中词分词的数量为横轴划出坐标图,并进行相关性评估。此时,R2为0.011,显示其相关关系很弱,如图 3所示。但图 2也显示出,当词分词的数量超过25时,词分词数量的增加会明显降低词分法判断的误差(此时R2为0.312,且没有案例的误差值超过1)。上述分析表明,25个词分词可能是一个比较理想的评估文本筛选底线:只有词分词数量超过25的待测文本才能够利用词分法对其属性做出推断。

图 2 待测文本各篇词分词数量频数统计

图 3 待测文本词分词数量与两种方法评估结果分差的相关性

第二,词分词词库过小。词分词词库越大,评估越精确。一些在文本处理方法上采用人工评估加自动处理法的代表性文献普遍拥有高达数千词的词库,并且通过模型验证了扩大词库有利于提升评估精确性。[18]229-247[19]311-331需要指出的是,在Readme等软件的帮助下,研究者可以快速地进行数据清洗工作。加里·金(Gary King)等已经尝试编写并使用了针对中文文本的类似程序。[20]一旦此类程序能够有效控制汉语中词意组合随意性的问题,针对中文文本的研究也可以运用全样本词库,进一步减小人工选词过程可能导致的误差。

第三,词分词离散趋势过强。词分法中,较高的离散状况意味着该词与文本的功能之间相关关系较弱。导致这种弱相关关系的原因可能是该词在语义上存在较大随机性,也可能是该词本身的指示性不强。以离散度较高的“行业”一词为例(各词离散度参考表 4),虽然其在大多数情况下出现于代表为某一行业或领域的发展出谋划策的建议中(此时文本的人工评分为负),但该词在一些反映民生问题的建议(文本的人工评分为正)中也会出现,如十四届一次会议中的建议18号反映本市猪肉价格上涨过快造成民众负担,并进而提出本市生猪养殖行业的几项发展建议。建议114号反映餐饮行业污染扰民等问题,也出现了“行业”一词。对十五个词分词的逐步回归也证明了这一问题拟合较好的回归模型中不包括“行业”和“产业”两个离散度明显较高的词分词,“部门”这个离散度最小的词分词则包括在拟合程度最好的模型中,如表 6所示。

表 6 15个词分词在各文本占比与两种方法误差值逐步回归结果

五、 研究发现及探讨

在方法论意义上,词分法可以用于分析人大代表议案建议这种相对正式的格式化文本。根据表 5数据,各词分词的实际得分与团队在选择词分词时对其得分的预判较为一致,这显示词分词与其所出现的文本的功能之间具有统计学意义上的相关关系。如,“居民”“市民”及“群众”3个预计与代表直接回应民意相关的词分词均得到正向得分。其中,“居民”一词得分最高。在实际评分过程中,绝大多数出现“居民”一词的文本都以反映居民对某方面问题的意见和诉求为目的。“区域”一词词分为负,主要原因是出现该词较多的文本往往是代表就所属区域的宏观发展问题提出意见或建议。此外,“行业”及“产业”等预计与代表职业及行业属性显著相关的词大多出现于提出宏观建议的文本中,因此,无一例外地得分为负。值得注意的是,“问题”和“解决”2个词得到较低正向得分,显示代表意见建议中涉及的问题还是以民众诉求为主。在得分为负的词分中,以“产业”一词最为突出,因为出现该词的案例大多是代表围绕某个领域和产业的宏观发展提出一些建议和参考,而非反映具体问题。

同时,词分法对人大代表议案建议的分析还局限于对文本整体中某种特征的比例判断,而非对个案的特征进行精细评估。这一规律与国外已有相关研究的结论是一致的。[16]1-31通过下述三个方式,词分法个案评估的准确性也能够有所提升。

第一,更加精确地筛选词分词。文章采用人工的方式筛选词分词,可能造成一些词的代表性不够。进一步的研究可以通过R中的Rwordseg对全样本自行自动分词,计算全文词频,并从中挑选出数量最多的词作为备选词分词。同时,可以考虑在词的基础上增加二元复合词(Bigram)、三元及多元复合词作为词分词。如果只对单独的词进行统计,有可能使得测量结果受到词义多变性的影响。增加一些二元复合词,可以使词分词的词义更为精确。如在“环境保护”这个二元复合词中,“环境”一词就基本上固定指代自然环境,而非“投资环境”等其他意义上的环境。此外,词分词在各参考文本中的词分计算完成后,可以通过计算方差的方式筛除那些词义变化太大以致失去指示意义的词分词,最终形成一个容量在100~200词左右的词分词词库。第二,加大参考文本的数量,以提高样本量,进一步抵消中文词义漂变可能造成的测量误差。对参考文本进行人工评分时,吸收更多的评估者并详细说明评分规则,也有利于提升人工评估的准确性。在对待测文本进行评估前,研究者也可以利用交叉检测法对参考文本的词分进行检验。其中,多折交叉验证(K-fold Cross Validation)较有效且易于操作。[21]第三,以单篇可录得的总词分量大于25个为标准,筛除那些词分词数量过少的参考文本和待测文本。

在实践意义上,本研究有助于学界进一步认识人大代表联系群众工作的现状和特点。

一方面,对参考文本的人工评估和词分法评估都显示,有超过一半的市级人大代表建议以反映基层群众问题为目标。这一比例明显高于其他学者对省级人大案例所做的相关研究(后者比例约为31%)。[12]36-41这显示代表反映民意和联系群众的积极性与其所处代表大会的层级之间可能具有一种反比关系。桑玉成和邱家军对全国人大代表议案建议的研究进一步说明了这一关系。该研究发现,来自基层的全国人大代表所提出的议案建议中,有75%具有为民众代言的“代议”特征。而在担任地方领导职位的全国人大代表中,有约70%的议案建议仅仅是“对于自己所在地方或单位新的管理举措或者自身工作的介绍”。[11]76-83结合本研究可以发现,代表与群众联系的紧密程度可能并不与其所处的人大层级呈直接相关关系,而是与代表的身份背景具有相关性。李翔宇的研究也发现了类似的趋势。[22]

另一方面,尽管反映民意的代表建议占比超过一半,但在两种评估方法中,频率分布的峰值都出现在0~0.25区间内,显示大量的代表仍旧是基于其所处的行业及职业提出建议案。尽管在现行选区划分模式下,一些代表的职业和其选区是重合的(如大学选区中选出的教师代表),但这一比例仍然显示出基层代表与民众缺乏直接的接触和互动,由此导致代表往往基于其较为熟悉的行业及职业领域提出建议。如前所述,现有研究往往将这一问题归咎于代表兼职制及缺少助理等因素。但其是否适用于本文案例,还有待进一步分析。

此外,在人工评估过程中,本研究没有发现所谓的“雷人建议”。“雷人建议”除空洞且不具可操作性外,还以博人眼球甚至明显违背法理为特征。在全国人大层级上,每年都会爆出一系列广受诟病的“雷人建议”,对人民代表大会制度的权威造成损害。然而在本研究使用的N市人大代表建议文本中,并未出现此类明显的建议案。所有获得-2分的文本都是代表提出了超出市人大权限范围或不能被具体部门执行的建议,而建议本身并不“雷人”。

六、 余论:构建人大代表履职情况大数据库

上文提出的一些研究发现仅是根据一个地方的三次会议样本做出的,结论因而具有较大的局限性。如尽管十四届二次会议中反映基层民众诉求的建议占比要大于十三届四次会议,但并不能确定这一比例的增长是否是一种长期趋势。研究也不能确定基于N市的结论对于其他地方和层级的人大具有多大程度的可推广性。

可以说,当前基于人大文本的研究普遍面临的最大问题就是案例数量限制。在纵向上,这种限制导致研究者无法获得某一案例的面板数据,因此,无法对代表履职情况的历史变迁进行梳理和考察。在横向上,研究者掌握的数据仅仅局限在某一地区及某一层级人大,导致其既无法对各地区几个层级情况展开对比分析,也无法对全国的状况有一个整体性的了解。解决这一问题的最有效方式是构建具有全样本和面板数据特征的代表履职情况大数据库。人工评估工作的效率和成本问题导致其无法用于构建此类全样本数据库。自动内容分析技术可以对人大代表议案建议文本进行自动评估,从而使大数据库的构建具有了可操作性。

该大数据库的构建将能够为人大代表工作相关研究提供有效的数据支持。如研究者可以利用该数据库找到代表履职质量中的特殊案例和典型案例,并有针对性地开展访谈和调研等分析。学界也可以利用大数据库探寻代表履职质量和各地区经济发展水平、教育水平及制度设计细微差异等因素之间的关系,从而为相关制度的发展创新提供有效的指引。

注释:

① 代表议案建议资料中附有代表工作单位联系方式,研究据此判断建议议题与代表职业或行业背景之间的关系。

② 十四届人大二次会议中,编号180号建议未记录在数据库中,无法评估。此外,有6件代表建议由于篇幅过短等原因未录得词分词,因此,无法使用词分法进行评估。

③ 简单信度率计算方法为不同编码者判断一致的样本数/总样本数。本研究中,四位编码者的评估结果差值在1及以下的,看作判断一致。

参考文献
[1] O'BRIEN K. Agents and remonstrators:Role accumulation by chinese people's congress deputies[J]. The China Quarterly, 1994(138): 359–380.
[2] TRUEX R. Representation within bounds:Politics and policy in china's national people's congress[D]. New Haven:Yale University, 2014.
[3] 蔡定剑. 中国人民代表大会制度[M]. 北京: 法律出版社, 2003: 171-178.
[4] PITKIN H. The concept of representation[M]. Berkeley: University of California Press, 1967: 168-169.
[5] 邹平学. 人大代表专职化问题研究[J]. 复旦政治学评论, 2008(1): 52–79.
[6] CHO Y. Public supervisors and relectors:Role fulfillment of the chinese people's congress in the market socialist era[J]. Development and Society, 2003(2): 197–227.
[7] 何俊志, 王维国. 代表结构与履职绩效——对北京市13个区县的乡镇人大之模糊集分析[J]. 南京社会科学, 2012(1): 78–83.
[8] MANION M. Authoritarian parochialism:Local congressional representation in China[J]. The China Quarterly, 2014(2): 311–338.
[9] MANION M. "Good Types" in authoritarian elections:The selectoral connection in chinese local congresses[J]. Comparative Political Studies, 2014(10): 1–33.
[10] 黄冬娅, 陈川慜. 县级人大代表履职:谁更积极[J]. 社会学研究, 2015(4): 169–193.
[11] 桑玉成, 邱家军. 从代表议案和建议看代表属性及其履职之效率[J]. 江苏行政学院学报, 2010(1): 76–83.
[12] 徐理响. 从"代表建议"看我国人大代表选举制度的改革[J]. 济南大学学报(社会科学版), 2013(4): 36–41.
[13] 彭增军. 媒介内容分析法[M]. 北京: 中国人民大学出版社, 2012: 13.
[14] QUINN K M, Monroe B L, Colaresi M, et al. How to analyze political attention with minimal assumptions and costs[J]. American Journal of Political Science, 2010, 54(1): 209–228. doi:10.1111/ajps.2010.54.issue-1
[15] SIEBERER U, Meiβner P, Keh J F, et al. Mapping and explaining parliamentary rule changes in Europe:A research program[J]. Legislative Studies Quarterly, 2016, 41(1): 61–88. doi:10.1111/lsq.2016.41.issue-1
[16] GRIMMER J, STEWART B. Text as data:The promise and pitfalls of automatic content analysis methods for political texts[J]. Political Analysis, 2013(21): 1–31.
[17] SIMON A, XENOS M. Dimensional reduction of word-frequency data as a substitute for intersubjective content analysis[J]. Political Analysis, 2004(12): 63–75.
[18] HOPKINS D, KING G. A method of automated nonparametric content analysis for social science[J]. American Journal of Political Science, 2010(1): 229–247.
[19] LAVER M, BENOIT K, GARRY J. Extracting policy positions from political texts using words as data[J]. American Political Science Review, 2003, 97(2): 311–331.
[20] KING G, PAN J, ROBERTS M. How censorship in China allows government criticism but silences collective expression[J]. American Political Science Review, 2013, 107(2): 326–343. doi:10.1017/S0003055413000014
[21] STEWART B, ZHUKOV Y. Use of force and civil-military relations in Russia:An automated content analysis[J]. Small Wars & Insurgencies, 2009(2): 319–343.
[22] 李翔宇. 中国人大代表行动中的"分配政治"[J]. 开放时代, 2015(4): 147.