社会  2018, Vol. 38 Issue (3): 46-78  
0

引用本文 [复制中英文]

彭亚平. 2018. 技术治理的悖论:一项民意调查的政治过程及其结果[J]. 社会, 38(3): 46-78.
[复制中文]
PENG Yaping. 2018. The Paradox of Technical Governance: A Public Opinion Survey's Political Process and Its Results[J]. Chinese Journal of Sociology(in Chinese Version), 38(3): 46-78.
[复制英文]
技术治理的悖论:一项民意调查的政治过程及其结果
彭亚平     
上海交通大学国际与公共事务学院、公共政策与治理创新研究中心
摘要: 技术治理的逻辑是通过识别和处理源源不断的问题进而把社会呈现在国家面前。它能够完成其使命吗?本文以S市C街道2014年至2016年的连续民意调查为经验对象,系统阐述民意调查为何表面上是一个统计学过程,实质却是由权力运行支配的政治过程。分析表明,在将复杂民意化简成民调数据时,技术只能保证化简程序的严谨性,化简方向则由操作者决定。民调项目的规定性源自基层权力结构,又被转移到对复杂民意的筛选、压缩和量化过程之中,生成指标体系。据此,本文揭示了技术治理的悖论——国家通过技术之眼观察社会时,看到的可能是自己的影子。
关键词: 技术治理    民意调查    复杂性化简    权力运作    
The Paradox of Technical Governance: A Public Opinion Survey's Political Process and Its Results
PENG Yaping     
School of International and Public Affairs, Research Center of Public Policy and Governance Innovation, Shanghai Jiaotong University
Author: PENG Yaping, School of International and Public Affairs, Research Center of Public Policy and Governance Innovation, Shanghai Jiaotong Universitykg  E-mail:yaping.peng@163.com.
Abstract: The logic of technical governance goes as follows:the knowledge of society can be obtained by the state via technology and thus social problems are identified and resolution are found. Questions have been raised about whether technical governance would ever work. For many the answer is negative and doubtful. However, one defense remains:technical governance fails not because the idea is inherently flawed but because the technology is not good. Would technical governance succeed with better methodology and more technical rigor? In order to challenge this defense, this paper examines the operation of opinion polls-a form of technical governance supported by rigorous quantitative social research methodology-run by a sub-district government in the city "S". In particular, this paper asks whether it is possible for a government-run poll to reflect manipulated public opinions, despite the strictest compliance with quantitative polling methodology. The finding of this paper gives an affirmative answer. It argues that on the surface polls are statistic surveys but in actuality they are a political process controlled by the government despite their compliance with all statistical requirements. The power structure of the local government determines the questionnaire questions and their multiple-choice answers (the screening, compressing and quantifying of social scenarios), and the final make-up of public opinion index. The rigorousness of methodology does not guarantee the authenticity of "public opinion" in final poll figures. More likely the outcome is controlled by those who organize polls. Hence, quantifiable technical governance presents contradiction:the state manufactures biased public opinions precisely when it is looking for unbiased public opinions. In the end, the government constructs an image of society in its own reflection.
Key words: technical governance    opinion polls    simplification    power operation    

波义耳和霍布斯发展出了一个政府机构的两大分支,如果没有科学和技术,霍布斯的国家将会软弱无力;如果不在宗教、政治和科学领域之间划定界限,波义耳的科学也将归于无效。

——拉图尔(2010:33)

一、导言

迄今为止,技术治理依然是个无处不在又令人捉摸不定的“幽灵”。自从渠敬东等(2009)判断“国家—社会”关系朝着技术治理转型,使得社会科学将目光瞄准技术治理后,我们到处可见其踪迹。它为精细化治理、网格化治理、大数据治理等理念提供了方法论自信;它是深埋在项目制(渠敬东,2012)、运动式治理(周雪光,2012)和行政发包制(周黎安,2014)等理论观察中的草蛇灰线;它因奔走在电子政务(黄晓春,2010)、精准扶贫(王雨磊,2016李棉管,2017)、土地资源管理(杜月,2017)、流动人口管控(韩志明,2017)等治理实践中而被研究者捕捉。那么,技术治理到底是什么?一个概念,一类现象,一种趋势,抑或只是一个时髦的术语?对这些问题的追寻,又与福柯提出的治理术、法兰克福学派、政治保守主义甚至技治主义(technocracy,又称专家治国)纠缠在一起,使技术治理的面目更加模糊。

与此同时,社会治理的困境又不断地召唤新的、更好的技术。以基层治理为例,个人偏好如何反映到公共偏好之中是治理困境的症结之一。居民二元分化(闵学勤,2009)、中产阶级参与社区事务的兴趣缺乏(熊易寒,2012)、社区抗争愈演愈烈(黄晓星,2012黄冬娅,2013)、居委会弄虚作假(杨爱平、余雁鸿,2012)等治理难题都传达了一个根本问题——民意难以正确、及时地表达,且难以得到有效回应。技术治理的使命正是通过识别和处理源源不断的问题进而把社会清晰地呈现在国家面前。那么,它能够完成其使命吗?人们似乎都在批判技术治理对社会的裁剪、对个体施加的权力(Foucault,1988:403-417),揭示其想要“将体制和结构层次的问题化约为行政技术的问题”却又深陷在现有治理框架中的困境(黄晓春、嵇欣,2016),并预测它的失败(Scott,1998)。事实上,无论哪种理论资源都无法解决下列问题:是技术逃不出被扭曲的命运,还是它本身不够严谨?是技术必定失败,还是其发展程度不够?为此,本文取材极端案例(extreme case),1试图保证技术的严谨性、成熟度和程序的独立性,选择以系统的数学知识特别是统计学原理作为方法论的民意调查领域,去追问技术治理的逻辑及其命运。将其转化成经验问题,即通过揭开民意生产过程的暗箱,探究由基层政府实施的民意调查为何普遍公信力不高,甚至被质疑造假,它能反映真实的民意吗?如果不能,原因何在?

二、理论与文献综述 (一) 当数目字管理进入基层

数目字管理(mathematical management)作为一个韦伯式命题被黄仁宇认定为解决中国治理困境的答案。“可计算的法治系统”(calculable legal system)与“基于规则的行政管理”(administration in terms of formal rules)是国家社会关系理性化进程的标志(Weber,2001:xxxviii)。传统中国的帝制治理主要依赖于文士对儒家经典熟练掌握后形成的以伦理、哲思为基础的行政艺术,而铸币、度量衡、税收汲取、土地登记、军事管理、户籍等计量技术则较为落后或难以推行,使得国家行政管理和司法呈现粗线条和软无力的状态(韦伯,1995:47-59、84-87、112、117-142)。黄仁宇(1997a:55)据此判断,“近代西方可以用数目字管理,中国传统的官僚组织不能用数目字管理”。下面这段话,可以用来诠释此判断:

所以中国社会不能在数目字上管理,由来已久,其以道德代替法律,更以息争的名义,责成里长甲长乡绅族长将大事化小,小事化无。一方面将衙门的工作分量减轻,一方面则阻塞低层社会里各种经济因素公平而自由的交换(因为只有最原始型的交换才能被众目公认,稍带现代型的分工合作,及于较繁复的契约关系,即无社会之保证)。(黄仁宇,1997b:25)

那么,如何进入到数目字管理呢?

信用之展开、经理之雇用、技术之合作,才能透穿整个社会,进入以数目字管理的方式。(黄仁宇,1997b:273)

显然,统治者对技术治理的憧憬意在将社会情境转化成信息甚至是直接的数据,使之成为公共知识,给予社会成员以稳定预期,为社会、组织分工等国家和社会的复杂化提供基础数据库。

然而,瞿同祖在《清代地方政府》一书中却呈现了不同的场景。至少在清代,数目字管理作为行政技术并不少见,甚至贯穿于基层治理。历法、地图和名册为帝国建立起时空坐标系,据此生成信息和数据;官制、俸禄、刑罚、升迁标准等技术互为支撑,构成基层官吏的行为空间。以朝廷至为关心的税收为例,依据测算好的各地方丁数、土地面积,《赋役全书》《清会典》《户部则例》等详细规定了地丁银、漕粮及其他捐税的比率和定额;中央与地方的分成比例;征税、缴税日程和分期缴纳原则;税银、漕粮品质鉴定方法;征税成绩与官员绩效考核挂钩的操作办法;逾期不缴税的处理方式;等等(瞿同祖,2011:203-225)。百姓也有知情权,“州县官们须依令将税目税率刻在衙门前石碑上,晓谕百姓”(瞿同祖,2011:210)。在具体运作上,“制作‘比薄’(讯责期限册),上面列出每个花户每期应缴税额、已缴税额和尚欠税额……欠税最多的花户被排在第一位”(瞿同祖,2011:217)。册薄的数据支撑是“‘限单’、征税流水账、税票存根、‘比照’和(或)‘销照’”(瞿同祖,2011:217)等数据表格。由此观之,在测地术、身份识别、分类、排序、会计等技术手段下,整个税收过程以数据化、定量化的方式在运转,逻辑严密、互为支撑。

然而,如果把观察视角置于微观政治场景,我们就会发现技术的变形或扭曲比比皆是。漕粮征收时,花户的实际纳税额大约是法定税负的250%;如果花户想以现钱代替粮食纳税,以江苏为例,则高至300%~400%(瞿同祖,2011:222-223)。在税收制度如此严密的情况下,为何实际税负如此之高?原因在于,围绕着税收的各个层级都在想办法“捞一笔”。斗级(粮食称重之吏)敲打斗斛以装更多粮食,或以达不到验收标准为由进行敲诈;衙役和地保未经花户同意即代缴钱粮并要求其加息偿还;书吏拖延验收使花户照看成本增加进而索贿,或刁难纳粮花户让其买“好”粮从而参与粮行分成;斗级和书吏又与县官身边的长随合谋以掩盖事实;等等(瞿同祖,2011:80-81、105-106、138)。

如此细密的规定仍阻止不了触目惊心的结果。在整个清代,地方的行政规章一直在修订,具有连续性,但它们都只是“技术性和程序性的,不具有实质意义”(瞿同祖,2011:315)。为什么技术性和程序性的规定不具有实质意义?数目字管理原本是为了呈现清晰的社会图像,为何反而使社会图像变得更加模糊?上述问题引导我们追问技术治理的本质。

(二) 治理、技术和技术治理

与“治理”一词成为时髦术语的情形相似(Offe,2009Fukuyama,2013),技术治理散见于众多文献之中,有时候甚至作为修辞在使用。技术治理到底是什么,还有待考察。“治理”的原意是“掌舵”(steer)、“操纵”和“指引”(conduct)(Jessop,1998),其中暗含技术之义。苏格拉底在与诡辩术士色拉叙马霍斯争论正义时曾说:“我们叫他舵手,并不是因为他在船上实行航行,而是因为他有自己的技术,能管理水手们”(柏拉图,1986:23)。舵手是依靠航海技术/知识对船加以“治理”。同理,牧羊人、医生、建筑师、琴师分别依靠各自的技术/知识对羊群、病人、房屋和乐器进行“治理”(柏拉图,1986:28-30、35)。治理暗含着面向被治理对象的技术,技术之目的是让被治理对象幸福,正如牧羊人要不辞辛劳地照看羊群:清点数量、寻找草场、观察天气(福柯,2016a:320)。在经历了治安官—牧人—宗教牧师—国王这一系列演进之后,随着西方现代国家的形成,治理主体最终被“君主对国家的治理”这一概念垄断(福柯,2010:104-112)。

既然治理暗含着技术,那么技术是什么?根据海德格尔(Heidegger,1977:10)对《会饮篇》的引证,技术是把事物引出来,“使隐蔽的东西在场显露”。“凡是激发(事物)从隐蔽中走出并凸显为在场的,都是涌现,是引出”(Every occasion for whatever passes over and goes forward into presencing from that which is not presencing,is poiesis,is bringing-forth)(Symposium,205b,转引自Heidegger,1977:10,作者自译)。技术让事物的状态从“潜在”转变为“实在”。“潜能先于实现,而每一潜在事物并不必需都成现实事物”(亚里士多德,1959:62)。“潜在”有无数的可能性,一旦转为“实在”,可能性就被限定,事物得以显露意义(亚里士多德,1959:106-107、176、182)。因此,技术让事物显露的过程就是复杂性化简。2

在治理成为国家对社会的专属名词后,技术治理则可被视为国家对社会的复杂性化简。命名术、分类学等语言和概念技术把复杂、模糊的社会情境简化成犯罪、贫富差距、瘟疫、外敌入侵等一个个不断涌现出来亟待国家解决的议题。治安、税收、公共卫生、国防、法律体系等制度技术把人的可能性简化,制造出守法者/违法者、纳税人/逃税者、感染者/健康者、士兵/平民等身份。计数法、会计制度、统计学、几何学等定量技术把社会和人简化成户籍、人口、土地面积、税银等数据。因此,技术治理化简社会复杂性的过程可分为三个阶段:社会情境—议题—数字。在技术治理的作用下,从社会情境3到议题再到数字,社会和人的可能性维度一步步被化简,信息量一步步被压缩,直至成为一个数字,即某个维度上敞开的定量标尺上的一点。

毋庸置疑,技术治理的逻辑遭受到来自各方面的质问。第一个质问是化简造成的社会图像失真。化简后的数字能被还原为当时的情境吗?被删去的信息会不会造成社会图像失真?国家在观察社会时,必须依靠一副眼镜,即技术,去进行问题识别、目标群体定义、需求测算以及成本收益分析等化简程序。在此过程中,社会的模糊性被技术冠以不符合秩序之名,进而被整理或直接删去(Oakeshott,1985:212-219)。德国科学林业出于提高经济收益的目的把复杂的森林简化成单一树种的高大针叶林如挪威云杉,并围绕着选种、生长和砍伐的成本收益分析形成了一套精密的技术流程,而其他因素都被排除或被假定不变(Scott,1998:12)。然而,技术治理形成的数据必须回到社会情境之中才能发挥其作用。此时,由于维度缺失和信息量删减,数据无法被还原为当初被压缩的情境。林业科学的技术程序因为无法还原它们而遭到“报复”:地面灌木丛和枯树被清理导致土壤贫瘠,大小树按树龄分开使得大风刮倒树木的概率上升,其他树种缺乏导致虫害肆虐(Scott,1998:18-22)。类似的例子还有苏维埃农场、坦桑尼亚农业项目、巴西利亚城等(Scott,1998:193、223、103);纽约、芝加哥等美国大城市在城区规划时改建人行道、老街道、旧建筑后也限制了社会的可能性和包容性(雅各布斯,2005:244-282)。化简造成社会失真的根本原因在于,“所有世界中,政治世界可能最经不起理性主义的盘算。政治,总是在其内部深植着传统、偶然和短暂”(Oakeshott,1962:3);社会世界也是由“不可界定性、不连贯性、不一致性、不可协调性、不合逻辑性、非理性、歧义性、含混性、不可决断性、矛盾性”等一切不可通约的事物组成(鲍曼,2013:11)。哈耶克质疑技术治理的可行性和效果,断定国家计划必定因搜集社会动态信息的无能为力而失败(Hayek,1945哈耶克,1997:48-58)。最可靠的社会监控程序是价格,它作为随时更新的社会公共知识具有稳定预期和动态变化等特性,除此之外的程序如科层制、大型经济模型运算等都可能由于信息失真、遗漏以及计算容量的限制而使社会失真(Hayek,1945)。

第二个质问是,化简因为限制社会和人的可能性而隐藏着权力。通过科学知识确立统一性概念和命令等级体系,启蒙理性完成了从理性这一单一权力中心对世界可能性的控制(霍克海默、阿多诺,2006:10)。治理术的逻辑是国家用技术组装起形式/框架,将人们塑造成它需要的人,其运转原理是由一整套制度、程序、计算、分析组装起来的,以政治经济学为知识类型,以安全配置为工具的一系列复杂的权力运作(福柯,2010:45-64,2016a2016b:251-305)。在中国,遍布城镇化、社区建设、生态城市建设、宗教、性健康等一系列领域的治理术(Jeffreys,2009),其背后的逻辑是:一,现代国家能力建设——“大跃进”、大精简和知识青年“上山下乡”,意味着人口管理的整体性方案、程式和技术逐渐完善(郑鹏,2014);二,经济发展主义——经济发展驱动中小学“撤点并校”,理性调节和配置人们迁移、定居、工作和生活的方方面面(叶敬忠,2017);三,中央政府对地方政府的控制——“中央政府逐步建立起了覆盖全国的土地信息系统,并越来越依靠这些可视化的技术知识对地方政府进行监控”(杜月,2017)。此外,政治也渗透到技术设计的过程之中:一个天桥的高度限制着通行车辆,背后隐藏着巨大的阶级歧视和社会区隔;巴黎大道的宽阔设计是为了防止类似法国大革命的巷战发生;一种新型收割机的应用是为了解散工会(Winner,1980)。总之,在技术的化简作用下,人与人、国家与社会的关系被“物化”,丧失了“神秘性”,变得可以操纵和驾驭(马尔库塞,2014:139-143)。

第三个质问是,化简不断走向自己的反面,即自己制造出复杂性。在中国,官僚制运行的逻辑是对上忠顺,而非韦伯的标准定义——因专业技术知识而具备独立性,以对抗来自君主/政治统治集团和平民的双重压力(韦伯,2010:327-328、330-332)。在中国,政治回应的特有形态是,民众需求只有传达到上级才会被重视,只有上级重视才能被下级回应(文宏、黄之玞,2016)。因此,中国技术治理的化简原则往往要相对独立于现有体制才能进行,如以项目、小组、办公室的形式。《叫魂》一书描述了清代中叶弘历皇帝意识到叫魂的“严重性”后,立即抛开常规程序,减少信息传递层级,与官员直接通信(孔飞力,2014:161-163)。朱批奏折这一“机要渠道”是皇帝的一种“制度创新”,它甩开了由“常规渠道和机要渠道组成的文案报告制度”等官僚常规程序对信息的层层过滤和加工,以获取真实、可控的社会信息。信访制度的登记、转办、检查、催办、存档等技术环节(冯仕政,2012),项目制的“立项、申报、审核、监管、考核、验收、评估和奖罚等一系列理性程序”(渠敬东,2012周飞舟,2012),精准扶贫的驻村干部制度和贫困档案、帮扶记录簿(王雨磊,2016李棉管,2017)等治理实践,都是抛开现有条块关系,通过设立专项资金(周飞舟,2012)完成的。然而,技术治理的化简程序在实际操作中把国家和社会关系变得更为复杂。首先,在与政府组织互动的过程中,技术会作为“持存物”留下来,变成治理体系的一部分。例如,设立在各个层级上的网信办、扶贫办、信访办等都变成了科层组织中的一部分。其次,官僚体制中的各个层级都会对技术过程进行意志植入。在遵循“上级发包—下级打包—基层抓包”的运转原则时,项目制涉及的各级政府都会“对集权框架和科层逻辑有所修正,在其中加入更多各自的意图和利益,获得更多的自主权力”(折晓叶、陈婴婴,2011);甚至“借鸡生蛋”,将自己的发展战略与项目融合,并进行捆绑甚至转化(周雪光,2015)。相应的主管部门则因对资源、信息和权力的垄断而有寻租、设租的空间,有可能逐渐演变成“专项意义上的独立王国”(渠敬东,2012)。

既然技术带来的权力即第二个质问无法避免,那么我们要面对的是技术治理的技术问题,即第一个和第三个质问。技术治理对社会的化简一定会造成社会失真吗?是否是技术发展程度不够导致的?以计算机编程为基础的社会仿真和复杂系统建模对社会的模拟已远非哈耶克时代的瓦尔拉斯一般均衡模型可以比拟。在大数据和人工智能技术的支撑下,人们在购物、旅行、求医、住房、网上浏览时以信息数据的方式进入数据库,不断地提供拼图,最终成为技术治理下一个个可识别的脸孔。当脸孔的喜怒哀乐都可以被精准识别且即时反馈时,技术治理的化简任务不就完成了吗?

技术治理的化简程序一定会被扭曲吗?会不会是技术的严谨程度不够导致的?项目制、信访制度、精准扶贫等毕竟是由上级设计的,建立在分类学、初等代数、线性计算等“初级”技术之上,技术与技术之间相互分割,没有形成严密的逻辑,可以“钻空子”的地方多。那么,有成熟方法论作为支撑的民意调查呢?在大数定律/中心极限定理、线性最优等统计学原理的基础上,抽样随机性、问卷设计的信度和效度指标等设定了化简的标准,它们共同作为处理异方差、共线性和自相关等问题的技术工具,一起写就了民意调查的科学保证书。那么,在民意调查中,技术治理的化简程序还会被扭曲吗?

清代地方政府数目字管理的失效,呈现了黄仁宇和瞿同祖分析视角的割裂,这种割裂如果不被解释,将依然是悬置在技术治理宏伟蓝图之上的阴霾。为此,本研究控制住政治因素(暂且不论对社会和人的可能性限定)、技术因素(假定有更好、更严格的技术),只论技术化简社会复杂性的过程,看它能不能达到目的。

三、民意调查的背景和原理 (一) 背景

2014年,S市C街道以项目的形式成立民意调查小组,对辖区内35个居民区进行连续三年的民意调查,内容涉及社区安全、卫生、环境、邻里关系、民生设施、居委会工作等基层治理的多方面。在此基础上,街道建立各社区排名指标体系,用于各部门对居民区两委的考核,同时作为街道行政决策的参考。

(二) 原理

民意不会无缘无故呈现,需要某种机制去提升它,并塑造其形状,使之有意义。受访者表达其意见的同时,就把它从含混、模糊和复杂的“潜在”状态带到了“实在”状态。通过民意调查呈现的民意,也是复杂性化简了的民意。基层政府的民意调查体现了“社会情境—问题—数字”的化简过程,具体可分为问卷设计、问卷填答和指标体系三个技术阶段(详见表 1)。

表 1 分阶段的民意调查过程
1. 如何识别情境?

情境筛选:街道依照一定的原则去筛选代表情境,即居民生活场景,作为问卷中各个问题的原型。

2. 如何问问题?

问题定义:将代表情境表述成问卷中的一个问题时,该情境本来拥有的无数个可能的维度被限制为有限个,以便形成一种叙事逻辑。

问题定量:每个问题,街道都会设置对应的选项供居民勾选。被定义好的问题对应其选择域,选项就是对选择域的刻度设置。

3. 如何抽样?

问卷填答者确定:街道和居委会相互配合,挑选并确定填答问卷的居民。

4. 如何生成数字?

数字生成:居民作为民意表达者,按照选择域的规定选定选项。

数字加总:街道以社区为单位,统计并加总刻度值。规定“如何加总”的是各种民调指标,一个指标就是一个社区排名的标尺。在排名的基础上,街道会将各社区分档次。至此,街道获得民意调查的结果。

由此观之,从情境、问题到数据,民意调查技术规定了所有化简程序,但它们不能自动运行,而是需要街道、居委会、居民以及技术人员合作。民意调查的每一步都有人在操作。在操作过程中,民调小组一直在问民意是什么,此时,民调操作者(发问者)的权力凸显。如何筛选情境和主体,如何定义问题、构成指标,操作者像“是一位导演,随心所欲地摆布客观化工具提供的各种可能性,或拉近或拉远,或放大或缩小,按照一种权力愿望将他自己的构成规范强加于他的对象”(布迪厄,2012:41)。在将民意转化为民调数据的编码过程中,行为主体所携带的阶级、文化和社会基因也一并植入其中。民意调查测量民意的方式是提供化简程序,至于朝着哪个方向去化简,每个主体都有可能自觉或不自觉地植入自己的意志(详见表 2)。民调技术对化简方向的无能为力,为权力入侵提供了空间。

表 2 民调的基层政府各主体

围绕着民意调查,有街道、职能科办、居民、技术人员等几类相关主体。街道及各职能科办负责问卷设计、拟定指标;居委会负责配合街道抽样和组织问卷调查;居民负责填答问卷;技术人员即第三方学术机构负责提供技术指导以保证民调的科学性。

对街道和职能科办来说,其所关心的问题是筛选哪些情境进入问题域、按照什么原则去筛选;朝着哪个方向去定义情境使之变成问题、问题选项如何设置;设置什么样的指标构成排名体系、社区档次如何划分。对居委会来说,其所关心的问题是挑选什么样的居民填答问卷,在自己有权拟定的题目上如何设置,做什么事可以提高分数,等等。笔者作为技术人员的一个直观感受是,民意调查过程中几乎每一步都严苛地遵循科学原理,“绝不越雷池半步”,但过程却总是“不对劲”“别扭”。最终得到的民意调查结果形成“没有造假但公信力低”(除了政府系统内部)的奇特局面。

在各个主体的交互作用下,民意调查表面上是一个统计学过程,事实上却变成了一个政治过程。在基层政府的民意调查中,民意是如何被“制造”出来的,各相关主体的意志如何植入到民意形成的过程之中,本文将通过案例分析逐步演示。在具体操作层面,笔者设计了两种比较机制:或将基层政府各主体的想法与技术人员提供的其他可能性进行比较;或采取历年比较的方式,观察2016年的民调方案较之2015年如何变化。在此基础上,梳理出历年民调方案中不同的设计和调整,并分析其原因。

四、民意化简程序:案例过程 (一) 从“社会情境”到“问题” 1. 问卷设计:如何筛选情境?

问卷是社区情境的集合,即将民意搜集限制在一定的范围内。作为民意调查的执行者和组织者,街道的任务是从35个社区无数个可能的社会情境中筛选组成问卷的代表情境。到底如何选择情境呢?民意调查的目标应作为情境筛选的指引,并据此建构问卷。人们每天早上到社区门口的摊位吃早餐是一种情境,但只有出现占道经营、食品安全问题或夜宵噪音扰民等情况时,才会成为街道民意调查关心的对象。因此,问题发生转向:什么样的经验标准左右了民调问卷中情境集合的筛选原则?在街道的民调动员会议上,街道书记J强调:“我们搞的这个民意调查不是方方面面都照顾到,不是查户口、查账,也不是市场调查。老百姓关心的、XX文件强调的、各社区广泛存在的‘老大难’问题才是我们调查的重点。”5“上级和老百姓关心的”是情境筛选的经验标准,但这是个泛指。在实际操作中,哪些情境被筛选进入集合则基于官员和相关工作人员的日常经验。由此,街道的权力凸显。

在2015年项目前期的多次可行性分析会议中,街道逐步确定了以党建、自治、民生三大版块作为社区情境筛选的框架。然而,根据2015年民调结果的反馈,原来颇具学究气的版块划分已不能满足民调要求,2016年被调整为自治共治、协助街道工作、民主监督和开放性问题四部分(见表 3)。这种变化既受到街道民调项目组成员(特别是负责民调的领导人)与各职能科办关系的影响,也可能出于民调与街道其他项目兼容的考虑,还与时事变化相关。

表 3 问卷设计的版块与题型

新增的“协助街道工作”版块共11题,分别对应各个职能科办的具体工作任务,即让居民评价其所在社区两委在这些工作上的表现。为什么新增“协助街道工作”这个版块呢?负责民调的领导S副主任在可行性分析会议上说:“前两年的民调,我实话实说,开始大家(街道各科室)持观望态度的多。结果呢,效果很好,普遍反映跟实际印象还是比较相符的。比如,我们很多科室年终评估就用到了这些民调的排名……(街道)其他职能科办希望能共享这个数据。借此机会,我们也可以把民调搞得更切合街道的实际工作嘛。我觉得这是个好想法。”6S副主任是个“80后”副处级干部,民意调查的构想是由他提出并全权负责实施的。在笔者看来,他是“很想做事”也“很会做事”的新锐干部。通过本文整理的访谈记录可以看出,大多数民调方案的拟定和修改由他拍板。对S副主任来说,民调是以街道的名义进行的,其费用来源于财政拨款,能否取得街道各职能科办的支持是关系到民调工作能否继续开展的重要影响因素之一。民调结果到底有没有用,在很大程度上取决于各职能科办是否用得上。要想数据用得上,各职能科办的相关工作必须在版块设计中加以体现。

版块的重大改动包括以下几方面:第一,原属于自治版块的基层民主单独归属为“人大和社区其他选举”,即民主监督版块;第二,原党建版块则聚焦于对“党建资源地图”项目的评价,并纳入自治共治版块之中;第三,原民生版块被归入自治共治活动版块的“TXJY”特色项目子版块。“人大和社区其他选举”在2016年被单列出来,可能的解释是民调的开展时间恰逢五年一度的基层人大代表选举。笔者调研XHMJ社区时,了解到部分居民刚结束人大代表投票活动后赶过来做问卷调查。党建资源地图和“TXJY”特色项目是这两年区里和C街道主推的政府治理创新的特色项目,街道用此代替原有版块不仅可以检验它们在各社区推广的效果,还能与区里和街道目前的工作重心相配套。在民调项目开题会上,主持会议的街道党委书记J发言:“突出C街道特色、反映C街道民情是我们民调的重要目标嘛。一说党建,大家都觉得虚。一说民生,大家又觉得杂。你说社区工作做什么?……我个人觉得,党建资源地图和‘TXJY’(特色项目),就是我们C街道的党建和民生。”7

2. 情境的压缩方向:如何问问题?

情境样本框确定好之后,接下来的流程是如何将情境定义为问题?一个问题的诞生,意味着一个情境朝着某个方向被限定好了。以代表情境——社区组织的人大选举和业委会选举——为例,居民与该情境发生联系的途径有多种,对情境定义的可能性也相应的有多种,并对应各自的目标问题。如可以问“你觉得业委会能够解决业主和物业的矛盾吗?”“参加过今年居民区居委会的换届选举投票吗?”“你觉得基层人大代表选举公平吗?”“你熟悉业委会选举的各位候选人吗?”当问题最终被定义为“您认为居民区内人大选举和业委会选举组织的如何”时,街道的权力在于,将基层民主这一情境压缩为居民对所在居委会组织类似活动的能力的评价。对一个社区的基层民主建设进行衡量,既不选用人大代表能否履职、选举过程是否公正,也不选用造成目前选举冷漠的原因等问题,而是询问居民居委会组织选举的能力。显然,居委会的组织能力无法支撑起民主监督这个主题,却又带着这个主题的帽子,并成为计算基层民主指数时的标准。

街道为何如此命题?这样符合科学原则吗?民调的目的是反映居民对社区的评价,街道把民调与绩效评价结合起来后,民调就变成了居民对居委会的评价。人大代表的履职、选举过程的公正性不属于社区两委的工作范围,且选举冷漠是一个敏感的政治话题,加上两委对选举工作的影响范围也只在于组织这项活动,所以只能朝着这个方向命题。问卷设计的效度和信度要求研究目标清晰、问题措辞清楚,且对问题的回答应具备跨时间、相似问题等方面的稳定性(Rasinski,2008:364)。在前期的可行性随机测试(后将述及)中,我们发现问卷并无克罗尼克等学者(Krosnick, et al., 2002)所说的“无态度”问题,理解歧义、脉络效应等干扰因素也较少。问卷设计基本符合效度和信度原则。

类似图 1的例子广泛存在。公共卫生方面不问医患矛盾、看病难、看病贵等问题,而问健康知识讲座做得好不好;外来人口管理方面不问城管执法、外来人口落户困难等问题,而问群租合租治理问题;法律援助方面不问上访、拆迁、业主维权、环境抗争等问题,而问家庭暴力的调解问题、法律宣传力度等。显然,学界和社会关心的基层治理热点问题几乎都没有进入问卷,但进入问卷的问题又都跟它们沾边,以支撑其背后的主题。社会情境被化简成问题时有多个方向,社会或学界的化简方式与基层政府截然不同。在2015年的民调动员会上,J书记说:“我们问卷的题目数量尽量要控制,问切身的,问到痛处,问我们工作中遇到的真实问题。”8在街道和居委会的工作中,“切身的”“真实”问题,可能并不是医患矛盾、城管执法等,因其不在工作范围之内。群租治理则属于居委会的职责范围,在作为2016年区里绩效考核标准的《区“TXJY”建设星级居委会创建操作手册》上,“积极消除‘六乱’(乱设摊、乱搭建、乱涂写、乱晾晒、乱堆放)现象,有效整治控制群租”与“人口服务和管理到位,底数清,动态准,群防群治有实效”两个指标各占3分(百分制)。当民意调查的操作权掌握在基层政府手中时,其管辖范围、上下级关系就会被植入到将社会情境化简为问题的过程之中。

图 1 问卷中的代表问题
3. 问题定量:刻度背后的权力

民意可计算的标准是定量化,因此需要将问卷上的问题转换成标准刻度,即设定选项,以便将个体意见加总。刻度的设置一般有定序和计数两种方式。前者将问题的选择域标尺化,模拟成数轴并分割成n等份,如著名的“李克特量表”(Likert scale)五选项;后者计算某事件发生的次数,如询问次数或直接设置成多选题。然而,将选项定量原理运用到社区现实生活的难点在于,如何将复杂的社会事实化简成标准化刻度上的一个点?

以社区“TXJY”自治项目为例,它询问各社区围绕着区里“TXJY”特色项目开展活动的情况。原则上,每个社区都应该有自治活动创新的特色和亮点,如PX社区的“分享冰箱”、WY社区的“YWYS”议事会以及MFL社区的“MFLShow”微信公众号等。然而,并不是每个社区都能在短时间内打造出特色鲜明的“品牌”,超过半数的社区把日常活动如节日送温暖、消防演练、知识讲座、疏通下水道、解决停电问题等套上“TXJY”的招牌并上报街道。街道也很清楚哪些社区有真正的“TXJY”特色项目。事实上,为了配合区里主推的“TXJY”特色项目以及星级居委会评选活动,部分社区的项目还是由街道直接介入和重点打造的。那些没有“真正”特色项目的社区,可能存在多方面的原因,有的社区依旧在征集议题、想点子,有的却“不想折腾”(某中年社区书记语);但不容忽视的一点是街道有无介入。如果询问居民对其所处社区“TXJY”项目的真实评价,势必无法排除街道因素,也可能使部分社区得零分。同时,在“TXJY”特色项目之外,还有很多活动或民生实事需要社区完成。一位居民在访谈中论及:“我们Y书记,不像别人爱出风头,搞那些东西我们也不懂……我是晓得的,每个周三下午带着人(打)扫卫生,还去马路(上)执勤。我们是老旧小区,情况复杂,什么人都有,外乡人摆摊的、租房子的,隔壁吵架泼粪,搞得乱七八糟。事情不好做啊。不容易。”9为了取得平衡,街道最终决定在问卷中询问两道题:一道是询问居民对各社区上报的“TXJY”特色项目的评价,选项采用定序方式,为单选题;另一道是询问居民参与过社区组织的哪些活动,选项采用计数方式,为多选题。

同时,命题权也被下放到各社区。就上述单选题而言,由于既不能排除自己的干扰因素以服众,又不想承担辨认真假“TXJY”的风险,街道让各社区自己上报“TXJY”特色项目。就多选题而言,街道并不清楚各个社区开展活动的真实情况。尽管社区开展活动会向街道上报,但上报格式类似于通讯稿,很难看出谁好谁坏。甲、乙两个社区都有“自治议事会”,但实际运行效果可能差别很大,而它们的上报格式和信息量大同小异。此外,各个社区上报的活动数量和频率差异很大,影响因素也很多,条件好或书记进取心较强的社区活动会比较多、质量也比较好。JX社区书记曾就此事言及:“我们现在是小社区了,(工作)人手也少,10前两年动迁,居民也走得七七八八。有的活动比如过年过节,有些老邻居念旧情,还能来聚一聚。搞医疗卫生宣传,哪有人来呢。”11社区活动开展情况的复杂性,促使街道规避风险而下放命题权,让每个社区都选出自己满意的活动。但为了统一计量,多选题和单选题的问题格式已经给定,即居民填答参加过社区组织的哪些(“TXJY”范围内的)项目或活动,以及居民对某个项目或活动的评价如何。

社区出题的权力表面上看可以决定哪些活动进入到题目之中,实际上却可以通过控制选项去影响结果。以多选题“你知道或参加过社区组织的哪些活动”为例,该题的计量方式是统计选项被勾选的比例。各个社区的经济状况、两委人员配置等并不一致,街道没有规定选项的个数,只要求至少3个。由于选项个数不定,各社区在设置选项时存在着技巧——在其他条件既定的情况下,选项设置越少,该题的得分率就越高。据统计,各社区在该题中设置的选项数平均为5.14个,标准差为1.60;而该题得分率与选项个数的相关系数为-0.801,双尾检验显著性为p < 0.001。各社区设置的选项个数直接影响到该社区在该题上的得分,即设置选项越少的社区,得分率越高。于是,悖论产生了:如果街道统一规定标准的选项个数,那么标准个数越多对条件好的社区越有利,越少则对条件差的社区越有利;如果街道不统一规定选项个数,那么对各社区最有利的做法是设置更少的选项,同样无法筛选出在“TXJY”特色项目上表现出众的社区。

(二) 从“问题”到“数字”

作为民调科学性的重要指标之一,样本的随机性尤其被街道看重。就方法论而言,简单随机抽样(simple random sampling)可得到数理统计的大数定律和中心极限定理的支持,进而符合独立同分布假设(independent and identically distributed,i.i.d.)。在实际操作中,社会调查往往以简单随机抽样为基准,适当考虑区域、年龄、工作等影响样本分布的结构性要素,即采取分层抽样(stratified sampling)以降低抽样成本,提高效率(Kalton,1983:8-47)。就调查方式而言,面对面调查、电话调查、自填式问卷法、网络调查都可以成为备选方式(Donsbach and Traugott, 2008:240-282;Groves and Lyberg, 2010)。

1. “做卷子”:集中填写问卷的理由

此次民意调查最终选择的抽样方法是以各社区人群分类为基础的分层抽样,调查方式是集中填写问卷。把样本集中起来填写问卷的方式在西方的民意调查中很难见到。用居民常说的话叫“做卷子”,填一份问卷好比考一场试。12其实,备选调查方式如入户采访、街头偶遇、电话采访等(Tourangeau and Smith, 1996),都在前期的可行性分析会上讨论过。除了技术本身的特点带来的优缺点外,更重要的因素是来自民调项目的限制。在20世纪80年代的美国进行全国性面对面调查时,每名受访者要耗费1 000美元左右(Groves, 1989, 转引自Donsbach and Traugott, 2008:228)。此次民调规模虽然远比不上全国性调查,但产生的费用也不少,且都要从街道的项目经费中支出。针对这个问题,S副主任说:你说35个社区挨家挨户敲门,搞得不行引起抵触情绪,没必要,也没那个时间、精力和人力……每个社区都搞个会议室,把居民集中起来,投票箱、会场什么的,反正都是现成的,下面(的人)都熟悉,搞起来也比较正式。”13 14

出于成本和仪式化的考虑,一场民意调查要与其他不少活动结合起来,社区安排得紧锣密鼓。具体流程有:

●  各位居民代表在会场坐定后,该社区书记上台作年终述职报告;

●  在技术人员的监督和辅导下,受访者填写问卷,然后问卷被回收;

●  部分居民代表(一般为8~10人)参与街道组织的结构性访谈,对社区两委工作人员进行打分和评价;

●  街道工作人员对社区两委逐一进行访谈,并打分。

在各社区的民意调查过程中,街道相关工作人员、技术人员、社区干部、居民代表全部到场,工序明确、高效运转。所有事情都集中在半天时间内处理,一个社区的任务就完成了。有意思的是,当笔者询问居民对社区的民意调查是否感到新鲜时,一位居民表示:“我们一年有好几次活动,都是这么搞的。”15对居民来说,社区经常有活动,民意调查与“中秋赏月”联谊会、老年健康知识讲座等相比,在形式上相差并不大。

那么,S副主任最在乎的指标——随机性——能保证吗?技术上的解释同样有说服力。集中填写问卷可以保证调查环境、调查时间和调查中的工作人员造成的影响是相同的,控制住了常见的情境、访员和季节等因素。此外,街道也设置了针对各个社区的小样本(10~15个)随机测试,采取街头偶遇的方式,以便测试问卷的效度和信度,并作为集中填写问卷这一填答方式的稳健性检验。

2. 居民人数的控制权:分层抽样的政治学

抽样时如何分层呢?各社区样本数量的下限被统一规定为50人。这些人从哪里来?民意调查通常很难取得一张包括所有成员在内的名册(Kalton,1983:6-7),街道无法掌握各个社区人口的实时动态信息,没有一个质量较高的可供抽样的总体。就算能够调用户籍数据,因拆迁、工作变动、升学等导致的人口流动也会造成大量的无响应误差(non-response error)(Weisberg,2005:159-204)。

民调的分层抽样方案是,以各社区向街道上报的总体信息作为每个社区的抽样框,由街道确定样本。为保证随机性,街道对每个社区的总体库做了一些规定:首先是人数的最低限制,各社区根据实际常住人口数量,上报200~1 000人不等;其次是居民样本数量,每个社区最终到场填写问卷的人数不少于50人;再次是对居民类型的规定,必须要包括社区党员(含“双报到”的在职党员)、楼组长、志愿者、群众活动团队成员、物业管理人员、驻区和共建单位人员(含小区沿街商铺业主)、业委会成员、党代表/人大代表/政协委员、社区民警、其他居民等十一类人群;最后,待抽样的每个居民的姓名、性别、电话号码以及所属人群类型等信息都要完备。各社区提交符合规定的抽样总体后,交与街道进行分层抽样。

将确定抽样总体的权力交与居委会可能存在一些问题,居委会选择被抽样居民时会依据成本原则。事实上,掌握200~1 000个居民的资料对不少居委会来说难度很大。能够被掌握资料的一般是信息被社区登记过的人,因此,社区居民已经就“与居委会有无交集”这一指标经过了一轮筛选。只要对问卷中的个体特征变量如居民年龄、受教育程度、职业类型等情况稍加考察,比如做个散点图,马上就会发现有不同程度的偏态。如在所有居民区的1 773个样本中,离退休人员占比达74.84%,在该社区居住十年以上的样本占比高达81.22%。退休老年人作为参加社区活动的主力军的局面依然没有改变(熊易寒,2012)。不过,分层的基础是十一类人群,只要保证这些类型的人员比例符合要求,在技术上就算抽样质量良好。

问题出在抽样总体和人群的划分方式上,但二者的设置都是有原因的。抽样总体存在的问题是,居委会能够调动的资源是有偏的。对此,接受访问的HD社区书记说:“年轻人上班的上班,面都见不到,去哪里请哦。”旁边的另一个工作人员插话:“(他们)有时间也不见得来。”书记接过话头:“现在的小年轻不懂也不理解社区(工作)的情况。平常打交道多的群众,明白我们工作的难度,了解我们的情况。说来做卷子,基本还是支持的。”16人群划分方式与基层政府对现有人群的分类相对应,以便民意调查的数据结果能够作为参数直接输入到科层机器之中。楼组长有何意见、群众活动团队成员对哪些问题反响比较热烈、共建单位比较在乎什么问题等,都可以作为基础数据库的一部分,直接被上级、街道职能科办采用,或与其他数据整合,以便进一步对数据进行挖掘。

居委会的控制力还体现在样本数量上。根据样本量设置的规则,每个社区填写问卷的居民数量原则上不少于50个,考虑到部分被抽样居民可能无法到场,街道将分层抽样的样本量定为每社区75人。从2016年民调实际到场人数来看,各社区填写问卷的居民平均数为51.14,其中到场人数刚好为50的社区有15个;低于50的社区只有5个,刚好为49人的社区就占了其中3个。街道并没有规定到场人员的上限,并且鼓励各社区达到60人以上,但各个社区实际到场人数与街道要求的人数下限居然有如此惊人的契合。而且,此现象在2015年就已经显现。社区居委会对到场填写问卷的居民有着怎样的控制力?样本是否被“污染”或是否有人冒名顶替?为此,在技术人员的建议下,2016年街道随机在部分社区设置到场居民签名簿,以核对样本的真实性。在现场,笔者曾好奇于签名簿上一个极具年轻人特质的姓名,想对其进行采访。询问居委会工作人员后发现,该年轻人因工作繁忙,由其母亲过来代填问卷。对此,负责此次问卷调查的街道工作人员F的态度是:“(名单符合)难度很大啊。签名单(和抽样册)能够符合已经是很不容易了。我们到现在也不知道误差率有没有底线和标准,反正尽量符合吧……他老娘也应该算社区群众吧。”17笔者挑选ZYY、TXJY和WE三个社区核对人员名单后发现,除了字迹无法辨认的个别姓名外,只有TXJY社区有两个姓名不在抽样名册上。如此精准的签名簿背后有怎样的故事,街道和居委会为何这么重视签名簿的正确性而非真实性,都是值得思考的问题。

一个解释是,抽样人数的富余和人群分类标准的漏洞给了居委会转圜的余地。75人的抽样人数给了社区干部25人的转圜余地,以挑选更容易来“支持工作”的居民。按照十一类人群的划分标准,抽样总体中居民类型重叠的现象较为普遍,某人可以既是志愿者也是群众活动团队成员同时还是党员。社区干部可以任意配置具有多重身份的居民以符合街道要求,操作的空间更大。

(三) 从“数字”到“数字”加总

居民为所有刻度赋值后,街道可依照各个加总原则将刻度值累加,得到不同的指标数据和对应的社区排名、档次,最终绘制成民意地图。构建指标体系是民意调查的最后一个阶段,也是街道和社区最为看重的部分。各个指标基于相应的版块制作而成,如党建资源指数、自治共治指数、基层民主指数、TXJY指数和配合职能科办指数等。最终计算出来的指标既要给各个职能科办使用,又要呈给街道领导阅读甚至上报区里,还会直接制作成《XX社区诊断书》下发到各个社区。

1. 分值权重

每个社区都有无数的情境在发生,身处情境中的居民对此作出评判,即意见(Allport,1937)。居民的意见本无优/劣、重要/次要之分,但蕴含操作者目的的民调却对此进行了排序。在拟定民调指标时,构成指标的各个问题的分值权重就是街道对各个社区情境的重要性排序。未被筛选入问卷的绝大部分社区情境被赋值为0,被筛选进问卷的社区情境会被放置在相应的版块之中,并按照街道赋予的重要性标准,分别赋值0.5、1、2、3、5。2016年的五个版块被分配了不同的权重,甚至各个题目的分数都不一样(见表 4)。街道依据什么标准去设定情境排序(问题的分数),笔者不得而知。从笔者与拟定分数的S副主任的接触来看,他似乎权衡和斟酌了很久,修改过好几次,可又说不出理由。“应该”“可能”“吧”等模糊性的词汇在交谈中反复出现,整个拟定过程像是一个复杂的工程,令人费解。有一个方法或许可以帮助我们看出些许端倪。前已述及,为了获得职能科办的支持,使民调结果能为其日常工作所用,问卷中的一些问题与各个职能科办的工作范围相对应。由此,可以计算出与各职能科办相关的问题分值在问卷中所占的百分比,见表 4。服务办、平安办、管理办等科办所占的分值比例高达16%,妇联、团工委、武装部、工会等科办却只占1%,部门之间极不均衡。分值权重既反映了目前基层工作的重心,又把C街道各部门的地位作为结构的基因植入了民调。

表 4 各科室民意调查问题分值占比
2. 指标计算的技巧之一:计算方法

作为对街道所有社区的情况摸排,从2015年起,18每年的民意调查都设置了进步指数,计算依据的是各社区历年的民调得分。事实上,历年民意调查的题目、版块和分值都存在较大的差异,采取基准年标准与上一年相比意义不大。从结果来看,2015年各社区民调平均得分为89.95,2016年为86.93,分数出现下滑,若直接采取基准年的方式计算进步指数,则大部分社区在2016年是退步的。在成果说明会上,S副主任表态:“进步指数得要,不然上面看到了(这一部分缺失),会很显眼。进步指数这个东西,就是我们C街道工作搞得好不好(的直接体现),一眼就看出来了……有没有别的办法想?”19在长时间的讨论中,技术人员提供了几种计算进步指数的方法,在场的街道民调小组成员(由街道工作人员组成)询问和验证了这些方法的科学性。最终,动态指数和静态指数这对统计学概念提供了“技术支持”。20由此,2016年各社区的进步指数采用了基准社区的计算方法,用当年某一社区的总分除以中位数,得到横向比较指数;然后再以2015年的横向比较指数为基准,计算2016年各社区的进步指数。繁琐计算后的成果“令人欣慰”,34个社区(2015年JX社区未参与民调)中,进步的有18个。进步指数的计算方法也在民意调查报告中明确列出并说明计算原由,以备查验。21

3. 指标计算的技巧之二:计算依据的素材

按照民调设计,每个指标都由相应的若干问题生成,不应更改。然而,关于“TXJY指数”,S副主任产生了质疑,PX社区排名远低于期望值,他认为这不应发生。经过重新计算和排查错误后,结果依然如此。在成果说明会上思考良久,S副主任才说明原委并建议:“我看啊,我们也不能迷信统计方法。情况是这样的啊,本来呢,这个流动冰箱(分享冰箱)也是街道TXJY主推的,放到了PX,让他们管理。现在把PX搞这么低,(该社区的)C书记要说话的。这样吧,看看能不能想想办法。当然了,科学方法是不能违背的,这是前提啊。”22会议讨论的初步想法是在这一指标上单独给该社区加奖励分,但因为不“科学”而被舍弃。最后,经反复磋商,“TXJY指数”被更改为“TXJY自治指数”,其包含的题目除TXJY版块外,还增加了与之“相关”的自治共治版块的部分题目。PX社区的排名因此大幅提升,进入了优秀的行列。

4. 指标计算的技巧之三:档次划分的考虑

在指标和排名计算好之后,要将各社区区分档次。然而,到底分几档、按什么标准分档,得视情况而定。各社区在各个指标中被分为非常优秀、比较优秀、一般、较差四档,词语逻辑对应的“非常差”则缺失。由于指数的计算方法是以基准社区为基数,即某社区分数除以所有社区分数的中位数,这意味着每个指数都有17个社区的得分在100以上,17个社区的得分在100以下,剩下1个得分为100的中位数社区。街道设置的分档原则是:指数得分为100及以上的社区归为“非常优秀”和“比较优秀”两类,后两个档次是指数得分为100以下的社区;除首尾外,每个档次划分的区间是均等的,如以10为区间。然而,设置档次的玄机在于,划分区间的标准各不相同,以5、10、15为区间的情况都存在。原因也很简单,各个指数的社区分布情况存在明显差异,不能采用统一的分档方法。在此作用下,档次划分呈现如下规律(见表 5):中间两个档次比首尾两个档次的社区数量要多(党建资源指数除外);“非常优秀”比“较差”的社区数量要多(基层民主参与指数和配合职能科办指数除外)。社区在各个指标上的档次直接表现在由各个指标组成的民调地图上,以形成可视化的成果。在街道各社区的行政地图上,代表中等水平的“比较优秀”和“一般”的社区指数分别被涂成橙色和蓝色,代表极端水平的“非常优秀”和“较差”的社区指数分别被涂成红色和绿色。在每个社区的行政地图上,红和绿总是少数,且红色大都比绿色多。

表 5 各指数档次划分的分布情况
(四) 居民的声音和失语

在上述分析中,居民一直处于失语状态——街道“需要”一定数量的居民填答问卷,居委会“需要”组织这些居民。对居民来说,在什么环境下填答问卷、回答哪些问题、有哪些选项可供选择等都是给定的。那么,居民是否无法摆脱这些约束?事实并非全然如此。问卷的最后一部分是开放性问题,分为“社区亮点”和“社区问题”两项。虽然很多居民没有填写这两项主观题,但是填答“社区亮点”的样本有899个,占全部样本的比例为50.71%;填答“社区问题”的样本有556个,占比为31.36%。从现场调研和个人特征数据来看,受访者以退休的老年人居多,不少居民阅读和填答问卷的速度较慢,逐字写下主观题答案的时间成本更高。居民填答该类问题的热情在回答的质量上也有所体现。据笔者粗略估计,使用长句回答主观题的样本大致有4成。长句涉及的往往是具体问题,如“无耻开发商占用业主共同的车库,停车费居高不下。更可恶的是,我们伸张正义,维护权利,被他们叫来的警察抓走好几个。仗势欺人,没有法律和公正!”23这一问题的背景是XH社区的业主抗争发展到上街举条幅、堵路,轰动一时。

街道对主观题的处理方式有两种:一是写入民调报告,使用关键词词频统计原则,如上述答案会被归为“物业管理”项并统计频次;二是写入下发到各社区的《社区诊断书》,在这里则使用信息量更大的短句陈述,如“发生业主堵路事件,值得关切”。诚然,民调的操作方式是不断缩减信息后的可计量化,在统计时社会情境必定会被压缩为关键词。然而,如前所述,确定维度、压缩并定义情境的方向远不止一种,该案例的关键词也可以是开发商仗势欺人(车库涨价)、居民枉法(堵路)、社会治安危机和社会抗争事件(抓人)。对街道来说,前述几个关键词写入民调报告都是不妥当的,前两项用语不当,后两项则是街道和该社区工作失职,自示其短。同样被划归为“物业管理”的还有诸如“小区1号门保安经常刁难人”等居民反馈的问题,使用“物业管理”一词后,不仅使该案例背后的社会情境难寻踪迹,问题的严重性也被淡化了。街道按照自己的标准将长句压缩成短句并归类为关键词后,原本可在一定程度上反映居民异质信息的主观题被裁剪和打磨得难以辨认。如此处理的原因何在呢?对此,街道民调小组比较年长的W老师24说:“XH的情况我是晓得的,当时闹得还蛮大。又是新小区,居委会刚进去不久,你晓得吧。发生这个事,不说他们,我们(街道)也没有权力去管。”25制止并处理业主抗争事件的权力并不在居委会,街道工作人员认为XH社区居委会不应负主要责任。

还有一个指标能间接表明居民态度,即空题率。这可以被视为“弱者的武器”。空题即拒绝答题,其影响因素有很多,如看不懂或没耐心看题干、不满题目的问法、不满选项的设置甚至干脆不想配合民调,等等。那么,哪些社区的居民更容易产生上述态度呢?2016年的民调问卷有44道题,计算每个社区的人均空题率可知,空题比例最高的是SD社区,为20.50%,最低的YFC社区为4.15%,相差近5倍,且各社区标准差为4.32%。假设各社区居民样本均质且答题环境标准化,人均空题率至少反映两种可能性:居民对街道组织的民意调查不满或对社区在该方面的表现不满。街道在空题率的基础上建构问卷质量指数,对此的解释是——“作为居民的一种软态度,即用看不见的行动表明的态度,侧面反映了对各居民区‘两委’班子的满意程度,与自下而上的民调原则暗合”。26问卷质量指数和排名是2016年新设立的,各社区还来不及重视。可预期的结果是,提升该指标的成本并不高,居委会既然能够精准控制参与民调的人数,只要稍加嘱咐就能达到很低的空题率。因此,作为能够客观反映居民态度的“硬数据”(hard data),其未来的含金量如何,仍是个问号。

五、小结与讨论

从资金、人员和持续时间来看,C街道的民调在三年内越做越大,调查过程也越来越科学,志在“做成区里的一个品牌”27。示范效应也是惊人的,早在2016年初民调项目得到市委领导表扬之前,区里的其他街道就敏锐地意识到这种模式的优势,并前来向技术人员咨询。而复杂民意的命运又是如何呢?我们无法说清。从情境筛选、问题定义到问卷生成,从选项设定、抽样实施到指标体系建立,是信息一步步丢失的过程。信息如何丢失取决于权力运行的空间。在此过程中,各级权力主动或被动地设置自己的规则,却以“事事有理由、步步讲科学”为宗。在科学外衣的掩盖下,权力的痕迹难寻。最终,富含信息的社会情境消失了,变成了可视化的指标和民调地图。经过居委会、街道在各个环节上的加工,民调反映出的民意对他们来说再熟悉不过了。围绕着民调过程,街道、居委会和居民三者之间的结构变得更加牢固。社区二元化、业主抗争、国家意志对社区日常生活的渗透以及中产阶级的政治冷漠等本就存在的问题,也许还会继续存在。不同的是,街道在某些方面获得了合法性。三年甚至可能持续更多年的社区民意调查是街道实实在在的社会治理创新项目,民调的成果将作为职能科办年终评估各社区的参考资料,成为决定社区干部评优、确定编制甚至去留的标准,甚至有可能作为街道决策的参考。对居委会而言,一张以本社区居民的名义开具的《社区诊断书》从街道下发,为以后的工作确定了方向。政策合法性、官员政绩、官僚机器运转的参数、社区的工作方向等都是民意调查为基层治理各主体带来的好处。唯一用不到民调数据的反而是居民。他们的声音是构成民意脸谱的拼图,深陷在脸谱的结构之中,被其塑形,最终构成脸谱的表情。

那么,民调造假了吗?以笔者的全程跟踪观察来看,并没有。然而,民调原本是一个统计学过程,如何变成了权力入侵的政治过程?在统计学原理和民调方法论的双重保障下,民意为何还能被制造?上述问题让我们回到最初的疑惑——技术治理能够完成其使命吗?如果民意调查技术依然不够严谨,那么大数据治理(张海波,2017)行不行?智慧政府治理(胡税根、王汇宇,2017)行不行?复杂系统范式的治理(范如国,2015)行不行?28从我们对民意调查全过程的剖析来看,问题的关键似乎并不在于技术的发展水平和严谨程度,而是技术治理的逻辑。当民调技术将“潜在”的复杂民意转变为“实在”的民意数据和指标时,民意被一步步化简、压缩。在此过程中,再严格的技术都只能保证化简的程序“合法”,而化简的方向则由操作者决定。

理论上,调查可以朝着任何一个方向去压缩民意,直至形成一个数据。同样是反映民意,研究者调查出来的是民意,难道政府调查的就不是民意了吗?又或者,民意不是实体而是建构物,根本没有它应该有的状态。不同的民调目标促使不同的操作者如社会科学研究者、媒体或政府选择其各自感兴趣的议题;不同的视角、经费或人手等方面的考虑促使他们选择不同的调查和抽样方式。上述这些因素都不是民调技术所能规定的,却把民调引向不同的化简方向,得到截然不同的民意。同理,政务微信/微博技术解决不了页面新闻或推送千篇一律的问题,网格化治理技术解决不了网格员拍照上报容易解决的事务的问题,舆情监测平台无法实现对事件识别、分类和定性的现实考量,正如清代严密的征税技术规避不了衙役、书吏、长随对百姓的轮番勒索。技术并没有被扭曲,只是技术对操作者的意志无能为力。

行文至此,技术治理的悖论逐渐清晰。正因为技术的使命是通过化简可能性的方式把事物引出来,它必然为操作者预留了指引化简方向的权力。正因为治理意味着主体对客体的“照料”和“指引”,国家“照料”社会的过程,29是把社会朝着特定方向化简并引出来的过程。国家通过技术治理打量社会的同时,也在制造其眼中的社会,它必然会把自己的基因植入其中。因此,技术治理的悖论是:国家通过技术之眼观察社会图像时,它看到的可能是自己的倒影。治理决定打量的方向,技术决定打量的过程。技术治理以特定视角去看待社会,在社会的成像方向被限定的同时,国家的可能性也被限定了。30在地方政府为了制度创新和治理创新而竞争之时,在我们承认技术在化简社会复杂性上的优势并追求更好的技术之时,福柯(2001)的忠告或许并非不合时宜:

我们不能把话语融入一套预先存在的意义之中,不可幻想世界给我们一张清晰的面孔,而我们所需做的只是破解辨认而已;世界不是我们知识的同谋。

1.技术治理的素材广泛分布在日新月异的治理实践中,形态各异,我们无法对此进行有效抽样或掌握大量样本。取材极端案例的研究方法来源于关键案例法(crucial case study),其介绍可见相关研究(Gerring,2007)。它的基本原理来自贝叶斯条件,即设置极端条件,如“假设在最可能发生某事(most likely case)的情况下却无法发生,则理论命题被证伪”。原命题为“技术治理的目的是把社会清晰地呈现到国家面前”。那么,保证技术的严谨性(技术治理的合法性来源),如果这都不能清晰成像,则论文命题可大概率被证伪。本文以基层政府的民意调查作为极端案例,其技术特点与其他技术治理实践有所区别。一是方法论的严谨性和成熟度。在统计学的支撑下,民调有固定格式和标准可以(且必须)遵守,是为其严谨性。成熟度则表现在民调的各个程序之间可相互提供技术支撑,由此衔接在一起,如问卷的信度和效度体现在问卷设计时议题的选择上,但能够在数据采集后再次提供检验。其他治理技术如网格化治理、精准扶贫等,政府对程式和标准的设计有较大的自由度。二是程序的独立性。问卷设计、抽样、问卷填答、数据加工等阶段都可在名义上独立于政府之外,变成一个纯技术的过程,甚至外包给第三方。其他治理实践如流动人口管理、社会综治等则难以做到。

2. “潜在”“实在”“复杂性化简”等命题构成众多思想家的思考基础。胡塞尔认为,对象正是在实显性和潜在性中作为意义统一而构造其自身,“对实显目光朝向的可能性被包含在这种情境和其潜在性的本质之中”(胡塞尔,2015:316);齐美尔认为,“我们的行动是一座桥,它使目的的内容从心理形式到现实的形式之间的转换成为可能”(Simmel,2004:206);卢曼指出,权力如同爱、货币和真理的交往媒介,是权力持有者强制的化简方式(化简为合法/不合法的二值逻辑),给予行动者共同期望,从而克服帕森斯所言的双重偶然性(卢曼,2005:4-20);福柯指出,博物学、语言学是利用不断发展的分类学、线性数学、动态分析等技术对动植物分门别类、为语言/言语建立结构/动态关系,即以人为中心对世界化简、为世界建立范畴(福柯,2016);德勒兹和加塔利认为,“我们已经遇到了两条轴,即意义之轴和主体化之轴。意义的展开必须借助一面白色的墙壁,它得以在其上书写它的符号及其冗余。主体化的进行则必须借助一个黑洞,它将其意识、激情及其冗余都安置于其中。二者构成一张面孔:白墙—黑洞的系统”(德勒兹、加塔利,2010:231)。最新的例证还有复杂系统的概念涌现、分形等概念。

3.情境蕴含的要素几乎具备了构成“人—结构—行动”的所有部件:情境有人经历、人在情境中的行动折射出社会结构、结构化的情境呈现人们的存在并分配其得失。如韦伯举的骑自行车相撞的例子,“两个骑自行车的人相撞,完全可以比作一个自然事件。但是,如果他们试图避免碰撞,或在相撞之后谩骂、殴打或友好协商,这就是社会行动”(韦伯,2010:112)。社会科学中讨论情境的有传播学的框架分析和社会心理学的情境心理分析等视角,前者肇自戈夫曼的经典著作《框架分析》,重在分析构成社会情境的各个要件,它们(多被媒体建构)的不同组合塑造着人们的认知框架(潘忠党,2006);后者沿着心理学路径将情境分解为影响人们决策的环境因素(Argyle, et al., 1981:35-57)。在记录与哈贝马斯论争的《社会理论还是社会技术学?》中,卢曼于《复杂性民主》一文中提出自己独特的情境政治观念——“政治必须在一个具体的情境下为自己创造合法性,从形成共识的机遇和追求的结果来看,这个情境是开放的,结构也处于不确定状态……政治系统通过结构选择来确定自己的身份”(Luhmann,1971:317,转引自哈贝马斯,2009:143-144)。

4.事实上,作为一个项目,整个民意调查还包括事前申请财政拨款、项目设计和事后项目总结等阶段。本文在此仅讨论民意调查的实施阶段。

5.2015年9月17日,民调动员会记录。

6. 2016年9月28日,民调可行性分析会记录。

7. 2016年9月28日,民调项目开题会记录。

8. 2015年9月17日,民调动员会记录。

9. 2015年12月11日,SB社区居民座谈会记录。

10.据统计,C街道各居委会常规在岗人员平均数为6.86,标准差为1.36。JX社区为4人。

11.2016年12月3日,对JX社区书记的访问记录。

12.主流媒体在有关此次民调的报道中也用了类似考试的语汇——“下考上”,即让居民“考考”居委会干部。

13. 2016年11月19日,与S副主任私人谈话记录。

14.从现场问卷填写情况来看,街道和社区居委会都特别重视民调的“正式”性。整个民调流程酷似“两会”的浓缩版,有强烈的仪式感。街道规定各社区书记要在民调前向所有居民代表作年终述职报告。居民填写问卷完毕后,一一上前,将问卷放入投票箱内,工作人员会择优拍照。

15.2016年11月22日,TJD社区,与某居民私人谈话记录。

16. 2015年11月23日,在HD社区民调现场的谈话。

17.2016年12月5日,在ZYY社区民调现场的谈话。