文章快速检索     高级检索
  社会工作与管理  2024, Vol. 24Issue (6): 68-80.
0

引用本文 

张雪峰, 洪勇. “问题诉求—方案回应”中的知识发现与知识服务——以湖北省“东湖社区”网络问政平台为例[J]. 社会工作与管理, 2024, 24(6): 68-80.
ZHANG Xuefeng, HONG Yong. Knowledge Mining and Service in “Problem Appeals-Solution Responses”: A Case Study of the East Lake Community of Hubei Province[J]. Social Work and Management, 2024, 24(6): 68-80.

基金课题

安徽省哲学社会科学规划青年项目“公众参与地方政府社会治理创新众包的驱动机理、效果评估与提升对策研究”(AHSKQ2022D064)。

作者简介

张雪峰(1987— ),男,汉族,副教授,博士;主要研究方向:创新管理,知识管理.

文章历史

收稿日期:2023-12-13
“问题诉求—方案回应”中的知识发现与知识服务——以湖北省“东湖社区”网络问政平台为例
张雪峰 , 洪勇     
安徽工程大学经济与管理学院,安徽 芜湖,241000
摘要: 公众在网络问政平台上提出社会治理的问题诉求,政府给出相应的方案回应,形成“问题诉求—方案回应”对。文章以网络问政平台“东湖社区”上2 426条“问题诉求—方案回应”对的文本数据为对象,采用分词和聚类技术、共现网络分析等方法,发现数据中蕴含的知识:确定了公众的问题诉求重点,并划分为不同的类别,主要涵盖市政建设、发展民生、社会治安、拆迁征地、道路修缮、交通安全、环境保护等类别;明确具体问题诉求及其所属类别之间的相互联系;类似的问题诉求在不同的时间内会重复提出。文章提出知识服务建议,即针对某一新的问题诉求,根据相似度大小推荐已有问题诉求对应的方案回应来解决该问题。
关键词: 网络问政平台    公众诉求    方案回应    知识    文本挖掘方法    
Knowledge Mining and Service in “Problem Appeals-Solution Responses”: A Case Study of the East Lake Community of Hubei Province
ZHANG Xuefeng , HONG Yong     
School of Economics and Management, Anhui Polytechnic University, Wuhu, Anhui, 241000, China
Abstract: This study investigages the issues and appeals raised by the public on online government platforms, and the corresponding responses from government officials, creating “issue/appeal-solution” pairs. A total of 2,426 pairs of “issue/appeal-solution” were collected from the East Lake Community of Hubei province, a typical and popular online governance platform. Analysis is conducted with word segmentation, clustering, and co-occurrence network analysis techniques. The study identified the key issues and appeals raised by the public, categorizing them into urban construction, development of the people’s well-being, public security, demolition and land expropriation, road repair, traffic safety, and environment protection. We further present knowledge about the interrelationships among public’s issues and appeals. Similar issues and appeals appear repeatedly. The study proposes a knowledge service based on “issue/appeals-solution responses” pairs, recommending a settled response pattern for similar issues and appeals.
Key words: online governance platform    public’s appeals    solution responses    knowledge    text mining method    

基于互联网的问政平台是公众便捷和有效参与地方政府社会治理的重要渠道和载体。[1-2]这些平台的核心功能在于允许公众主动提供其发现的社会治理问题或现象,如停车不规范、环境和安全问题等,并期望地方政府相关部门予以解决,可称之为“问题诉求”。针对每个问题诉求,政府部门通过平台直接提供相应的解决方案(包括方法、责任单位、时间、路径等)作为回应,可称之为“方案回应”。随着时间的推移,平台上通常会积累许多问题诉求,而一个问题诉求对应一个或多个方案回应,由此形成大量的“问题诉求—方案回应”对。这些“问题诉求—方案回应”对包含了重要数据和信息。第一,当前地方政府辖区内一个个具体的社会治理问题。第二,公众的关切,因为每个问题诉求都对应一个公众及其需求。第三,地方政府提出的用以回应公众问题诉求的解决方案。第四,围绕问题诉求和方案回应的提出、讨论和评价,体现了公众与地方政府的互动。上述“问题诉求—方案回应”对的数据和信息蕴含于文本之中,并非显而易见且具有碎片化特点[3],需要对其进行有效组织和挖掘,从而发现其中服务于公众、地方政府和社会的有价值知识。例如,通过分析某一时间段的问题诉求,可以发现当前公众关切和突出的社会治理问题;分析比较不同时间段的问题诉求,可以发现公众关切和社会治理问题的变化与演变。这些将有助于地方政府进一步厘清和掌握社会治理的重点与难点,为其制定具有针对性的社会治理政策和制度提供决策依据。

在知识发现的基础上,可以提供相关的知识服务。[4-5]例如,对于一个新的问题诉求,有可能在过去存在相同或类似的问题诉求及对应的方案回应。这些已有方案回应能为新的问题诉求的回应和解决提供参考,而不需要从零开始分析和提出方案回应。这将大幅提升已有“问题诉求—方案回应”对的利用效率,更重要的是提高地方政府方案回应的效率,进而提高公众满意度。[6-9]因此,本文中的知识服务具体是指利用“问题诉求—方案回应”中的知识为地方政府处理公众问题诉求推荐方案回应。

关于网络问政平台上问题诉求和方案回应的研究已有较为丰富的成果,然而将问题诉求和方案回应结合起来作为一个整体的研究还相对较少。因为实际平台上的问题诉求和方案回应又是以成对的形式存在,故不应割裂开来单独研究。同时,当前研究重点集中在公众问题诉求的类型划分、政府回应的类型、作用、影响因素及其作用机理方面,对“问题诉求—方案回应”对所蕴藏知识的发现和服务研究相对较少。为此,本文拟以湖北省网络问政平台“东湖社区”为例,以平台上的“问题诉求—方案回应”信息作为研究对象,采用文本挖掘技术和方法分析“问题诉求—方案回应”对的文本数据,发现地方政府社会治理问题和公众诉求及其相互关系,并计算已解决和待解决的公众问题诉求相似度。基于此,为待解决的公众问题诉求提供方案回应推荐的知识服务。本文期望通过提供一个新视角来探究网络问政平台上的公众问题诉求和政府方案回应,扩展该领域研究采用的方法和理论研究成果;为政府进一步深入理解公众的诉求和关切提供支持,帮助政府提升解决公众问题诉求的效率。

一、文献回顾

(一) 网络问政平台上公众问题诉求研究

学者们对网络问政平台包括市长邮箱、市民服务热线、领导留言板等及其所包含的问题诉求进行了卓有成效的研究。

1. 公众通过平台反映问题诉求的现状

近年来,公众通过网络表达政治和社会治理诉求的规模不断增长。[10] 孙宗锋和赵兴华分析网络情境下青岛市市长信箱中的公众诉求信件后发现,公众提出的诉求在不同月份有较大的波动。诉求信件中的积极情感和消极情感的比例相对平衡,并且波动较小。[11]刘西平等的研究发现,公众通过不同渠道提交诉求的积极性有差异,如相较于非政府网络渠道,公众对政府网络渠道参与问政的使用效率更高且期望值更高。[12]然而,在线上表达的公众诉求可能受到线下社会管理方式的限制。[13]此外,大部分公众参与的问题诉求是出于个人利益,呈现被动态势,参与水平较低。[14]

2. 公众问题诉求的类型

学者们对不同网络问政渠道包括政府热线、地方政府留言板、地方政府网络问政平台上公众诉求类型进行分析,发现公众诉求覆盖面广,涉及多个领域。例如,赵金旭等总结划分了北京市12345政务热线的市民诉求类型,主要包括基础民生、基本民生、发展民生、优质民生等四类。[15] 史亚东和阮世珂分析北京市网络问政平台数据后发现,公众对环境问题的诉求总体上升。[16]李锋的研究总结了全国网络问政平台的公众诉求,发现其主要涉及城乡建设、劳动和社会保障、经济管理、农村农业和教育问题,较少涉及历史遗留问题、党务政务以及科技与信息产业等议题。[17] 曹艳辉总结了“问政湖南”上公众诉求领域,主要聚焦于业主维权和三农问题等民生议题。[18] 孟天广和李锋分析了网络问政平台上的公民与政府行为记录,发现公众关注的议题主要集中在经济发展、民生福利、国土建设、农村以及贪腐治理等方面。[10]此外,雷玉琼和刘展余分析发现公众在疫情期间主要关注交通出行、基层自治、物质保障和政府管理等问题。[19]

3. 公众问题诉求主题识别方法

滕婕等通过构建动态语义依赖关系网,利用社区发现算法识别每一区间中语义依赖网的子社区,并通过PageRank算法识别每一子社区的主题标签,以高效准确地识别社会诉求主题。[20]杨洋洋采用隐含狄利克雷分布主题模型,构建动态主题演化模型,挖掘社交媒体上突发事件的话题类型,并归纳出舆情危机的构成要素。[21]胡广伟等应用LDA建模方法提取文本主题,构建公众诉求热点分类表,挖掘领导信箱文本主题,更好地感知、回应公众诉求。[22]滕婕等采用了一套基于语义网的高价值主题识别和演化路径分析方法来研究如何高效、准确地识别社会诉求主题,把握社会诉求转变节点,进而为政务服务和社会治理的和谐有序发展提供支撑。[23]

(二) 网络问政平台上政府回应研究

相比于对公众诉求的研究,学者们对政府回应的研究更多,主要包括如下方面。

1. 政府采用的回应形式

不同学者对政府回应形式的划分不同,例如,常多粉和孟天广通过分析领导留言板上的环保诉求和政府回应数据,发现政府回应话语可分为描述、共情、规则和混合四种模式。[24]翁士洪和顾丽梅根据案例分析,提出了鸵鸟、杜鹃、蜂王和鸳鸯等四种网络参与政府决策回应模式。[25]颜海娜和谢巧燕认为政府回应话语的策略性表现在回应方式、回应内容和回应态度上。[26]沈国麟和戴雯斌基于案例分析认为,中国政府网络回应机制包括响应机制、协同机制和督查机制,共同构成中国特色的政府回应机制。[27]政府回应形式的采用受政府层级(高层级和低层级)和政府机构类型(党委办、信访、业务部门等)[24]、公众诉求的类型[28]、公众诉求表达的准确性[29]、提交诉求的公众个人信息完整性[26]等方面的影响。

2. 政府回应的影响因素和作用机理

影响政府回应的因素主要包括时空因素、议题归属和诉求表达方式[10, 30-31]、议题特征[32]、协同惰性和问责压力[33]、领导重视[34]、媒体热度[35]以及回应信息不完备和对待回应存在认识分歧[36]等。周恩毅和张文培发现当公众诉求为热点议题时,政府回应效度较高。[30]曾润喜和黄若怡发现,政府回应在不同层级间存在显著差异,高层级政府的回应状况相对不足。[31]此外,不同议题下各层级政府的回应程度存在“选择性回应”现象。杨良伟发现,协同惰性是地方政府回应过程中的内在阻碍。然而,问责压力能够促使地方政府积极做出回应,并在协调多部门达成共识方面发挥积极作用。这有助于调节协同惰性对地方政府回应的不利影响。[33] 段哲哲和刘江通过实验和问卷调查发现,高媒体关注度与网络问政回应绩效正相关。热门议题相比非热门议题具有更好的网络问政回应表现。[35]此外,诉求种类和文本长度也显著影响回应绩效。舆论在政府与公民交流中起关键作用,对回应绩效产生影响。邵梓捷和杨良伟指出,地方政府回应不足的根本问题是由于回应的触发时机与回应的实施时机不一致,导致回应过程呈现出来回摆动的情况。[37]

3. 政府回应对公众持续参与政府社会治理意愿的影响

政府回应的及时性和针对性对公众持续参与政府社会治理有积极影响,但该影响会受到不同的回应话语、回应部门、回应质量等影响。例如,常多粉和郑伟海发现,统管部门参与回应率显著促进公众参与,而省、市政府参与回应率显著抑制公众参与。共情话语使用率显著促进公众参与,而规则话语使用率无显著影响。回应时长越短,公众参与活跃度越高。[38]宋向嵘认为,提升政府线上回应质量有助于提升公众持续参与度和问政效果。[39]王磊和易扬针对公共卫生危机中的数字政府回应,发现数字政府回应可以显著降低公众负面情绪,网络问政平台可以缓解网络负面舆情。[40]韩万渠认为,政民互动平台赋予公众充分赋权程度直接影响参与互动水平。[1]同时,平台参与议题与公众诉求的匹配程度也直接影响参与获得感。因此,为了增强政民互动平台的公众参与效果,应加强平台赋权制度建设,并建立协商议题设置机制。

4. 政府回应优化的建议

建议主要包括回应需要根据公众的情感反应和需求动态调整[41]、精准识别公众诉求和问题[42]、明确不同部门之间的分工、加强协同机制[33]、建立公众对政府回应的评价机制[33]、规范公众参与[25]、构建回应信息协同网络[43]、推动网络规范发展并改进回应诉求机制[44]、加强平台赋权制度建设[1]等。

(三) 知识发现和知识服务研究

当前,知识发现和知识服务方面的研究大多集中于在线健康领域,对于社会治理中的知识发现和服务的研究还相对较少。例如,马海云和杨欣谊探讨了智慧健康知识管理和知识服务存在的问题,在此基础上,建议通过各方协作化解智慧健康领域知识服务各方资源之间的隔阂。[45] 王昕宇和李阳通过构建应急救护知识服务平台为用户提供权威、多样的救护知识资源,保证知识服务的个性化和精准化。[46]杨善林等运用CBR的方法来对医疗知识进行利用,提高了医疗健康知识服务的准确性和有效性。[47]马费成和周利琴构建了知识服务框架促进知识融合。[48]林海伦等从企业角度出发,基于用户需求来推动企业知识服务的智能化和个性化。[49]赵志耘等、李贺等构建了知识服务平台,以更好地对散落在互联网中的知识进行发现和服务。[50-51] 吴菊华等、程为和郑德俊分别运用基于加权知识网络和多模态的方法,帮助用户在社区中提出问题时,能够快速、准确地发现相关知识。[352] 李泽中等采用概念层和本体层的知识融合技术,构建多源知识融合的企业知识服务模型,提高了企业知识服务水平。[4]

二、数据来源与研究方法

本文针对问政平台上的“问题诉求—方案回应”对,采集文本数据,利用文本挖掘和分析方法,包括结巴分词、共现网络、基于余弦相似度的文本相似度计算等,分析公众提出的问题诉求及其关系,为待解决问题诉求推荐方案回应。

(一) 数据来源

为保障收集数据的可靠性和研究成果的可推广性,本文基于以下考虑选取研究样本:第一,选取的问政平台具有典型性和代表性,具备一定的社会影响力,而且有官方机构入驻管理;第二,平台上积累了较多“问题诉求—方案回应”对,能保障样本数据量;第三,平台上的数据可以采用网络爬虫等技术获取。基于上述筛选条件,本文选择湖北省荆楚网“东湖社区”网络问政平台上的“问题诉求—方案回应”信息作为研究对象(网址为https://bbs.cnhubei.com)。

笔者通过查询主页了解到,荆楚网由中共湖北省委宣传部、湖北省人民政府新闻办公室主管,是经国务院新闻办公室批准的湖北省唯一的重点新闻网站,已获取互联网信息服务(ICP)经营许可证、广播电视节目经营制作许可证,并拥有互联网出版等资质。自2004年开办以来,荆楚网相继获评“中国新闻网站十强”、“中国报社网站十强”和“最受欢迎的党报党刊网站”。2013年,荆楚网跻身全国省级重点新闻网站前列,成为湖北省最大的外宣工作平台。“东湖社区”是荆楚网重点打造的网络舆论主阵地,曾获“2009年度中国互联网品牌栏目(频道)”称号和2010年度湖北新闻奖新闻专栏类一等奖。“东湖社区”是湖北省内最大的综合性网络互动平台,截至2023年底注册用户过百万,专注于社区居民问政、民生诉求解决,致力于为公众与政府之间提供一个便捷、高效的沟通与互动渠道。公众能够通过该平台直接向政府反映问题、提出建议和意见。

2024年1月,笔者利用自主编写的爬虫程序,采集了“东湖社区”网络问政平台“民生热线”板块2020—2023年的全部发帖及回应数据,共计2 426条。这些数据包含公众日常生活中提出的问题诉求和政府的方案回应,每一条数据对应一个问题诉求及其方案回应,示例如下。

公众问题诉求:咨询一下,硚口区江景时代纳入征收计划没有?一会说纳入了,一会又说没有纳入。

方案回应:您的诉求已收悉,现将有关情况回告如下。硚口区江景时代小区已列入2022年城市更新及房屋征收计划(拆除更新类——旧城旧厂),具体启动改造时间需结合资金、房源等综合因素。项目如有进展,相关信息将会在房屋征收范围内予以公布,请您关注。

根据公众问题诉求是否得到方案回应,按照平台上的标注将采集的数据划分为两类,分别是已解决问题诉求及其对应的方案回应、待解决问题诉求(该类问题诉求尚未得到政府的方案回应)。在2426条数据中,有1359条(56.02%)为已解决的问题诉求及其对应的方案回应,剩余1067条(43.98%)为待解决问题诉求。

(二) 研究方法

针对以中文表述的“问题诉求—方案回应”对的文本数据,本文主要采用文本挖掘和分析方法对其进行处理,具体方法和过程如下。

1. 文本分词处理

这一步是将文本数据转化为更加清晰、有效的信息,为后续分析奠定坚实基础。本文采用python开源分词组件的结巴分词,去除文本中多余的空白符和换行符,过滤文本当中已回复、已转交以及数字、标点符号等无意义字符信息后[53],对文本进行分词,去除停顿词。结巴分词是一种适合中文分词的方法,且被较为广泛地使用[54-55],其原理是基于统计词典对输入句子进行切分,得到所有的切分可能,最终输出最大切分组合。[56]例如,针对某一公众问题诉求“[已回复]东西湖区公交H89,H86,H78可以不可以新增车次?”,经过预处理过后的结果为“东西湖区/公交/可以/不/可以/新增/车次”。

2. 聚类分析公众问题诉求并构建共现网络

这一步是计算分词后文本中不同单词同时出现的频率,并采用KHcoder3绘制公众问题诉求文本的共现网络。KHcoder3是一种文本数据分析软件,可以用于选择单词、计算单词频率、生成词汇网络[57]、语义分析和语义聚类[58]等。本文的公众问题诉求共现网络中每个节点代表分词后的单词,节点之间边的粗细代表单词共同出现的频率大小,越粗代表两个节点单词在文本中同时出现的频率越多。在共现网络中使用聚类分析将网络中具有密集连接的节点聚集成一类,同类中节点共同出现的概率比与其他节点共同出现的概率要高。通过该方法可以将共现网络分成不同类别,同一个类别内部连接紧密,而不同类别之间的连接相对较少。通过共现网络可以展现公众当前关注的问题诉求重点以及这些重点之间的联系。

公众问题诉求数据分为已解决问题诉求和待解决问题诉求,通过上述方法将得到两个共现网络,分别是已解决问题诉求共现网络和待解决问题诉求共现网络。

3. 计算已解决问题诉求和待解决问题诉求共现网络中节点之间的相似度

这一步是计算分析两者之间的相似度,据此可以更加清晰地判断已解决问题诉求和待解决问题诉求之间的关系,从而为利用已解决问题诉求对应的方案回应来处理待解决问题诉求提供支持。为了更好地呈现两者之间的关系,本文利用Gephi软件设计两者的双层共现网络。

4. 为待解决问题诉求推荐方案回应

由于第三步分析是节点之间的关系,而节点代表的是一类问题诉求,双层共现网络中两个节点之间有相似性,则可以认定这两个节点所代表的两类问题诉求是相似的,进一步可以认为对于待解决问题诉求,能从已解决问题诉求中找到相似的问题诉求以及相对应的方案回应。为了给待解决问题诉求推荐方案回应,本文采用基于余弦相似度的文本相似度计算方法,先计算待解决问题诉求与已解决问题诉求共现网络节点的相似度,再计算待解决问题诉求与节点中包含的具体已解决问题诉求之间的相似度,以便为待解决问题诉求寻找方案回应。这样的方法能够在大量文本数据中快速准确地找到相关联的内容,提高问题诉求解决的效率。

余弦相似度的基本思想是将两个向量看作空间中的点,然后计算它们之间的夹角余弦值。如果两个词语的向量夹角越小,则它们的相似程度越高;反之,如果夹角越大,则它们的相似程度越低。[59]余弦相似度的公式如下:

$ Similarity\left(A,B\right)=\frac{A\cdot B}{\left|\left|A\right|\right|*\left|\left|B\right|\right|}=\frac{\displaystyle \sum _{i=1}^{n}\left({A}_{i}*{B}_{i}\right)}{\sqrt{\displaystyle \sum _{i=1}^{n}{A}_{i}^{2}}*\sqrt{\displaystyle \sum _{i-1}^{n}{B}_{i}^{2}}} $

$ A $$ B $表示文本向量,即问题诉求文本。$ {A}_{i} $$ {B}_{i} $分别是$ A $$ B $的分向量。计算结果的取值范围是[0,1],其中1表示完全相关,0表示无关或不相关。

三、结果分析

(一) 问题诉求中的知识发现

通过对采集的公众问题诉求进行预处理分析,得到两个数据集,包括已解决问题诉求的12 790个单词和3 657种词数类型,待解决问题诉求的9 886个单词和3 293种词数类型。针对词数较多造成共现网络混乱而难以直观反映公众重点问题诉求的问题,本文在共现网络中仅显示词频数大于10次的词和关联度最高的前240条边。值得注意的是,共现网络中的某些节点可能同时适用于多个类别。已解决问题诉求的共现网络如图1所示。由上述分析可以发现以下主要知识。

图 1 已解决问题诉求的共现网络

(1)公众问题诉求的重点及其主要类别。按照每个类别所占比例大小,排序如下:市政建设、发展民生、社会治安、拆迁征地、道路修缮、交通安全、环境保护、业主维权、交通运输、龙盘、硚口、汉阳、其他。

已解决问题诉求共现网络包含181个节点和172条边。图中节点之间边的粗细代表单词共同出现的频率大小,越粗代表两个节点单词在文本中同时出现的频率越多。图1的右上方青色部分(市政建设)主要体现了公众关于市政建设方面存在的问题诉求,如拆迁房屋的交付、物业收费的设置、路灯和红绿灯损坏等造成的交通安全隐患等问题。公众关于升学、房产证办理、社区改造、施工噪音和油烟扰民等问题诉求都集中于中央网络的最左方蓝色部分(发展民生)。共现网络右下方的粉色部分(社会治安)体现了存在企业骗取费用和有人违规占用资源等问题。网络左下方的绿色部分(拆迁征地)包括是否、组、村、镇、拆迁、青山区、新、号、楼、计划、江汉区、洪山区、保利、堵塞、消防、通道等元素,是指江汉区和洪山区经常出现消防通道堵塞情况,以及询问青山区是否计划拆迁。

(2)在共现网络的核心部分,所有问题诉求类别中有4个是相互联系的,这表明公众提出的问题诉求之间存在相关性。另外,共现网络还揭示了围绕中央网络更多孤立的问题诉求类别,例如竹山县存在严重的道路破损情况(道路修缮)、硚口区(硚口)和汉阳区(汉阳)街道领域存在问题等。它们的孤立位置表明这些问题诉求都是相对独立的。

(3)已解决问题和待解决问题之间相互联系且存在相似性。对待解决问题诉求进行共现网络分析,结果如图2所示。

图 2 待解决问题诉求的共现网络

图2可知,待解决问题诉求一共分为8个类别,包含142个节点和140条边,各类别所占比例排序如下:市政建设、发展民生、基础民生、交通安全、道路修缮、业主维权、消防安全、企业事务。由待解决问题诉求共现网络可知,在近3年中,公众仍有很多问题诉求没有得到方案回应。而且除了企业事务之外,其余的7个类别相互联系。

进一步对图1图2进行对比分析可以发现,近3年中,公众问题诉求类型主要集中在市政建设、发展民生、社会治安、拆迁征地、道路修缮、交通安全、环境保护、业主维权、交通运输、龙盘、硚口、汉阳、其他、基础民生、消防安全、企业事务等方面。尽管政府已经解决了很多市政建设、发展民生、交通安全、道路修缮、业主维权等类别的问题诉求,但是在待解决问题诉求中,其仍然存在,表明这5类问题诉求是公众生活中关注的重点问题。

为更深入地观察和分析已解决问题诉求和待解决问题诉求之间的关系,本文计算两者共现网络中节点之间的余弦相似度,并以此为基础利用Gephi软件创建了双层共现网络,如图3所示。

图 3 已解决问题诉求和待解决问题诉求的双层共现网络

图3中的上层表示已解决问题诉求共现网络中的节点,下层展示待解决问题诉求共现网络中的节点。当不同共现网络中两个节点之间的余弦相似度大于0.5时,连接这两个节点。因此,图3中上、下两层共现网络之间的边表示已解决和待解决问题诉求节点之间存在的相似之处。由此可知,待解决问题诉求节点和已解决问题诉求节点之间存在多个相似之处,这表明公众反映的问题诉求在不同的时间点上存在一定的重复性。

(二) 基于“问题诉求—方案回应”对的知识服务

图3可知,部分待解决问题诉求与已解决问题诉求相似,而已解决问题诉求均有对应的方案回应,这就为待解决问题诉求推荐已有的方案回应提供可能。

1. 待解决问题诉求与已解决问题诉求相似度计算

基于余弦相似度的文本相似度计算是一种用于分析文本数据之间关系的方法。为了提高计算效率和推荐效果,本文首先计算待解决问题诉求文本和已解决问题诉求共现网络中节点之间的相似度。

以某一待解决问题诉求“武汉市洪山区珞南街道圆梦园社区99号小区门口违规修建变电柜”为例,利用R软件包计算该文本与已解决问题诉求共现网络中所有节点之间的相似度,计算结果如表1所示。

表 1 待解决问题诉求和已解决问题诉求共现网络节点相似度

根据计算结果,与待解决问题诉求文本存在相似度的节点共有10个,且相似度都为0.25。这意味着这些节点所对应的问题诉求类和输入的案例文本具有相似性。

然后,分别计算这10个节点所包含的问题诉求与待解决问题诉求之间的文本相似度,结果如表2所示。需要注意的是,首先,各个节点所包含的问题诉求均超过10条,本文只选取相似度最高的3条进行对比分析;其次,同一已解决问题诉求可能会隶属于不同的节点;最后,表中的问题诉求存在相同的编号,但是属于不同的节点,对应的具体问题诉求描述也可能不同。例如,“小区”节点下的第13个问题诉求,即“问题诉求_13”与“道路”节点下的第13个问题诉求所表示的具体问题诉求不一样。

表 2 待解决问题和已解决问题诉求的相似度

2. 方案回应推荐

通过检索发现,与待解决问题诉求中相似度最高的已解决问题诉求都是同一条文本,这验证了文本相似度计算的准确性。本文选择相似度最高的前3个问题诉求进一步分析。其中,相似度最高的前两个问题诉求分别为“武汉市洪山区珞南街道圆梦社区99号小区门口道路违规挖路”和“武汉市洪山区珞南街道圆梦园社区99号小区门口道路施工建院墙”;对应的方案回应均为“关于居民反映珞桂路99小区的隔壁家属院在三个小区的公共通道上修建围墙,占用了公共通道和消防通道问题。我街已责令执法中心致函武汉市自然资源与规划局洪山分局核实部队与99号小区的红线位置,待武汉市自然资源与规划局给出红线认定结果后,将依据《中华人民共和国城乡规划法》《武汉市城乡规划条例》等法律法规开展执法工作”。这说明同一个方案回应可以用于回应多个问题诉求。

相似度排序第三的问题诉求描述为“洪山区保利拉菲小区道路隐患”,其对应的方案回应为“日常工作中,我队已安排警力在楚安路不定时地巡控。5月24日早上,我队警力在巡控过程中,确实发现楚安路路面被压坏,我队已协调城管部门进行处理。经核实,5月26日由街道牵头,协同相关部门对通行楚安路的施工车辆行驶路线做了相应调整。5月28日上午,损坏路面已修复。同时我队也将加大楚安路巡控整治力度,一经发现有违法行驶车辆,将依法处理”。

对于待解决问题诉求“武汉市洪山区珞南街道圆梦园社区99号小区门口违规修建变电柜”,本文可以推荐“武汉市洪山区珞南街道圆梦社区99号小区门口道路违规挖路”和“武汉市洪山区珞南街道圆梦园社区99号小区门口道路施工建院墙”问题诉求对应的方案回应用于回应该待解决问题诉求。该方案回应给出了负责处理该问题诉求的单位(即武汉市自然资源与规划局)和处理依据(即《中华人民共和国城乡规划法》《武汉市城乡规划条例》)。这为方案回应形成提供了思路、可能的负责单位和依据的法律法规,提升了方案回应提出的效率。

在为待解决问题诉求推荐可行的已有方案回应的基础上,本文初步构建了基于“问题诉求—方案回应”对的知识服务原型系统,将所有已解决问题诉求和对应的方案回应以及发表时间都录入知识服务系统中,如图4所示。当政府遇到一个新问题诉求时,可以在搜索框中搜索该问题诉求。基于本文使用的方法,系统会计算新问题诉求和录入的已解决问题诉求之间的相似度,并从大到小推荐前5个最高相似度的已解决问题诉求和方案回应(当已解决问题诉求和方案回应少于5个时,列出所有的文本)。如果未找到和新问题诉求相似的已解决问题诉求,表明新问题诉求在之前从未出现过,需要从零开始重新制定方案回应,并将新问题诉求和方案回应纳入知识服务系统中,扩充已有的知识。

图 4 基于“问题诉求—方案回应”对的知识服务
四、结论与讨论

本文以“东湖社区”网络问政平台上的“问题诉求—方案回应”为研究对象,挖掘其中的知识发现与知识服务内容,揭示公众所关注的重点问题诉求,并为政府处理待解决问题诉求提供有价值的方案回应参考。

第一,公众的重点问题诉求涵盖市政建设、发展民生、社会治安、拆迁征地等16个类别。这与当前从领导留言板、市民服务热线、市长邮箱等途径收集的不同地区公众所关注的社会治理问题诉求有一定的相似性,主要包括基础民生、发展民生[15]、市政建设、社会治安、拆迁征地、环境保护、企业事务[10]、交通运输[17]、交通安全、业主维权[18]等领域。这说明虽然公众处于不同的地区,但其关注的社会治理问题类别差异不大,这能为不同地方政府分析社会治理问题和了解公众需求提供一定的参考和支持。与现有研究不同的是,本文通过对公众问题诉求文本分析并建立共现网络,发现大多数公众问题诉求类别并非孤立存在,而是相互关联紧密。例如,发展民生和市政建设与拆迁征地息息相关,交通安全与道路修缮和交通运输也有密切联系。因此,在对公众问题诉求的研究中,应该避免将问题诉求孤立看待,而要以综合和系统的视角分析问题诉求,这样不仅可以深入理解单个问题诉求,还能从更广泛的角度洞察问题诉求背后的共性与联系。在实践方面,地方政府可以定期关注问政平台上的问题诉求,及时了解公众关注的重点。同时,地方政府在制定方案回应时应综合考虑不同问题诉求之间的联系,以保证方案回应的系统性和有效性。

第二,公众的问题诉求在一定时间段内存在重复现象。公众的问题诉求并不是完全不同的,而是在一定时期内出现了重复。本文研究发现,尽管政府已经解决了许多问题诉求,但在待解决诉求中,仍然有部分与已解决问题诉求相似。这说明公众所关注的问题诉求重点具有连续性,不会随时间推移而发生重大变化,这将帮助地方政府进一步明确社会治理的难点和需要长期发力改善的领域,久久为功。此外,本文的研究结果显示,地方政府在一定程度上并未很好地利用已有的公众问题诉求,举一反三对其他地区存在的类似问题进行改善,从而造成类似的问题在不同地区反复提出。

第三,地方政府对公众问题诉求回应的及时性、针对性和有效性对解决问题诉求和提升公众满意度有重要影响。面对数量较多且同时提出的不同问题诉求,地方政府难以及时为每个问题诉求提出具有针对性的方案来进行回应,这可能造成回应延后和公众满意度降低。本文发现的公众问题诉求在不同时间段的相似性也为推荐回应方案提供了可能。对于新的问题诉求,可以找到相似的已解决问题诉求,进而推荐已有的方案回应用于处理待解决问题诉求,提高方案回应的制定效率。在实践中,政府可以建立知识服务系统,在有限的时间内为待解决问题诉求提供多个合适的方案回应,避免重复制定相似或相同的方案回应,从而加快问题诉求的解决进程,提高方案回应的针对性和有效性。同时,知识服务系统还可以减轻政府部门在制定方案回应时所承担的工作负担,并节省资源。

本文将公众问题诉求和政府方案回应视为一个整体,利用文本挖掘技术和方法发现“问题诉求—方案回应”对中的知识,并提供知识服务,为研究网络问政平台上的公众问题诉求和政府方案回应提供一个新视角,也为后续研究提供参考。在方法上,与常用的问卷调查、访谈等方法不同,本文采用的文本挖掘分析技术和方法能够处理大量文本数据,发现数据蕴藏的知识,减少公众主观回答可能产生的偏差。

虽然本文取得了一定的研究成果,但仍存在一些不足。首先,本文仅聚焦于“东湖社区”问政平台,后续研究将考虑进一步扩大样本量,如从多个问政平台获取数据,给出更为丰富的结果,包括不同地区公众问题诉求的对比分析、集成所有地区的方案回应形成方案回应集合,形成群体智慧,更好地为问题诉求处理提供支持。其次,本文仅考虑了“问题诉求—方案回应”对,对其他方面的知识,如公众对方案回应的评价和点赞数、公众问题诉求的关注度等利用较少,未来的重要研究之一是充分利用这些“元知识”,进一步提升方案回应推荐的效果。最后,本文虽然试图建立方案回应推荐知识服务系统,但仅做了初步尝试,未来将在完善推荐模型的基础上,建立知识服务系统,进一步增强研究的实践价值。

参考文献
[1]
韩万渠. 政民互动平台推动公众有效参与的运行机制研究——基于平台赋权和议题匹配的比较案例分析[J]. 探索, 2020(2): 149-160. DOI:10.3969/j.issn.1007-5194.2020.02.015
[2]
沙勇忠, 王峥嵘, 詹建. 政民互动行为如何影响网络问政效果?——基于“问政泸州”的大数据探索与推论[J]. 公共管理学报, 2019(2): 15-27,169.
[3]
吴菊华, 王煜, 黎明, 等. 基于加权知识网络的在线健康社区用户知识发现[J]. 数据分析与知识发现, 2019(2): 108-117.
[4]
李泽中, 齐晨旭, 戎佳. 多源知识融合的企业知识服务模型构建研究[J]. 情报科学, 2022(12): 56-62.
[5]
张璐, 申静. 知识服务模式研究的现状、热点与前沿[J]. 图书情报工作, 2018(10): 116-125.
[6]
盛铎, 王芳, 孟旭. Web2.0时代的政府治理: 郑州市网络问政平台ZZIC案例研究[J]. 电子政务, 2012(6): 92-101.
[7]
贾奇凡, 尹泽轩, 周洁. 行为公共管理学视角下公众的政府满意度: 概念、测量及影响因素[J]. 公共行政评论, 2018(1): 62-82,220. DOI:10.3969/j.issn.1674-2486.2018.01.003
[8]
王欢明, 诸大建, 马永驰. 中国城市公共服务客观绩效与公众满意度的关系研究[J]. 软科学, 2015(3): 111-114.
[9]
朱锐勋, 王鹏, 潘政翰. 加强政府网站建设 助推“互联网+政务服务”——基于结构方程政府网站公众满意度测评模型[J]. 行政与法, 2018(4): 6-12. DOI:10.3969/j.issn.1007-8207.2018.04.003
[10]
孟天广, 李锋. 网络空间的政治互动: 公民诉求与政府回应性——基于全国性网络问政平台的大数据分析[J]. 清华大学学报(哲学社会科学版), 2015(3): 17-29.
[11]
孙宗锋, 赵兴华. 网络情境下地方政府政民互动研究——基于青岛市市长信箱的大数据分析[J]. 电子政务, 2019(5): 12-26.
[12]
刘西平, 黄建宁, 卢丹. 网民问政的渠道选择、使用效果及其影响因素的实证研究——基于对江苏省网民问政行为的调查[J]. 电子政务, 2014(12): 44-51.
[13]
李娟, 丁良超. 融媒体时代社会中间阶层诉求表达的行动逻辑与政府回应[J]. 广西社会科学, 2018(12): 149-154. DOI:10.3969/j.issn.1004-6917.2018.12.030
[14]
张廷君. 城市公共服务政务平台公众参与行为及效果——基于福州市便民呼叫中心案例的研究[J]. 公共管理学报, 2015(2): 21-29,154.
[15]
赵金旭, 王宁, 孟天广. 链接市民与城市: 超大城市治理中的热线问政与政府回应——基于北京市12345政务热线大数据分析[J]. 电子政务, 2021(2): 2-14.
[16]
史亚东, 阮世珂. 公众环境诉求影响因素及其作用机制——基于北京市网络问政平台数据[J]. 调研世界, 2019(5): 11-17.
[17]
李锋. 网络空间公民利益诉求的对象选择与行为特征——以全国网络问政平台的大数据分析为例[J]. 探索, 2019(6): 91-99.
[18]
曹艳辉. “适度压力型”政民互动: 基于中部省级网络问政平台的数据分析[J]. 新闻与传播评论, 2023(2): 70-81.
[19]
雷玉琼, 刘展余. 突发公共卫生事件中的网络问政: 诉求与回应——基于新冠疫情期间“地方领导留言板”的数据分析[J]. 电子政务, 2020(10): 50-61.
[20]
滕婕, 胡广伟, 王婷. 基于动态语义依赖关系网的社会诉求主题识别与演化路径分析[J]. 情报资料工作, 2022(3): 20-33.
[21]
杨洋洋. 数据驱动下突发公共事件公众诉求主题画像与归因分析[J]. 情报理论与实践, 2024(4): 126-133.
[22]
胡广伟, 滕婕, 刘露. 政民互动中社会诉求主题挖掘和省际差异研究——基于省级政府领导电子信箱语料的分析[J]. 数据分析与知识发现, 2021(10): 15-27.
[23]
滕婕, 刘莉, 李硕, 等. 动态语义网的高价值热点主题识别与演化路径分析[J]. 图书情报工作, 2023(7): 92-106.
[24]
常多粉, 孟天广. 动之以情还是晓之以理?——环境治理中网络问政的政府回应话语模式[J]. 社会发展研究, 2021(3): 44-62,243.
[25]
翁士洪, 顾丽梅. 网络参与下的政府决策回应模式[J]. 中国行政管理, 2012(8): 37-41.
[26]
颜海娜, 谢巧燕. 公民诉求对政府回应话语的影响探究——基于F市G区12345平台数据的实证分析[J]. 东北大学学报(社会科学版), 2021(1): 78-86.
[27]
沈国麟, 戴雯斌. 中国政府网络回应机制创新研究——基于问政银川微博矩阵的考察[J]. 新闻大学, 2021(12): 64-76,123.
[28]
李锋. 面向公民网络诉求的政府回应行为与政策性回应——基于地方官员调查数据的列举实验分析[J]. 学习与实践, 2021(1): 73-83.
[29]
李锋. 条块关系视野下的网络诉求与政府回应模式研究——基于中部某市网络问政平台的大数据分析[J]. 电子政务, 2019(5): 27-37.
[30]
周恩毅, 张文培. 数字赋权背景下民众诉求与政府回应的互动逻辑[J]. 河南师范大学学报(哲学社会科学版), 2023(4): 22-27.
[31]
曾润喜, 黄若怡. 地方政府对网络问政的信息注意力分配的层级差异研究[J]. 情报杂志, 2021(8): 127-135. DOI:10.3969/j.issn.1002-1965.2021.08.017
[32]
宋海生, 张万朋, 杨创, 等. “双减”政策的网络舆情特征、公众关注与政府回应——基于全国网络问政平台的大数据研究[J]. 基础教育, 2022(3): 44-58. DOI:10.3969/j.issn.1005-2232.2022.03.005
[33]
杨良伟. 协同惰性、问责压力与地方政府回应——基于A市网络问政平台的混合研究[J]. 电子政务, 2022(12): 23-34.
[34]
李锋, 马亮. 领导重视与数字政府回应力——基于双重差分与合成控制法的实证分析[J]. 公共管理评论, 2021(1): 68-90.
[35]
段哲哲, 刘江. 网络问政的政府回应逻辑: 公开承诺压力与选择性回应——基于66个政府网站领导信箱的实验设计[J]. 浙江工商大学学报, 2019(4): 79-89.
[36]
李传军, 李怀阳. 公民网络问政与政府回应机制的建构[J]. 电子政务, 2017(1): 69-76.
[37]
邵梓捷, 杨良伟. “钟摆式回应”: 回应性不足的一种解释——基于S市地方领导留言板的实证研究[J]. 经济社会体制比较, 2020(1): 114-122.
[38]
常多粉, 郑伟海. 网络问政时代政府回应如何驱动公众参与——基于领导留言板面板数据的实证分析[J]. 社会发展研究, 2023(2): 139-159,245.
[39]
宋向嵘. “线上”回应与“线下”治理: 网络问政效果耦合影响因素研究[J]. 电子政务, 2020(5): 112-124.
[40]
王磊, 易扬. 公共卫生危机中的数字政府回应如何纾解网络负面舆情——基于人民网“领导留言板”回复情况的调查[J]. 公共管理学报, 2022(4): 65-78,169.
[41]
马宁, 于光, 闫相斌. 基于舆情评论数据挖掘的政府回应策略优化方法研究——以新冠疫情援助物资使用舆情事件为例[J]. 电子政务, 2021(9): 23-35.
[42]
刘冬梅. 精准回应: 以“互联网+”纾解基层社会矛盾的创新探索[J]. 探索, 2016(5): 80-85.
[43]
姚兰, 王晓, 段尧清. 多层级政府回应信息协同网络结构分析[J]. 情报理论与实践, 2021(9): 114-121.
[44]
易承志. 互联网传播对城市居民环境诉求的影响方式与政府回应路径[J]. 西南民族大学学报(人文社会科学版), 2020(12): 149-156.
[45]
马海云, 杨欣谊. 面向用户健康赋能的健康领域知识服务研究[J]. 图书与情报, 2023(1): 101-109.
[46]
王昕宇, 李阳. 面向公众科普需求的应急救护知识服务平台构建与运行机制研究[J]. 现代情报, 2021(12): 79-88.
[47]
杨善林, 丁帅, 顾东晓, 等. 医疗健康大数据驱动的知识发现与知识服务方法[J]. 管理世界, 2022(1): 219-229. DOI:10.3969/j.issn.1002-5502.2022.01.016
[48]
马费成, 周利琴. 面向智慧健康的知识管理与服务[J]. 中国图书馆学报, 2018(5): 4-19.
[49]
林海伦, 王元卓, 贾岩涛, 等. 面向网络大数据的知识融合方法综述[J]. 计算机学报, 2017(1): 1-27. DOI:10.11897/SP.J.1016.2017.00001
[50]
赵志耘, 刘耀, 朱礼军, 等. 复杂信息环境下知识组织和再利用模式与方法研究[J]. 情报学报, 2022(12): 1266-1279. DOI:10.3772/j.issn.1000-0135.2022.12.005
[51]
李贺, 刘嘉宇, 沈旺, 等. 基于模糊认知图的在线健康社区知识推荐研究[J]. 数据分析与知识发现, 2020(12): 55-67.
[52]
程为, 郑德俊. 面向知识服务的多模态资源知识重组研究[J]. 情报理论与实践, 2023(1): 168-178.
[53]
马慧芳, 张迪, 赵卫中, 等. 基于超图随机游走标签扩充的微博推荐方法[J]. 软件学报, 2019(11): 3397-3412.
[54]
段尧清, 姚兰. 政媒融合问政平台非正式文本自动分类匹配研究[J]. 情报理论与实践, 2020(6): 156-161,148.
[55]
陈美, 孙瑞乾. 政策工具视域下我国省级数字经济政策文本的量化分析——基于LDA的主题社会网络分析[J]. 情报杂志, 2023(11): 174-182. DOI:10.3969/j.issn.1002-1965.2023.11.001
[56]
曾小芹. 基于Python的中文结巴分词技术实现[J]. 信息与电脑, 2019(18): 38-39,42.
[57]
ZENG L Y, LI R Y M, MAO Y Y, et al. A comparative study on LinkedIn and Sina Weibo users’ perceptions of the carbon-neutral city [J]. Frontiers in environmental science, 2022. DOI:10.3389/fenvs.2022.962367.
[58]
LEE S, MOON H. Semantic analysis of transportation related Researches [Z]. 2017 Ieee 6th International Congress on Big Data (Bigdata Congress 2017). 2017: 545-548. DOI:10.1109/BigDataCongress.2017.83.
[59]
SOHANGIR S, WANG D D, IEEE. Document understanding using improved Sqrt-Cosine similarity [Z]. 2017 11th Ieee International Conference On Semantic Computing (ICSC). 2017: 278-279. DOI:10.1109/ICSC.2017.12.