| 基于用户画像模型的社会服务与管理资源池系统建设实践 |
2. 武汉市国土资源和规划信息中心,湖北 武汉,430014
2. Wuhan Land Resources and Planning Information Center, Wuhan 430014, China
社会治理精准化需要通过不断汇聚政务信息、传感信息、公众信息和互联网信息,利用信息动态感知、知识深度学习、数据精准分析、业务智能辅助、网络安全可控的科技应用新手段对社会治理要素进行精确分析,不断提升新时代社会治理服务的精准化和定制化,为社会治理提供新的技术支撑。
目前,迅猛发展的用户画像技术正逐渐被应用到社交媒体、电商、移动等多个领域。Wu等[1]提出了用户兴趣与用户社交关系的共同演化模型,从而更好地描绘了在社交元素动态演化条件下的用户画像。张慷[2]通过提取用户的上网行为特征,同时结合相关数据进行数据融合及交叉分析,构建了通信用户的画像模型。黄文彬等[3]在分析移动用户的基站轨迹的基础上,采用频繁模式挖掘、构建概率矩阵等方法,构建了包含地理位置信息的用户画像模型。用户画像作为时下一个热点,常用于帮助企业了解用户,精细化定位人群特征,挖掘潜在用户群体进行精准营销。
本文将用户画像技术引入到社会治理领域中,通过对社会治理要素建立标签化特征,构建了社会治理要素的画像模型,并以武汉市为例,建立了社会服务与管理资源池,对各部门数据进行大数据分析、共享融合,通过提供数据交换、资源管理等基本服务接口实现信息的互联互通和共享共用,为智慧社会治理的空间决策提供了基础支撑。
1 社会治理要素画像模型 1.1 用户画像技术用户画像即用户信息标签化,是真实用户的虚拟代表,是根据用户的真实数据(如社会属性、生活习惯、消费行为等)挖掘出的标签化用户模型[4],是大数据技术的重要应用之一,其目标是在多维度上构建针对用户的描述性标签属性。
用户画像的核心工作是打标签,让人能够理解并且方便计算机处理。标签提供了一种便捷的方式,使计算机能够程序化地处理相关的信息,对用户进行理解,将用户属性转化为规则的、有利于计算机存储、可处理的数据格式。用户画像过程主要有用户角色和行为属性特征抽取两部分,具体包括用户基础属性标签、行为属性标签和角色属性标签。基础属性标签包含用户基本资料,如性别、年龄、职位信息、任职时间等属性,一般具有相同角色的用户行为具有高相似性。基于用户角色的行为分析是为了对比待分析用户的行为是否偏离具有相同角色的用户整体的行为,从而从相同用户角色的角度进一步分析异常行为,提高异常判断的置信度。
1.2 社会治理要素的画像模型采用用户画像技术构建社会治理要素的画像模型,综合运用语义挖掘、机器学习、聚类算法、预测算法等方法,将社会治理要素的各个环节的多维度信息打标签,然后按照时空信息链的方式关联起来,构建社会治理要素的基础属性、位置特征和行为特征和关系网络等特征标签的画像模型。如图 1所示。
![]() |
| 图 1 社会治理要素信息画像模型 Fig.1 Holographic Portrait Model of Social Governance Elements Information |
以人为例,一个人一生需要办理的证件和证明超过400个,资源池通过人的社会活动自动获取社会人的信息以及职能部门信息共享汇聚到资源池,反向服务于社会人,最终形成人的画像模型。
按照时间序列和活动发生地点梳理出人的活动轨迹,形成人的画像模型,如图 2所示。
![]() |
| 图 2 人的画像模型 Fig.2 Holographic Portrait Model of Person |
1.3 画像模型的特征
社会治理要素的画像模型融合社会治理要素的多维度信息,除了具备时空大数据的基本特征之外,还具备以下特征。
1) 易于形成特征库。基于用户画像模型的社会治理要素资源池按照时间、空间、办理的事件和状态4个维度存储社会治理要素各类型的全面信息,通过语义分析抽取形成特征库。
2) 全生命周期管理。社会治理要素按照用户画像模型存储信息,可以形成各类社会治理要素的生命周期,这些信息分散在各相关职能部门,信息种类多,通过时间、空间、办理的事件和状态可以形成从出现到消亡的全生命周期管理。
3) 动态变化监管。采用画像技术融合社会治理要素多维度的信息,针对不同社会治理要素进行画像标签,梳理出社会治理要素的动态变迁过程,为智能化的预警、预报和预测提供信息支撑。
2 社会治理要素资源池框架1) 建立分类体系。为了构建社会治理要素的用户画像模型,需要对社会治理要素的多维度信息进行标签化分类,建立分类体系[5-14]。一个标签通常是人为规定的高度精炼的特征标识,标签呈现出两个重要特征:①语义化,人能很方便地理解每个标签含义,这也使得用户画像模型具备实际意义;②短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。通过梳理38个部门共享的2.5亿条信息,形成8 500项信息资源目录,建立了约100个分类标签体系。
2) 构建规则。信息的关联比对是建立画像模型的关键。各职能部门数据与资源池有必然的数据矛盾关系,为了整体了解数据的关联情况和差异情况,需要通过数据统计分析获得人口数量的异同情况和匹配度情况,这依赖于比对规则的建立。
模型的基础规则是来源于权威部门的权威数据,以此数据为准,将所有信息字段与之进行比对。职能部门间人口相关的数据以身份证号和姓名为标识进行匹配,将匹配到的信息填充到人口基本信息表;通过与民政部门的数据匹配,可获取人口信息的婚姻状况和配偶姓名等信息;通过与司法部门的数据匹配,可获取人口信息的矫正等信息。同样,房屋相关的数据以房屋编码和地址编码为标识进行匹配,法人相关数据以统一社会信用代码为标识进行匹配,部件相关数据以地址编码为标识进行匹配。
3) 资源池构建。基于用户画像模型的社会治理要素资源池由3个重要组成部分:①运行在市级的资源池数据仓库及入库机制建设,包括数据仓库、权威数据入库机制;②社会治理要素画像模型及标签体系规则,即运用聚类分析和神经网络等算法,按照分类体系为社会治理要素进行分类打标签,构建用户画像模型;③数据服务接口,提供查询服务、综合分析、工作预警和推送服务等辅助决策。资源池框架如图 3所示。
![]() |
| 图 3 资源池框架 Fig.3 Framework of Resource Pool |
3 实践与应用
时空资源池是武汉市社会服务与管理信息系统的重要组成部分,也是智慧城市大数据分析的基础数据支撑,采用用户画像的方法将公安、国土规划、房管、计生、民政、人社和教育等38个部门社会服务与管理的人、房、法人、事件和部件等多维度信息与时空信息统一融合,并通过业务规则引擎驱动将有用的信息抽离出来,自动推送给各职能部门、街道、社区或网格员。目前,运用系统精确定位实现动态管理实有人口信息、房屋信息、企业信息和各类城市管理部件等各类基础信息2亿5千条,实现社会治理各类要素信息全覆盖、动态全掌控和自动推送预警。
3.1 服务民生通过资源池实现数据一次采集,资源多方共享,信息多跑路,群众少跑腿,为居民办事零证明提供了保障。通过用户画像模型,推送符合条件的业务数据,如为办理独生子女补贴发放提供了用户办证信息推送服务,将此项工作的信访量降低到零;办理计生证时,资源池自动推送户籍和配偶的相关信息,为办理计生证提供了实效和权威的信息;把即将满足办理老年证条件的人口信息推送给网格员,辅助网格员上门主动提醒和协助办理,可以对居民服务进行完善和改进。
3.2 服务决策1) 风险评估分析。实时计算任意地块人口和房屋的密度,对该区域内影响社会不稳定的因素和人员进行分类分析,并推送给相关部门,为制定应急预案和估算征收补偿金额提供服务,如图 4所示。
![]() |
| 图 4 风险评估 Fig.4 Risk Assessment |
2) 分析划分教育片区。为教育局开展中小学学区分析,提供片区内适龄儿童的情况,调整学区划分范围,为合理调配教育资源,减少社会矛盾,提供了可量化的依据,如图 5所示。
![]() |
| 图 5 教育片区分析 Fig.5 Analysis of School District |
4 结束语
本文将用户画像技术应用于社会治理中,构建了社会治理要素画像模型,建设了社会治理要素资源池,使社会治理要素的特征可视化、形象化、生动化,推动了政府部门信息资源的共享,提升了政府社会管理和公共服务体系的信息化水平,为现代化的社会治理创新提供了技术保障,为智慧社会治理的空间决策奠定了基础。
| [1] |
Wu Le, Ge Yong, Liu Qi, et al. Modeling the Evolution of Users' Preferences and Social Links in Social Networking Ser-vices[J]. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(6): 1240-1253. DOI:10.1109/TKDE.2017.2663422 |
| [2] |
张慷. 手机用户画像在大数据平台的实现方案[J]. 信息通信, 2014(2): 266-267. |
| [3] |
黄文彬, 徐山川, 吴家辉, 等. 移动用户画像构建研究[J]. 现代情报, 2016, 36(10): 54-61. DOI:10.3969/j.issn.1008-0821.2016.10.009 |
| [4] |
费鹏, 林鸿飞, 杨亮, 等. 一种用于构建用户画像的多视角融合框架[J]. 计算机科学, 2018, 45(1): 179-182. |
| [5] |
李宗华, 彭明军, 潘琛玲, 等. 基于时空大数据的社会管理创新平台建设[J]. 地理空间信息, 2016, 14(9): 1-6. DOI:10.3969/j.issn.1672-4623.2016.09.001 |
| [6] |
边馥苓, 杜江毅, 孟小亮, 等. 时空大数据处理的需求、应用与挑战[J]. 测绘地理信息, 2016, 41(6): 1-4. |
| [7] |
杜胜兰, 李枫, 黄长青, 等. 基于轨迹数据的武汉大学学生行为规律分析[J]. 测绘地理信息, 2017, 42(1): 91-95. |
| [8] |
李冰, 王悦, 刘永祥. 大数据环境下基于K-means的用户画像与智能推荐的应用[J]. 现代计算机(专业版), 2016(24): 11-15. |
| [9] |
高倩影, 佘冰, 呙维, 等. 在线空间商务智能多源数据集成与交互可视化分析[J]. 测绘地理信息, 2015, 40(1): 61-64. |
| [10] |
刘海, 卢慧, 阮金花, 等. 基于"用户画像"挖掘的精准营销细分模型研究[J]. 丝绸, 2015, 52(12): 37-42. DOI:10.3969/j.issn.1001-7003.2015.12.008 |
| [11] |
张小可, 沈文明, 杜翠凤. 贝叶斯网络在用户画像构建中的研究[J]. 移动通信, 2016, 40(22): 22-26. DOI:10.3969/j.issn.1006-1010.2016.22.005 |
| [12] |
Chen T, Guestrin C. XGBoost: A Scalable Tree Boosting System[C]. The 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, USA, 2016 http://cn.bing.com/academic/profile?id=13d21d2c7f7cd7ff5dd92459ca2f910b&encoded=0&v=paper_preview&mkt=zh-cn
|
| [13] |
朱懿, 孟祥宁. 我国信息化治理创新实践与优化对策研究[J]. 行政与法, 2014(9): 57-61. DOI:10.3969/j.issn.1007-8207.2014.09.011 |
| [14] |
刘霞. "互联网+"时代创新基层社会治理的思考[J]. 农业网络信息, 2015(10): 110-112. DOI:10.3969/j.issn.1672-6251.2015.10.032 |
2019, Vol. 44







