| 宁波市动态位置大数据服务平台的探索与实践 |
当前,地理信息产业正面临着以互联网、大数据为依托的信息化多业共生、融合发展的模式,GIS技术拥抱大数据已成为热潮[1, 2],地理信息的产业链条正在重构。经过多年的发展,宁波已初步形成了空、天、地、海一体化的测绘地理信息数据服务体系,积累了一批丰富的测绘地理信息成果,包括各种比例尺地图、遥感影像、高程模型、地理实体、地名地址、三维数据等,数据形式多样、类型丰富。然而,这些数据多数属于静态位置数据,以“物”的空间属性为主,时间分辨率不高,无法随着时间推移跟踪到数据的变化,事物之间缺乏广泛关联性和实时性,多源位置数据有待补充。而基于互联网大数据的动态位置服务无疑是地理信息应用进一步探索的最佳结合点,将促进宁波测绘地理信息技术体系、管理方式和服务模式全面转型升级。宁波市动态位置大数据服务平台的探索和实践通过引入以互联网大数据为主的动态位置数据,探索动态位置大数据和传统地理信息资源的融合汇聚模式,搭建全市统一、权威的动态位置大数据服务平台,动态监测城市重点区域人口时空分布特征[2],为政府提供更加科学的决策依据,促进整个城市的智能化、精细化运营管理。
1 大数据比较选型与核心服务能力目前,国内提供大数据服务的企业主要分为以下3类:①现在已经有获取大数据能力的公司,如BAT(百度公司(Baidu)、阿里巴巴集团(Alibaba)、腾讯公司(Tencent)3大互联网公司首字母的缩写)等互联网巨头以及华为、浪潮、中兴等国内领军企业,涵盖了数据采集、存储、分析、可视化以及数据安全等领域;②移动、联通、电信等通信运营商,他们拥有庞大的用户定位数据及通信信息[3];③初创的大数据公司,他们依赖于大数据工具,针对市场需求,为市场带来创新方案并推动技术发展,其中大部分的大数据应用还是需要第三方公司提供服务[4, 5]。截止到2018-11,大数据服务商能力对比如表 1所示。由表 1可知,目前,BAT三家的大数据综合服务能力比较接近,在定位精度、数据源和大数据分析挖掘能力等方面,均要优于通信运营商等其他大数据提供商。因此,经过认真调研和分析,选择互联网大数据作为动态位置数据源,通过引入阿里巴巴大数据,利用空间基准转换、变形拟合、拓扑关系构建等一系列本地化落地改造,完成动态位置数据和传统静态地理数据的叠加分析。
| 表 1 大数据服务商能力对比 Tab.1 Big Data Service Capability Comparison Table |
![]() |
依托阿里集团的线上大数据能力及高德独有的人地关系数据和外部第三方合作数据,对用户位置信息进行记录跟踪,通过特征加工、变量相关性分析、交互变量研究及模型特征提取等方式进一步抽取、分析、统计,形成能够反映城市人口时空特征的出行信息[6],同时对用户线上行为数据按照不同维度进行标记、排序、提取,形成用户画像标签,挖掘出人群的社会属性、兴趣爱好、使用习惯和日常需求[7]。其核心服务能力可概括为以下8类。
1) 实时人口分布信息。以100 m×100 m网格为基本统计单元,获取网格内的用户设备数,实时统计网格内的人口数量,实时动态反映全大市的人口空间分布状况。
2) 居住/工作人口信息。对手机用户进行连续几个月的跟踪定位,依据用户经常活跃的位置和时间规律,计算出每个用户的工作地和居住地,通过划分区域位置边界,测算出某个区域的居住人口/工作人口数量。
3) 人口画像信息。用户线上行为反映了用户的兴趣爱好及日常需求[8],依托阿里强大的大数据分析处理能力,对用户线上消费、注册、社交等行为数据按照不同维度进行标记、排序、提取,形成人口画像信息,包括性别、年龄、学历、职业、收入水平、消费水平、所在行业、人生阶段、资产状况及兴趣关注等标签,多维度描绘人群的社会属性特征。
4) 职住分析信息。以基层网格、交通小区、社区、街道等不同尺度单元为研究对象,计算各区域工作地和居住地的职住联系信息,用来分析各地区职住平衡,包括工作地、居住地及各工作地、居住地之间的统计人数,以及平均通勤时长。
5) 区域出行信息。以基层网格、交通小区、社区、街道等不同尺度单元为研究对象,分析统计任意两个区域之间的每小时OD(orign-destination)客流出行数据,包括起始网络编号、终点网络编号、平均时间、距离等信息,反映人流出行偏好,挖掘人群流向,依据用户足迹绘出“流空间”中的城市出行体系。
6) 区域客流信息。对一个区域内指定时间段内发起定位请求的设备数进行统计,经设备去重后获得指定区域的客流量,统计输出全市任意一个区域内月均24 h客流量。
7) 商旅人员信息。对常驻地非宁波、近期在宁波出现过的外来商旅人员进行统计分析,包括商旅人员分布信息,以及来源地、性别、年龄、学历、职业、收入水平、兴趣爱好等画像信息。
8) 城市迁徙信息。统计宁波市与国内其他重点城市的人口流动数据,反映宁波各区县、宁波和外市(包括北京、天津等重点城市、宁波都市圈以及长三角各城市)的人流迁徙,包括迁入、迁出城市及区县信息、人数。
2 平台设计与实现平台总体框架如图 1所示,采用“云+端”两层架构,不重复建设底层云环境,充分利用宁波市政务云和阿里巴巴-高德云平台的基础支撑环境。在“云”层,利用阿里巴巴-高德多年积累的虚拟化、分布式集群、大数据多维分析算法等技术构建云端计算服务,实现动态位置数据的清理、转换、组合、采样、去重、拆分,分析挖掘出人口时空分布特征及其偏好属性,输出一系列标准的动态位置服务接口[9, 10]。政务云为静态位置数据和系统提供基础软件及数据管理服务系统的部署环境,进行各类静态位置数据的存储,实现与动态位置数据的叠加分析;在“端”层,针对不同政府用户需求,面向城市规划、海域港口管理、基层治理、林业资源管理提供一系列的大数据服务产品及不同产品组合的应用解决方案。
![]() |
| 图 1 总体框架图 Fig.1 General Frame Chart |
平台由门户展示系统和运维管理系统两部分组成,其中,门户展示系统实现对所有数据的统一展示,各种的大数据可视化方案都通过门户进行统一展示,系统根据比较通用的大数据应用场景,把大数据服务按照人口分布、人口画像、出行特征等维度划分成不同的页面主题,从中抽取出关键指标,通过“地图+统计图表”的方式将大数据展示出来[11, 12],形象直观地反映出宁波市的人口时空分布状况,系统界面如图 2所示;运维管理系统实现对静动态数据的统一管理,完成数据坐标转换和标准化清洗入库;同时针对各个委办局的个性化需求进行专业的定制,并且限制其使用权限,对每类数据的使用情况进行实时跟踪监控,确保系统稳定运行。
![]() |
| 图 2 系统界面 Fig.2 The System Interface |
3 典型应用成果
目前,项目研究成果已先后在城市规划、基层治理、港区管理、森林防火等领域进行了初步应用,以城市规划为例,借助大数据进行诊断、发现规律,进而对城市的管理运营和规划发展做出相对科学的分析与预测。
在传统的城市规划中,数据获取和分析主要依赖于实地调研、问卷调查、统计资料及相关图书资料等传统手段,虽然在一定程度上反映了人对于空间的使用情况,但存在着调查样本量较小、主观性较强、成本较高、时效性和针对性不强等诸多明显缺陷或问题,且无法精确动态描述城市空间结构的时空变化本质。大数据的发展,为城市空间规划研究提供了一个全新视角。大数据的一个核心是对应着人,基于大数据可以发现传统城市空间规划和研究可能存在的问题,促进城市规划朝着动态化方向发展[13],进行更加科学精确的城市研究分析。本项目利用大数据有效分析了宁波市人口时空分布情况,研究了各板块职住通勤状态,辅助研究和梳理整个城市空间格局[14],为城市发展策略的制定和城市规划的编制、评估提供了更合理、科学的方法体系。
1) 城市空间格局分析
基于实时人口热力分布数据,直观反映各个地区内聚类的人群密度和人流量空间差异,识别出城市中人群活动热点区域。
由图 3可知,人口高活力空间高度集聚在三江口地带,这是宁波一直以来的核心商圈,在东部新城、鄞州南部商务区以及奉化、镇海、北仑等主城区呈现次热状态。
![]() |
| 图 3 城市空间格局分析 Fig.3 The Analysis of Urban Spatial Pattern |
2) 城市活力分析
基于实时人口热力分布数据及历史客流数据,直观展示城市人口热力分布随着时间推移变化的情况,跟踪工作日、节假日一天24 h人口活动变化,对比不同时段的人口热力活跃度,结合周边POI(point of interest)公共设施信息,为宁波空间规划设计与活力提升提供依据与参考。
图 4表明,在工作日,宁波人口集聚在8:00~9:30期间增长很快,反映出人群受上班早高峰时间影响出现集聚效应,并且由于工作时长持续了约8~9个小时的热度,在19:00~20:00左右整体热度开始下降,至2:00回归波谷,大多数居民进入夜间休息状态,但三江口区域仍处于局部活跃状态。
![]() |
| 图 4 城市活力分析研究(工作日) Fig.4 The Analysis of Urban Vitality |
3) 职住通勤分析
以社区、街道为单元,统计居民职住地信息和通勤信息,精确分析全市居住人口/工作人口分布情况,如图 5(a)、图 5(b)所示,聚集密度由高到低分别用红色、黄色和绿色表示。同时统计各区域职住比、通勤空间、通勤距离等,对各区县之间的通勤关系进行客观评价,直观反映各个分区之间的相互联系,为区域协调规划发展提供了可靠依据。
![]() |
| 图 5 全市居住人口/工作人口分布及画像信息 Fig.5 The Population Distribution and Portrait Information |
从居住密度来看,整个宁波市的居住密度呈现出较为集中的状态,整个海曙老城区居住密度都比较高;相对于居住的集中性来说,宁波的就业分布分散许多,在三江口片区、东部新城、南部商务、镇海主城区、北仑主城区等工作密度都比较高。图 5(c)显示了江厦街道新街社区的人口画像构成,包括了社区人群的婚姻状况、年龄构成、学历层次等标签。
图 6表明,海曙、鄞州、江北3个区之间的通勤联系是比较紧密的;其次,余姚与慈溪之间、镇海、北仑与主城区之间的联系也较为频繁,平均通勤时间在1 h以内,通勤距离平均6 km。图 7表明,在绕城范围内,东部新城呈现出大片的密集,除此以外, 高桥、洪塘、集士港成簇状分布,整体上东西向之间通勤需求旺盛,道路交通利用率较高、交通压力较大。
![]() |
| 图 6 全市通勤统计 Fig.6 Statistics of Commuting Analysis |
![]() |
| 图 7 绕城范围内通勤联系 Fig.7 Commuting Relates Within Belt Expressway |
4 结束语
本文详细地介绍了宁波市动态位置大数据服务平台的数据体系和系统功能,并以城市规划为例,阐述了大数据的应用模式和前景。目前, 该平台已正式投入运行,实现了对城市人口时空分布特征的实时动态监测,促进了城市的智能化、精细化管理,希望其具有参考价值。
| [1] |
宋关福, 钟耳顺, 李绍俊, 等. 大数据时代的GIS软件技术发展[J]. 测绘地理信息, 2018, 43(1): 1-7. |
| [2] |
周顺平, 徐枫. 大数据环境下地理信息产业发展的几点思考[J]. 地理信息世界, 2014, 21(1): 45-50. |
| [3] |
王录仓. 基于百度热力图的武汉市主城区城市人群聚集时空特征[J]. 西部人居环境学刊, 2018, 33(2): 52-56. |
| [4] |
候笑宇, 司连法, 王梅红, 等. 结合手机信令数据和地理空间数据的居民职住信息识别[J]. 测绘通报, 2019(5): 139-142. |
| [5] |
许宁, 尹凌, 胡金星. 从大规模短期规则采样的手机定位数据中识别居民职住地[J]. 武汉大学学报·信息科学版, 2014, 39(6): 750-756. |
| [6] |
雷程程.基于大数据的城市人群活动的时空动态分析[D].西安: 陕西师范大学, 2016 http://cdmd.cnki.com.cn/Article/CDMD-10718-1017035762.htm
|
| [7] |
牛方曲, 刘卫东. 基于互联网大数据的区域多层次空间结构分析研究[J]. 地球信息科学学报, 2016, 18(6): 719-726. |
| [8] |
王昊, 董宇阳. 一种基于互联网的地理大数据平台[J]. 经纬天地, 2016(4): 17-23. |
| [9] |
叶文娟, 艾廷华. 多维度轨迹数据的SQL时空查询方法[J]. 测绘地理信息, 2017, 42(6): 16-20. |
| [10] |
申兆慕.多源公众出行大数据综合可视化分析[D].北京: 北京建筑大学, 2019 http://cdmd.cnki.com.cn/Article/CDMD-10016-1019103921.htm
|
| [11] |
杨敏, 艾廷华, 卢威, 等. 自发地理信息兴趣点数据在线综合与多尺度可视化方法[J]. 测绘学报, 2015, 44(2): 228-234. |
| [12] |
彭玲, 李祥, 徐逸之, 等. 基于时空大数据的城市脉动分析[J]. 地理信息世界, 2016, 23(3): 5-12. |
| [13] |
宁鹏飞, 万幼, 沈怡然, 等. 基于签到数据的城市热点功能区识别研究[J]. 测绘地理信息, 2018, 43(2): 110-115. |
| [14] |
丁亮, 钮心毅, 宋小冬. 基于移动定位大数据的城市空间研究进展[J]. 国际城市规划, 2015(4): 53-58. |
2020, Vol. 45









