测绘地理信息   2023, Vol. 48 Issue (1): 49-52
0
精细地图融合手机信令的城市人口时空分布特征研究[PDF全文]
王梅红1, 贺风1, 司连法1, 侯笑宇1, 周俊蓉2, 龙云涛1, 关茜1    
1. 中国地图出版社有限公司,北京,100054;
2. 成都方未科技有限公司,四川 成都,610065
摘要: 针对城市人口时空分布研究中缺乏以精细地图数据为支撑的地理分析方法、不能真实反映人类活动目的等问题,提出了一种精细地图融合手机信令的方法。该方法以地图为智能底板,基于信令轨迹中的基站位置与精细地块的类型,通过空间计算和时间推理得到手机用户在每个时段的驻留地块以及驻留时长,建立基于精细地块的人口空间化模型;识别每个地块中的职住人口和短期到访人口,再汇总得到任意目标区域的实际服务人口总量及人群结构,分时段研究人口流动和聚集变化特征。经过验证,该方法提升了人口时空分布研究结果的真实性和实用性,弥补了手机基站定位与用户实际位置存在偏差且无法准确识别居民行为规律的不足,为城市人口精细化管理、重点区域人流监测与安全保障、优化公共资源配置等提供可靠的决策支撑。
关键词: 精细地图    手机信令    驻留地块    实际服务人口    时空分布    
Research on Spatiotemporal Distribution Characteristics of Urban Population Based on Integration of Fine Map and Mobile Phone Signaling
WANG Meihong1, HE Feng1, SI Lianfa1, HOU Xiaoyu1, ZHOU Junrong2, LONG Yuntao1, GUAN Xi1    
1. Sinomap Press Co., Ltd., Beijing 100054, China;
2. Chengdu Fangwei Technology Co., Ltd., Chengdu 610065, China
Abstract: The research on the spatiotemporal distribution of urban population lacks the geographical analysis methods supported by fine map data, so it can not reflect the purpose of human activities. In view of this, we propose a method based on integration of fine map and mobile phone signaling. Based on the location of base station in signaling trajectory and fine plot type, we use the map as the intelligent floor and get the resident plot and resident duration of mobile phone users through spatial calculation and time reasoning. Then, we establish a population spatial model based on fine plots, identify the jobshousing population and short-term visiting population in each plot, and summarize the total population actually served and population structure in any target area to study population flow and aggregation characteristics in different periods. The experimental result shows that the method improves the authenticity and practicability of the research results, and makes up for the shortcomings of mobile phone such as the deviation between the location of base station and the actual location of users and the inability to accurately identify the behavior rules of residents. It is expected to provide reliable decision-making support for the fine management of urban population, the monitoring and security of the flow of people in key areas, and the optimization of the allocation of public resources.
Key words: fine map    mobile phone signaling    resident plot    actually served population    spatiotemporal distribution    

城市发展的诸多问题都围绕着“人”这个核心因素。随着城市化进程的加速,城市之间以及城市内部的人口流动日益频繁,城市管理决策对于人口分布数据的时效性、精细度要求愈加强烈[1, 2]。传统的人口时空分布研究大多使用抽样调查统计数据和普查数据[3, 4],存在人力物力成本高、空间精细度低和时效性差等诸多不足。随着时空大数据的出现和数据挖掘技术的发展,学术界在精细时空尺度上对城市人口社会经济特征分布的研究中取得了长足进展,涌现了大量基于手机信令数据、公交刷卡数据、社交媒体数据等时效高、覆盖广的位置大数据的研究[5-8],弥补了传统方法的不足。

手机信令数据具有样本大、时效高、用户轨迹连续等综合优势,成为最热门的研究数据来源[9-11]。基于手机信令的人口时空分布研究也在不断发展,研究数据源从单一数据源发展到多源数据,如结合夜间灯光和微信定位数据开展的北京市中心城区人口空间化研究[12]、结合共享单车数据开展的城市内部人口空间流动特征研究[13]。人口空间化从一般格网化到带有空间信息的格网化,从低时空分辨率到高时空分辨率。有学者利用手机信令数据研究了天津市小白楼CBD片区的人员规模变化趋势、分地块人数极值时空分布、驻留与流动人员时空分布[14];也有学者基于手机信令数据从基站网格、乡镇街道及区县3种统计级别分析了合肥市郊区居民的工作地和居住地的分布特征[15]。然而,现有研究大多以移动基站位置或者地理网格为分析单元,人口空间化的尺度多针对区域或城市,少有针对社区、住宅小区级的研究。基站位置与用户的实际位置存在偏差,网格方法存在一个格网多个语义的问题,无法准确表达用户行为,无法描述居民出行目的及规律。由于缺乏以精细地图数据为支撑的地理分析方法,分析结果在空间精细化方面还有提升的空间,在真实性和实用性上还存在很大不足。

鉴于此,本文提出一种精细地图融合手机信令数据研究城市人口时空分布特征的方法,从人口总量和人群结构、不同时段人口流动和集聚变化两个方面开展研究。以信令轨迹为数据源,建立基于精细地块的人口空间化模型进行人口分布识别,在保持信令数据精细度高、时效性高的同时,提升人口分布结果的真实性和实用性,为城市人口精细化管理、重点区域人流监测、优化资源配置等提供决策支撑。

1 研究数据

1)手机信令数据。手机在待机、通话、收发短信或上网等状态时,都会与附近的移动基站进行通信,这些通信信息即为手机信令数据。一条信令数据记录了该手机用户的轨迹回传时间和被连接基站的位置,每个用户的信令数据完整记录了该用户全天的活动轨迹,能够真实反映居民的时空分布[16]

2)精细地图数据。精细地图数据是一套支撑时空分析的精细化矢量地图数据集,包括精细地块以及道路和水系数据,真实描述了城市地表空间覆盖情况。其中,精细地块数据以院落、小区甚至楼宇级为建设尺度,包含地表覆盖的人工地物和自然地物,生产制作以现实世界中独立存在、可唯一标识为原则,以能正确表示楼宇和区块范围、与道路水系之间无重叠压盖、拓扑关系正确等为规则。

为了适合人口分布研究,满足分时段用户位置空间化的应用场景,本文将精细地块类型分为居住地块、办公地块、商娱地块、职住混合用地(高等院校、含住院部的医院等)及其他5种。除面状几何信息外,每个地块数据还包括地块名称、地块面积、所在街道、一级分类、二级分类、类型等属性信息。

2 研究方法 2.1 建立基于精细地块的人口空间化模型

人口空间化模型将不同时段的人口分布空间化,映射到具体的精细地块,建立精细尺度下的人地关系。主要思路为计算基站的覆盖范围与周边地块的空间关系,结合地块的类型和轨迹的时间空间特性,通过空间计算判别用户行为,得到用户的驻留地块、驻留时段和驻留时长3个分析指标,主要处理过程包括:

1)轨迹数据清洗。按用户编号分组,以天为单位,按时间升序排序,合并在同一基站且时间连续的数据,并保留时长超过阈值范围(30 min)的记录,同时删除无效数据、错误数据、大量重复数据和跳变切换数据,生成有效驻留轨迹链[16]。结果存储为{userid,lac-ci,begin-time,end-time,diff}。其中,userid为用户编号;lac-ci为基站小区编号;begin-time为在该位置的开始时间;end-time为在该位置的结束时间;diff为在该位置的驻留时长。

2)轨迹点映射到精细地块。基站覆盖类型分为室内、室外两种,室内的基站轨迹点大多部署在居民楼、办公楼、商场大厦写字楼内,通过空间包含算法即可找到所在的建筑物。室外的则需要分步计算和推断:①将基站覆盖范围和地块数据进行空间分析并计算相交面积,根据相交面积和基站覆盖范围的比值从大到小保留3个地块。②对于未找到相交地块的轨迹点,使用近邻分析算法找到相邻的地块,并计算其与相邻地块最近一条边的距离,根据距离从近到远保留3个地理实体序列。③结合该用户当前驻留时段的时间特性、驻留地块的类型以及驻留时长、面积占比或距离远近等指标标识权重,选取权重最高的地块作为该用户在当前时段的驻留位置。

重复上述步骤,得到连续n天每个用户在驻留地块的信息,形成人口驻留地块轨迹,建立精细尺度下的“人地关系”。

2.2 识别每个地块的职住人口和短期到访人口

以居民驻留地块轨迹数据集为基础,建立基于多日平均的空间聚类算法,识别每个地块中的职住人口和短期到访人口。本文将每个地块的驻留人口分为居住人口、工作人口、职住同址人口、短期到访人口共4类,如表 1所示。

表 1 精细地块的驻留人口分类标准 Tab.1 Standards for the Resident Population Classification on Fine Plots

本文假定每个用户在当前连续时间段内的工作场所和居住场所相对固定且唯一,并忽略了夜间工作、白天休息的部分人群,考虑大数据样本的优势,误差在可接受范围内[16],算法主要过程如下:

1)判定不同时段的阈值范围。以当前城市的上下班时间为参考,结合当地居民的作息时间和通勤特征,选定判断工作时段(商娱时段)和休息时段的时间阈值。以北京市为例,政府机关单位和大多数企事业单位的上班时间在08:00~18:00,但是考虑到一线城市普遍存在的加班现象、交通拥堵现状,以及部分企业的上班时间在10:00~19:00,尤其是部分互联网公司的“996”工作文化,综合判定表 2所示的工作(商娱)时段、休息时段的阈值范围。

表 2 工作(商娱)时段、休息时段阈值范围 Tab.2 Threshold Ranges of Work (Business Entertainment)Period and Rest Period

2)基于多日平均的空间聚类。考虑到单日聚类时可能恰逢大型会展、演唱会等特殊事件,为了削弱偶发事件带来的结果偏差,本文提取连续多日在工作日的工作时段和休息时段、非工作日的商娱时段和休息时段的用户驻留轨迹,汇总和聚类平均后的手机用户数量,得到基于多日平均的用户空间分布。

3)识别每个地块的职住人口和短期到访人口。从多日平均的用户空间分布数据集中,根据精细地块的驻留人口分类标准,识别每个地块中的工作人口、居住人口、职住同址人口和短期到访人口。

2.3 汇总得到区域人口总量和人群结构

本文可从多种尺度、多种角度确定研究目标区域,政区尺度支持社区级、街道级、区县级和全市域范围,自定义区域支持城市环线、城市商圈等任意区域。

将区域人口总量定义为区域内的实际服务人口数量,将区域内的人群结构分为工作人群、居住人群、职住同址人群和短期到访人群。先通过空间计算得到目标区域包含的所有精细地块,再对每个精细地块的驻留人口数据进行汇总,即可得到区域人口总量和人群结构。

2.4 分时段研究人口流动和聚集变化特征

使用核密度分析方法分时段研究人口分布的时空动态特征,主要步骤如下:

1)以天为单位,汇总每个地块在工作日工作时段的驻留人员数量、在节假日商娱时段的驻留人员数量、在夜间休息时段(含工作日、节假日)的驻留人数。

2)重复上述步骤,得到第1~n天每个地块在不同时段的驻留人数。

3)计算多日平均后每个地块在工作、商娱和休息时段的平均驻留人数。

4)使用ArcGIS的核密度分析工具将不同时段的汇总结果生成人口密度空间分布图,目标位置(xy)的密度预测如下:

$ D=\frac{1}{r^2} \sum\limits_{i=1}^n\left[\frac{3}{\pi} p_i\left(1-\left(\frac{d_i}{r}\right)^2\right)^2\right], i=1, 2, \cdots, n $ (1)

式中,r为搜索半径,使用的是ArcGIS中默认的最优搜索半径;i为输入的面状精细地块的几何质心,如果它们位于此目标位置的半径距离内,则仅包括总和中的点;pi为第i个地块的平均驻留人数;di是第i个地块的几何质心与目标位置间的距离。

5)在地图上查看不同时段的人口集聚情况,研究不同时段的人口流动特征和分布差异,对比并总结人口分布变化和差异。

3 实验与应用

本文使用北京市连续一个月的手机信令数据以及同时期北京市全域范围内的精细地块数据进行实验。图 1展示了北京市单个地块的人口总量和人群结构,随机抽取20个地块,将实验结果与这些地块的人口总量和人群结构的实际情况进行比对,准确率高于85%。图 2展示了北京市(六环内)昼夜人口聚集变化特征,白天在上地、国贸、中关村等典型就业区,夜间在回龙观、天通苑等典型居住区有显著的人口集聚,与实际情况吻合。这表明本文方法是可行、可靠的。

图 1 单个地块的人口总量和人群结构 Fig.1 Total Population and Population Structure of Individual Plot

图 2 北京市(六环内)昼夜人口聚集变化特征 Fig.2 Characteristics of Population Aggregation Change During the Day and Night in Beijing (within the Sixth Ring Road)

本文研究成果已被应用于“时空洞察服务”产品,被推广至北京市、上海市、四川省等地,主要功能为及时、精细化地感知城市内的实际人口总量、人口结构、人口流动和时空分布差异等。

4 结束语

本文使用精细地图数据融合手机信令用户轨迹,研究了精细尺度的城市人口时空分布特征,提出并建立了基于精细地块的人口空间化模型。使用该方法识别的人口分布结果既继承了信令数据精细度高、时效性高的优势,又提升了研究结果的实用性和真实性,弥补了手机基站定位与用户实际位置存在偏差且无法准确识别居民行为规律的不足。可为城市人口精细化管理、重点区域人流监测、优化公共资源配置等提供可靠的决策支撑,也推动了地图学数字化、智能化的融合创新应用。

参考文献
[1]
翟振武, 刘雯莉. 七普数据质量与中国人口新"变化"[J]. 人口研究, 2021, 45(3): 46-56.
[2]
檀成龙. 基于夜光遥感的人口空间化估算[J]. 测绘与空间地理信息, 2022, 45(5): 103-105.
[3]
胡明伟. 居民出行调查数据的统计分析方法[J]. 统计与决策, 2009(6): 170-171.
[4]
李吉墉, 周春山, 杨高. 珠海外来人口分布的时空演变特征研究[J]. 城市学刊, 2018, 39(4): 38-42.
[5]
刘云霞, 田甜, 顾嘉钰, 等. 基于大数据的城市人口社会经济特征精细时空尺度估计: 数据、方法与应用[J]. 人口与经济, 2022(1): 42-57.
[6]
李祖芬, 于雷, 高永, 等. 基于手机信令定位数据的居民出行时空分布特征提取方法[J]. 交通运输研究, 2016, 2(1): 51-57.
[7]
刘丽敏, 虞虎, 靳海涛. 基于公交刷卡数据的北京城市居民周末户外休闲行为特征研究[J]. 地域研究与开发, 2018, 37(6): 52-57.
[8]
屈树学, 董琪, 秦嘉徽, 等. 基于社交媒体数据的北京市游客与居民签到差异研究[J]. 地理与地理信息科学, 2022, 38(1): 37-44.
[9]
陈佳, 胡波, 左小清, 等. 利用手机定位数据的用户特征挖掘[J]. 武汉大学学报·信息科学版, 2014, 39(6): 734-738.
[10]
钮心毅, 丁亮, 宋小冬. 基于手机数据识别上海中心城的城市空间结构[J]. 城市规划学刊, 2014(6): 61-67.
[11]
钟炜菁, 王德, 谢栋灿, 等. 上海市人口分布与空间活动的动态特征研究: 基于手机信令数据的探索[J]. 地理研究, 2017, 36(5): 972-984.
[12]
王熙, 宁晓刚, 张翰超, 等. 融合LJ1-01夜间灯光和微信定位数据的人口空间化: 以北京市为例[J]. 测绘科学, 2022, 47(2): 173-183.
[13]
张逸群, 黄春晓, 张京祥. 基于多源数据的城市空间流动特征识别及规划思考: 以南京都市区为例[J]. 现代城市研究, 2018, 33(10): 11-20.
[14]
陈伟, 翟国方, 张义杰. 基于手机信令数据的人口高精度时空分布特征研究: 以天津市小白楼CBD片区为例[J]. 资源开发与市场, 2019, 35(10): 1266-1272.
[15]
陈静媛, 张云彬, 王诚, 等. 基于手机信令数据的合肥市郊区职住空间特征研究[J]. 华中农业大学学报(自然科学版), 2022, 41(3): 35-46.
[16]
侯笑宇, 司连法, 王梅红, 等. 结合手机信令数据和地理空间数据的居民职住信息识别[J]. 测绘通报, 2019(5): 139-142.