中国科学院大学学报  2016, Vol. 33 Issue (6): 775-782   PDF    
基于微博数据的中原城市群空间联系强度测度
王开泳, 邓羽     
中国科学院地理科学与资源研究所中国科学院区域可持续发展分析与模拟重点实验室, 北京 100101
摘要: 空间联系强度是城市群发展阶段、态势、功能定位的重要表征.在大数据背景下,随着移动终端的普及和网络联系平台的广泛使用,人流在不同地区的空间移动能够得到较准确的统计和表达.在总结以往城市群空间联系研究方法的基础上,提出一种新的基于微博数据判别城市之间空间联系强度的方法,弥补了由于缺乏城际通勤数据而导致的传统空间联系强度判别方法的不足.新方法可以较准确地判别城市群地区各个城市的空间联系强度与组织类型.
关键词: 微博数据     空间联系强度     中原城市群     辐射范围    
Identification of spatial connection intensity of Zhongyuan urban agglomeration based on microblogging
WANG Kaiyong, DENG Yu     
Key Laboratory of Regional Sustainable Development Modeling of Chinese Academy of Sciences, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
Abstract: Spatial connection intensity is an important indicator for the development stage, situation, and function position of urban agglomeration. With the wide use of mobile terminals and networking platform, population mobility among different regions can be traced and expressed more accurately by using big data analysis technique. Based on the database of microblog, a new measurement method for spatial connection intensity is proposed in this study. The new method makes up for the traditional disadvantages resulting from the lack of commuting data. Therefore, it provides guidance for accurate identification of urban agglomeration.
Key words: micro blogging     spatial connection intensity     Zhongyuan urban agglomeration     radiation scope    

随着经济实力的不断增强和人口集聚水平的不断提高,大城市的吸引和辐射能力也在持续增强.与此同时,在电子信息、快速交通系统等新兴技术迅猛发展的促进下,城市之间的联系与交流也日益密切,使得城市-区域呈现出网络化发展态势[1-2].城市-区域网络化的空间景观促进了城镇密集地区的生成,而且单个城市增长级正在逐步壮大、交互影响,并向更高级空间组织类型演变[3-4].当前,城镇密集地区已经成为中国区域发展的主要承载单元,但也出现了城市无序扩张、跨界增长、城际恶性竞争等问题[5],尤以城市群地区为甚.因此,应该立足区域整体发展的视角,探讨城市群之间的空间联系强度,加强经济协作与产业联系,不断提升城市群的区域发展合力和整体竞争力.

当前,国外学术界对城市群空间联系的研究越来越重视定量模型的应用和联系过程的动态分解,研究方法不断创新,从最初运用引力模型,到后来的威尔逊模型、空间关联模型、知识溢出模型等,所使用的基础数据多是贸易流、航空流和城市间的通勤数据[6-11].中国对于区域空间联系的研究始于20世纪90年代,李春芬[12]指出区际联系是区域地理学的近期前沿.随后,(改进)引力模型[13]、经济联系强度模型[14]、城市流模型[15]、城市通达性模型[16]、SOM神经网络分析[17]、潜力模型[18]等逐步应用到城市群的经济空间联系和相互作用的研究中,所使用的数据也包括了航空流数据[17]、人口数据[15]、经济数据[14]、高铁交通客流数据[19]等方面.从方法看,甄峰等 [20]较早运用微博数据进行城市网络的等级划分与层级研究,也有针对个体城市开展的研究[21],但用于城市群空间联系强度的研究较少.

总体看来,空间联系强度与辐射范围是城市群发展阶段、态势、功能定位的重要表征,是判定城市群发育阶段和辐射带动能力的重要参考标准.空间联系强度是国内外城市群研究的重要内容,由于研究数据可获得性的限制,以往的研究主要局限于统计数据.因此,本研究采用一种全新的基于移动数据端微博数据探索城市群空间联系强度的识别方法,弥补了由于缺乏真实城际通勤数据而导致的传统空间联系强度判别方法的不足,可以较准确地判别城市群地区各个城市的空间联系强度与组织类型,对准确判断和培育城市群具有一定参考价值.系统识别都市密集地区各城市间的空间联系强度、辐射范围和空间组织类型,从而为因地制宜地推进城市群各城市的分工协作提供参考依据.

1 研究方法与数据来源 1.1 研究方法构建

梳理城市群空间联系与辐射范围的识别理论与方法,均将核心城市中心性、外围县市社会经济发展情况以及城际联系格局3个方面作为空间组织类型识别的分析框架.不同的是,国外城市群空间组织类型划分方法主要依靠通勤数据指标,其直接反映了城市之间的相互关系及联系强度,具有较强的科学性与可信性[22].国内识别方法往往受制于缺乏城际通勤数据和体现地方政府意志,无法摆脱主观性局限,很难给予较为充分、值得信赖的划分标准[23].近些年来,以城市人口、非农人口为代表的实证方法得到较为广泛的应用[24],但其阈值的选择仍然受到质疑.另一方面,以R链、引力模型及场模型为代表的模型法被逐步应用到空间组织类型识别中[25-29],但指标选择及空间距离度量问题严重影响了城际联系判定的普适性和科学性.

因此,迫切需要探索新的方法判定城市密集地区的空间联系强度与类型.在信息化和移动终端普及化的背景下,通过甄别微博用户注册地和使用地的空间差异,统计不同城市间移动数据端的用户数量,可以较直观地表征城际经济社会联系强度的强弱,这种可获得的数据源弥补了由于缺乏真实城际通勤数据而导致的传统空间组织类型判别方法的不足.通过构建以多源微博信息数据库为基础、以空间数据挖掘和网络分析为支撑的区域社会经济联系强度判定方法,可以较准确地识别城市密集地区的空间联系强度和辐射范围.

随着即时通讯和共享平台的普及,以社交网络数据为代表的用户生成数据(VGI,volunteered geographic information)成为城市空间联系研究的新手段.主要通过网络抓取,获取社交网络平台中用户主动标记的地理位置信息.由于是网络公开数据,通过程序进行获取的途径较便捷,也具有更准确的时空精度.从目前的研究看,有国外学者通过社交网站 Flicker 的地理位置标签数据对城市功能分区进行研究[8],国内学者通过新浪微博用户关系数据对城市网络等级结构进行很有价值的研究[20, 30],但其中使用的地理信息数据尚仅限于微博用户的所在城市,用于城市群空间联系强度的研究尚未发现,值得进一步探索.

1.2 研究区域

中原城市群的经济规模位居中部6省经济圈的第1位,二、三产业增加值占GDP比重的近90%.在中国15个城市群中综合实力名列第7位.中原地区是河南省乃至中部地区承接发达国家及中国东部地区产业转移、西部资源输出的枢纽和核心区域之一,是促进中部崛起、辐射带动中西部地区发展的重要增长极,也是深入实施主体功能区划和新型城镇化背景下的区域空间组织快速演化的关键区域.近些年来,在全球化和区域一体化的背景下,有关中原地区的城市空间组织思路,诸如“中原城市群”、“中原经济区”、“郑汴洛一体化”等概念被相继提出.但是,受政府刚性指令和区际联系数据可获得性差的影响,城市群的空间辐射范围受到一定质疑.因此,本文所指的中原城市群(图 1),与大多数研究一致,包括郑州、洛阳、平顶山、新乡、焦作、开封、漯河、许昌、济源、禹州、长葛、卫辉、巩义、新郑、汝州、沁阳、舞钢、荥阳、辉县、新密、偃师、登封、孟州、尉氏、长垣、临颍、新安、宝丰、温县、原阳、武陟、孟津、博爱、栾川等.共8个地级市,47个县市.

Download:

图 1 河南省中原城市群

Fig. 1 Zhongyuan urban agglomeration in Henan province
1.3 数据来源与说明

新浪微博 2009 年上线,是目前中国市场占有率最高的微博类互联网应用;根据2015年微博在美国上市的 IPO 招股书,截至 2015 年 9 月,新浪微博拥有 2.12 亿月活跃用户,9月份的日均活跃用户高达 1亿人[31].

随着微博的广泛使用,越来越多的应用利用微博数据进行社交网络分析和数据挖掘.特别是带有地理标记信息(geotagged weibo)的微博,为空间数据挖掘工作提供了新思路.具体做法是,新浪微博官方提供各种 API 接口,可以通过创建应用的方式获取不同类别的用户公开信息;其中的地理信息 API 接口,可以获取用户账号、微博内容、发送时间、发送时地理位置(经纬度)等信息[32].本文运用新浪微博开放平台,创建自己的应用平台,通过调用新浪微博的API,抓取微博位置信息,得到并解析服务器返回的JSON(JavaScript Object Notation,是一种轻量级的数据交换格式文档).然后建立相应的空间数据库,储存在数据库中,实现全自动的位置抓取、解析和数据存储过程.

数据采用2014年1月至6月新浪微博中,河南省部分具有地理标记的微博数据作为基础.拟用微博使用推发地与注册地的差异,来表达人口的城际流动情况,从而表征两两城市之间的城际联系强度(图 2).总体而言,微博推送次数和各个中心城市的城区范围基本一致,这也一定程度上反映了微博用户分布的均衡性,可以从一个侧面反映各城市之间的联系强度.

Download:

图 2 河南省及中原城市群微博推送频次空间分布图

Fig. 2 Spatial distribution of Weibo in Henan province
2 结果与分析 2.1 地级市影响范围划定

分别以8个地级市和济源市为中心,测度其与研究区域内所有市、县的联系强度.采用Nature Break方法将城市联系强度划分为高、中、弱度联系3种,本文着重关注与中心城市有着高强度联系和中强度联系的城市,如表 1图 3所示.郑州市与本地级市内的巩义市、新郑市和中牟县有着高强度联系,与市区范围内的其他县级政区也存在中强度联系,与此同时,数据表明郑州市与洛阳市、开封市以及东北方向的新乡市存在中强度联系.洛阳市与郑州市、偃师市和伊川县有高强度联系,与本市内的其他县级政区均存在中强度联系.新乡市的城际联系强度情况与洛阳相似,除与郑州市、辉县市和长垣县有高强度联系外,与本市内的其他县级政区均存在中强度联系.平顶山市与郑州以及本市内其他政区均有高强度联系,与其具有中强度联系的城市分布较广,几乎包括研究区域内的所有地级城市(不涵盖济源市).开封市、焦作市与平顶山市有着相似的情况,与郑州以及本市内其他政区均有高强度联系,与其具有中强度联系的城市广泛分布.许昌市是区域内唯一与郑州市仅存有中强度联系的地级市,与本地级市内的其他县级政区联系紧密.济源作为省直辖的县级市,在本省内的干部配置按照地级政区对待,与区内的郑州、洛阳、平顶山等地级城市联系紧密,而与周边相邻的县级政区联系不紧密.

表 1 中原地区地级市的空间联系强度列表 Table 1 Spatial contact intensity of prefecture-level cities in the central area

Download:

图 3 中原地区省辖市的联系强度示意图

Fig. 3 Spatial contact intensity of provincially administered cities in the central area
2.2 城市群区域辐射范围识别

按照中原城市群内部核心城市与周边城市的联系强度,可以将其划分为3个圈层(图 4),分别为核心层、紧密层和联系层.

Download:

图 4 中原城市群的空间联系强度与圈层结构示意图

Fig. 4 Spatial contact intensity and layer structure of the central urban agglomeration

一是核心层,其主要是与郑州市存在高联系强度的区域,从辐射范围看,除郑州市市辖区,基本上覆盖周边的巩义市、荥阳市、新郑市和中牟县等,基本上整体覆盖郑州市市域范围.在这个圈层中,只有新密市和登封市处于中强度联系,今后需要加快融入郑州市的步伐.作为中原城市群的核心层,承担着辐射带动整个城市群的组织功能和引擎功能,因此,郑州市域内各县市的有机分工和融合成为下一步中原城市群发展的重要任务.

二是紧密层,按照中联系强度主要包括郑州市域、开封市辖区、洛阳市辖区和新乡市辖区的范围,为了有连续的区域划分,将几个中心城市之间的县市也纳入紧密层的研究范围,主要包括新乡县、原阳县、开封县、偃师市、孟州市、温县、武陟县等县市.这些市县的县域经济发展良好,和郑州市及开封、洛阳、新乡等地级市的经济联系比较紧密.

三是联系层,主要包括中原城市群范围内在紧密圈层之外的部分,与核心城市的联系强度较弱.这个圈层包括焦作、许昌、漯河、平顶山4个地级市、以及济源市、长葛市、禹州市、汝州市等经济实力较强的县级市,说明郑州市的辐射带动作用还有待加强,中原城市群的整体协作水平有待提高.

2006年,河南省发改委编制并发布《中原城市群总体发展规划纲要中原城市群总体发展规划纲要(2006—2020)》,明确提出在空间上形成3大圈层——以郑州为中心的都市圈(开封作为郑州都市圈的一个重要功能区)、紧密联系圈(其他7个结点城市)和辐射圈(接受城市群辐射带动作用的周边城市)[33].根据本文的研究,经过七八年的发展,政府提出的中原城市群的3大圈层尚未形成,特别是南翼3个中心城市尚未进入紧密联系圈的范围.开封与郑州的一体化进程加速,但功能融合还有待加强.

2.3 城市群区域联系的空间分异

进一步分析郑州市与周边8个中心城市的联系强度,可以看出明显的区域分异特征,总体上形成了 “一轴两翼”的城市群空间格局(图 5).其中,开封、洛阳在空间上与郑州相近,基础设施共享程度较高、经济社会联系等各方面也较为紧密,3个城市的发展方向也趋于集中,形成了中原城市群的发展主轴.北翼由新乡、焦作和济源组成,南翼包括平顶山、许昌和漯河.值得注意的是,北南翼与核心轴的联系强度迥异,与北翼各中心城市的联系强度要显著高于南翼.由于南翼交通通达性相对较差,交通网络不够完善,许昌市特别典型,即使与主轴空间相对临近,联系强度却相对较低.

Download:

图 5 中原城市群核心城市郑州与其他中心城市空间联系强度图

Fig. 5 Spatial contact intensities between Zhengzhou city and the other cities in the central urban agglomeration

为了推动区域整体发展,应当充分发挥中原城市群的组织和指挥经济发展的核心作用,通过中原城市群的带动和辐射,形成一种稳定的空间经济网络体系.通过跨越式和关联式相结合的产业转移模式为依托,形成有利于周边地区建立主导产业的新技术的跨越式协调与有利于达成周边地区与中原城市群之间共生链条相互促进的关联性协调.在积极建立外围县市与城市群空间和产业联系的同时,应当注重外围县市在发展的政策、发展的空间上不能均匀用力,而应当有所区别,有所侧重; 应当在政策上鼓励有条件的县市加快发展,如开封的尉氏县、许昌的长葛市、禹州市、洛阳的偃师市、平顶山的汝州市等,形成若干个新的次区域经济增长极,从而更加有利于融入中原城市群、实现区域协同发展.

3 结论与讨论

1) 城市群的形成与发展,具有自身的规律.城市群内部各个城市的空间联系强度,是城市群研究的一项重要内容.传统的引力模型和场强模型主要基于社会经济联系数据进行定量测算.随着微博、手机定位系统、大数据集成方法的发展,为城市群空间经济联系的测度提供了新的方法选择.本文试图通过城市群内部各城市间的微博数据发送量,探索测度城市群空间联系的新方法.研究发现,中原城市群的空间联系具有圈层性和空间不均衡性.目前基本形成了3大圈层:以郑州市市域范围为主的核心层、郑州市外围开封市、洛阳市、新乡市为主的紧密层和以焦作、济源、许昌、漯河、平顶山等城市及外围县市为主的联系层.其中,洛阳—郑州—开封一线已成为中原城市群内联系程度较密切的发展主轴,北向联系强度高于南向联系强度.从空间联系上看,中原城市群南北向联系强于东西向联系,西部和东部部分县市并没有完全融入中原城市群,今后应注意加强交通联系与产业协作.今后,应当充分发挥中原城市群的组织和指挥经济发展的核心作用,通过中原城市群的带动和辐射,形成一种稳定的空间经济网络体系.同时,应当注重外围县市在发展的政策、发展的空间上不能均匀用力,而应当有所区别,有所侧重; 应当在政策上鼓励有条件的县市加快发展,形成若干个新的次区域经济增长极,从而更加有利于融入中原城市群、实现城市群的互利共赢与区域协同发展.

2) 与传统统计数据相比,基于网络共享平台和移动终端的微博数据,具有即时性、共享性和获取方便的优势,弥补了由于缺乏真实城际通勤数据而导致的传统的城市群联系强度判别方法的不足,可以较准确地判别城市群地区各个城市的空间联系强度.另外,通过采用程序自动抓取的方式获得基于微博发送位置的数据库,比较高效可行,也是基于个体的多类别的数据信息,可以直接运用ArcGis等软件和程序进行空间分析.另外一方面,也要清楚认识新媒体和网络数据使用方面的局限性.根据《2015 年微博用户发展报告》,截至 2015 年 9 月30日,微博月活跃用户数(MAU)已经达到2.12亿人,普通用户占微博活跃用户的96%,且性别比例相对均衡;17~33岁青年群体构成移动互联网的主要用户,占全部移动用户的83%;拥有大学以上高等学历的用户是微博的主力用户,占比高达76%[31].总体上微博用户表现出年轻化、高学历的特征,用户群体和受教育程度具有局限性.同时,微博用户存在地址虚假注册的问题,但由于注册引导设置与用户习惯,一般认为该类总量不大.然而根据用户轨迹追踪等手段来予以甄别对修正大数据的有偏性还是有现实意义的.因此,微博数据只能是研究城市群空间联系的一种新视角和新方法,其他基于人流、物流、信息流的数据和统计是必不可少的重要方法,不能过度倚重网络共享平台的数据,只能作为城市群空间联系研究的一种参考和补充.

3) 作为一种新的数据来源和新的城市群空间联系强度和辐射范围的判别方法,目前才刚刚起步.基于这种新型数据来源的相关研究尚少,需要加强GIS分析手段与网络数据获取方法的研究,特别是基于手机位置移动的城市群内部各城市空间联系的强度,所获取的联系数据将更加客观而富有代表性,不断丰富和完善中国城市群和城市内部空间联系的理论与方法.

参考文献
[1] Batten. Network cities:creative urban agglomerations for the 21st century[J]. Urban Studies , 1995, 32 (2) :313–327. DOI:10.1080/00420989550013103
[2] Michael. Urban partnerships,governance and the regeneration of Britain's cities[J]. International Planning Studies , 2000, 5 (3) :273–298. DOI:10.1080/713672858
[3] 陆大道. 区域发展及其空间结构[M]. 北京: 科学出版社, 1995 .
[4] 陆大道. 关于"点-轴"空间结构系统的形成机理分析[J]. 地理科学 , 2002, 22 (1) :1–6.
[5] 罗小龙, 沈建法. 跨界的城市增长:以江阴经济开发区靖江园区为例[J]. 地理学报 , 2006, 61 (4) :435–445.
[6] Djankov S, Freund C. Trade flows in the former Soviet union, 1987 to 1996[J]. Journal of Comparative Economics , 2002, 30 (1) :76–90. DOI:10.1006/jcec.2001.1752
[7] Matsumoto H. International urban systems and air passenger and cargo flows:some calculations[J]. Journal of Air Transport Management , 2004, 10 (4) :239–247. DOI:10.1016/j.jairtraman.2004.02.003
[8] Hollenstein L, Purves R. Exploring place through user-generated content:using flicker tags to describe city cores[J]. Journal of Spatial Information Science , 2014 (1) :21–48.
[9] Glaeser E L. Learning in cities[J]. Journal of urban economics , 1999, 46 (2) :254–277. DOI:10.1006/juec.1998.2121
[10] Fuellhart K. Inter-metropolitan airport substitution by consumers in an asymmetrical airfare environment:Harrisburg, Philadelphia and Baltimore[J]. Journal of Transport Geography , 2003, 11 (4) :285–296. DOI:10.1016/S0966-6923(03)00005-X
[11] Shen G. Reverse-fitting the gravity model to inter-city airline passenger flows by an algebraic simplification[J]. Journal of Transport Geography , 2004, 12 (3) :219–234. DOI:10.1016/j.jtrangeo.2003.12.006
[12] 李春芬. 区际联系:区域地理学的近期前沿[J]. 地理学报 , 1995, 50 (6) :491–496.
[13] 顾朝林, 庞海峰. 基于重力模型的中国城市体系空间联系与层域划分[J]. 地理研究 , 2008, 27 (1) :2–10.
[14] 冷炳荣, 杨永春, 李英杰, 等. 中国城市经济网络结构空间特征及其复杂性分析[J]. 地理学报 , 2011, 66 (2) :199–121.
[15] 梅志雄, 徐颂军, 欧阳军, 等. 近20年珠三角城市群城市空间相互作用时空演变[J]. 地理科学 , 2012, 32 (6) :694–701.
[16] 潘竟虎, 石培基, 董晓峰. 中国地级以上城市腹地的测度分析[J]. 地理学报 , 2008, 63 (6) :635–645.
[17] 陈圆圆, 李宁, 丁四保. 城市群空间联系能力与SOM神经网络分级研究[J]. 地理科学 , 2011, 31 (12) :1461–1467.
[18] 王雅琦, 李宁, 苗建军. 基于潜力模型的中原城市群等级界定与划分[J]. 长治学院学报 , 2013, 30 (1) :16–19.
[19] 吴康, 方创琳, 赵渺希, 等. 京津城际高速铁路影响下的跨城流动空间特征[J]. 地理学报 , 2013, 68 (2) :159–174.
[20] 甄峰, 王波, 陈映雪. 基于网络社会空间的中国城市网络特征:以新浪微博数据为例[J]. 地理学报 , 2012, 67 (8) :1031–1043.
[21] 徐艳. 基于新浪微博视角的重庆市主城区城市网络空间分布规律研究[D]. 重庆:西南大学,2014:14-18. http://cdmd.cnki.com.cn/Article/CDMD-10635-1014264641.htm
[22] 李廉水, StoughR R. 都市圈发展:理论演化·国际经验·中国特色[M]. 北京: 科学出版社, 2006 .
[23] 薛凤旋, 杨春. 香港-深圳跨境城市经济区之形成[J]. 地理学报 , 1997, 52 (S1) :16–27.
[24] 胡序威, 周一星, 顾朝林. 中国沿海城镇密集地区空间集聚与扩散研究[M]. 北京: 科学出版社, 2000 .
[25] 顾朝林. 中国城市地理[M]. 北京: 商务印书馆, 1997 .
[26] 王桂圆, 陈眉舞. 基于GIS的城市势力圈测度研究:以长江三角洲地区为例[J]. 地理与地理信息科学 , 2004, 20 (3) :69–73.
[27] Deng Y, Liu S H, Wang L, et al. Field modeling method for identifying urban spheres of influence:a case study on central China[J]. Chinese Geographical Science , 2010, 20 (4) :353–362. DOI:10.1007/s11769-010-0408-2
[28] Wang K Y, Deng Y, Sun D W, et al. Evolution and spatial patterns of spheres of urban influence in China[J]. Chinese Geographical Science , 2014, 24 (1) :126–136. DOI:10.1007/s11769-013-0635-4
[29] 邓羽, 刘盛和, 蔡建明, 等. 中国中部地区城市影响范围划分方法的比较[J]. 地理研究 , 2013, 32 (7) :1220–1230.
[30] 王波, 甄峰, 席广亮, 等. 基于微博用户关系的网络信息地理研究:以新浪微博为例[J]. 地理研究 , 2013, 32 (2) :380–391.
[31] 新浪微博数据中心. 2015年微博用户发展报告[R/OL]. (2015-12-18)[2016-03-02]. http://www.useit.com.cn/thread-10921-1-1.html.
[32] 赵文宁. 基于用户生成数据的城市空间研究:以微博为例[C]//中国城市规划年会.城乡治理与规划改革:2014中国城市规划年会论文集(04城市规划新技术应用).北京:中国建筑工业出版社, 2014:1-12.
[33] 新浪网. 中原城市群全力"起跑"《中原城市群总体发展规划纲要》[R/OL].(2015-11-28)[2006-06-13]. http://news.sina.com.cn/o/2006-06-13/07279188696s.shtml.