2. 国家基础地理信息中心, 北京 100830;
3. 北京师范大学地理学与遥感科学学院, 北京 100875
2. National Geomatics Center of China, Beijing 100830, China;
3. School of Geography, Beijing Normal University, Beijing 100875, China
1 引 言
人口密度表达了人口在地理空间上的聚集程度,可揭示人口在空间分布上的差异[1],是国土规划、城乡建设和生态环境保护等领域的基础数据。传统的大区域人口密度估算主要利用人口统计数据与行政区划面积之比来进行,但由于行政单元的空间尺度较大,其结果只能反映人口的宏观分布,难以表达中微观人口分布差异,虽然有文献[1]提出将人口栅格化和文献[2]运用半方差函数将人口连续化来更好的表达人口分布,但其结果仍较难贴近实际[1, 2, 3, 4, 5, 6]。
随着遥感技术的发展,与人口相关的夜间灯光等数据不断涌现,土地利用/土地覆盖等数据的获取更加便捷,为大区域人口密度研究提供了新的机遇。依照使用遥感数据的不同,可将人口密度研究大致分为以下3类:①基于土地利用/土地覆盖遥感数据的人口密度估算,多运用多元回归模型、多因子加权融合等方法建立土地利用-土地覆盖各类型与人口数量的关系来估算人口密度[7, 8, 9, 10],这些方法较好地表达了宏观上的人口分布,但对城乡界限刻画模糊,难以表达人口空间分布的细节特征,同时,使用的土地利用数据大多具有区域性,难以向更大范围甚至全球推广;②基于遥感夜间灯光数据的人口密度估算,多借助夜间灯光数据的辐射特性与人口数量间的关系,建立重力场或多元回归等模型估算人口密度[11, 12, 13],该方法使人口空间分布的连续性得到较好的表达,但由于灯光数据的空间分辨率较粗,灯光强度对人口分布稀疏区域的敏感度较低,造成城乡边界模糊,乡村地区人口密度难以准确刻画和“伪城镇”等问题;③土地利用和灯光数据相结合的人口密度估算,多以土地利用和灯光数据为主,运用分区制图、多元回归加权等模型模拟人口密度[14, 15, 16],该方法结合了土地利用与灯光数据各自的优势,使得人口密度估算结果在千米尺度上呈现较好的结果,但在城乡边界确定以及乡村居民地界定等问题上,依旧存在不足。
综上所述,现有大区域人口密度估算主要存在以下问题:①使用的遥感数据空间分辨率大多较粗,难以反映城乡界限和乡村居民地分布,且普遍具有区域性,无法向更大范围推广;②估算结果集中在千米尺度,虽能较好地表达人口分布的宏观特征,但不能准确反映人口空间分布的细节特征。本文从城乡人口空间分布差异出发,用首套30 m全球地表覆盖数据(GlobeLand30)的人造地表数据层划分城乡范围,分别在城镇和乡村估算人口密度,并以山东省为例进行了大区域城乡人口密度模拟试验。
2 原理与方法 2.1 基本原理顾及城乡差异的大区域人口密度估算方法主要采用人口空间细分的思路,它将人口统计数据由行政单元分配到更小的空间单元上。图 1是某行政单元内部城乡居民地分布及其人口的细分。图中将人类活动的地理空间划分为城镇和乡村两个子区,并将人口进行分配。
在城镇区域,考虑到DMSP/OLS夜间灯光数据能够较好地反映出城镇内部人口的空间分布但无法准确刻画城镇居民地的空间范围,而GlobeLand30能较好地刻画居民地范围但难以表达居民地内部的人口分布,本文利用划分出的城镇区域来弥补DMSP/OLS灯光数据的不足,再用灯光强度与人口数间的相关性,将城镇人口落入30 m像元上。
在乡村区域,利用划分出的乡村居民地的空间分布来代替乡村人口的空间分布,同时考虑到遥感提取的居民地在复杂地形等区域会有损失的问题,本文基于乡村居民地空间异质性的样方估算对乡村居民地图斑面积进行修订,然后估算出乡村人口密度,见图 2。
2.2 估算方法基于GlobeLand30的城乡人口密度估算方法具体为:①在城镇区域,构建县域尺度上的平均夜间灯光强度与平均人口密度间的回归关系,再利用这种回归关系反推出县域内部每个像元上的人口数,即粗估算城镇人口密度,最后依据县域平均人口密度对粗估算城镇人口密度值进行修正,得出最终的城镇人口密度;②在乡村区域,首先依据居民地的空间聚集性,将研究区域划分为不同的区域,依照居民地的空间异质性在各区内构建样方,依照样方内居民地的实际面积与图斑面积间的关系,反推出整个研究区内的乡村居民地面积,并进一步得出最终的乡村人口密度,从而得出基于GlobeLand30的城乡人口密度模型
式中,PTi为第i个县的城镇人口数;counTi为第i个县的城镇灯光像元数;pixelArea为城镇灯光像元面积;edTi,j为第i个县镇内第j个像元上的粗估算人口密度; 为第i个县镇的粗估算人口密度的算术平均值;n为县镇总数;m为县镇内像元总数;PRi为乡村人口数;areaRi,k,h为第i个县内第k个聚集区中的第h个乡村居民地图斑面积;ak、bk为第k个聚集区内的面积改正系数;l为聚集区总数;s为聚集区内的乡村居民地图斑总数。这里edTi,j、ak和bk的解算在下文给出。 2.2.1 粗估算城镇人口密度本文直接利用夜间灯光强度信息来描述城镇人口的空间分布,并采用文献[11]提出的一元三次多项式模型来构建灯光强度与人口间的回归关系,将城镇人口由城镇图斑细划至其内部各夜间灯光像元。即在县级行政单元上,建立平均灯光强度和平均人口密度的回归关系得出回归系数,再用回归系数和夜间灯光像元强度推求出每个城镇像元上的粗估算城镇人口密度。其具体步骤为:
(1) 在最小行政单元上建立平均夜间灯光强度 与平均人口密度dTi间的回归关系,求出回归系数a、b、c
式中,dTi和 的计算分别对应式(3)和式(4) 这里,D为县域最大像元灯光强度值。(2) 由步骤(1)计算出的回归系数和夜间灯光像元强度,推求出城镇粗估算人口密度edTi,j
2.2.2 乡村居民地图斑面积改正系数GlobeLand30是通过遥感技术研制的,在人口稀疏的乡村区域会存在居民地面积上的损失,为确保估算中乡村居民地面积的准确性,需要对乡村居民地图斑面积进行改正。本文首先在乡村区域依照乡村居民地图斑的聚集度进行分区划分;其次在各分区内依据乡村居民地图斑的空间异质性进行样方的布设;最后运用回归估算的方法改正乡村居民地图斑面积。乡村居民地面积修正具体步骤为:
(1) 聚集区确定。在初步建立的乡村居民地图斑面积的不同差异区域内,本文针对乡村居民地分布的聚集性,运用核密度式(6)将乡村图斑面积差异性区域划分为不同的聚集区域,聚集区的划分通过自然分类法来求得
式中,k( )为核函数;h为带宽;(x-xi)表示估计点到事件Xi处的距离。(2) 地统计抽样。鉴于聚集区域内的乡村居民地数据量较多,依据乡村居民地的空间异质性,选取局部Moran’s I指数(式(7))和Z指数(式(9))来挑选空间相关性较弱(I,Z<0)的居民地图斑作为样本
式中,xi是特征i的一个属性; x是属性均值;wi,j是特征i和j的空间权重,且 式中(3) 样方的确定。在最大限度包含实际乡村居民地范围的条件下,常采用乡村居民地最优邻近距离的2倍来确定。
(4) 乡村居民地面积修正系数ak、bk的确定。在不同乡村居民地密集区域内,依据乡村居民地实际面积与图斑面积在样方中的回归关系求解
式中,TareaRi,h,k为第i个县内第k个聚集区中的第h个乡村居民地的实际面积。 3 试验与分析 3.1 试验数据研究所用的数据包括:①2010期GlobeLand30数据,该数据是国家基础地理信息中心研制的首套30 m全球地表覆盖数据集,包括水体、湿地、林地、草地、灌木地、人造地表、耕地、冰川和永久积雪、苔原、裸地等10个一级类型[17, 18],并提供全球免费下载使用(下载网址:www.globeland30.com),其人造地表数据层的用户精度为86.97%,被认为是目前反映全球城乡建设用地状况最翔实的数据集[19, 20];②2010年DMSP/OLS夜间稳定灯光强度遥感数据,该数据来源于美国军事气象卫星Defence Meteorological Satellite Program(DMSP)搭载的operational linescan system(OLS)传感器,产品空间分辨率为30″,是大尺度城市研究的重要数据[11, 13];③2010年全国第6次人口普查数据中的城镇人口与乡村人口[21];④1∶400万全国基础地理信息要素,该数据从国家基础地理信息系统全国1∶100万数据库派生,数据内容包括主要河流(5级和5级以上)、主要公路、所有铁路、居民地(县和县级以上)、境界(县和县级以上)及等高线(等高距为1000 m)等,数据来源于国家基础地理信息中心;⑤全球城乡人口分布数据(GRUMP),由国际地球科学信息网络中心(CIESIN)研制而成,建立在GPW版本的基础上,运用灯光阈值划分城乡居民用地范围,产品空间分辨率为30″,目前共有1990年、1995年和2000年3个版本[12, 16]。
3.2 试验过程与结果本文在山东省进行了人口密度估算试验。试验中,所有的空间数据转换成Lambert等积方位投影,用双线性内插法将DMSP/OLS夜间灯光栅格数据重采样为30 m。2010年山东省GlobeLand30与DMSP-OLS夜间灯光数据见图 3。在城乡居民地范围划分中,使用镇级以上的百万居民点数据与GlobeLand30人造地表数据进行位置叠加,并利用人工检核的方式修正城乡划分结果。
3.2.1 山东省城镇粗人口密度估算在行政区划内,建立了平均灯光强度与平均人口密度之间的一元三次回归关系(拟合优度为0.939 9),将其运用至像元水平,从而得出山东省城镇粗估算人口密度。
3.2.2 山东省乡村居民地面积修正试验中样方大小为1500 m×1500 m,抽取的样方数为2543个,其空间分布如图 5。通过人工勾绘的方式确定乡村居民地在高分影像(Google Earth)上的范围作为实际乡村居民地范围。在样方内建立各等级区上的乡村居民地图斑面积与实际面积之间的回归关系,推算出山东省的乡村居民地图斑修正后的面积值。
为验证估算后得出的乡村居民地图斑修正面积,本文在山东省随机抽选了3个县区,这3个县区均覆盖多个分区分类别估算区域。然后对抽取县区内的乡村居民地实际面积与修正面积进行比较(表 1)。通过比较发现,修正前后的乡村居民地的修正幅度均在28%以上,修正后的乡村居民地与实际乡村居民地之间面积的差异较小。
县、市(区) | 修正前的乡村居民地面积G/km2 | 修正后的乡村居民地面积X/km2 | 实际乡村居民地面积Y/km2 | 修正幅度系数C | 差异率/(%) |
德州 | 25.32 | 32.52 | 33.04 | 1.29 | 1.60 |
胶南 | 75.64 | 96.85 | 95.64 | 1.28 | -1.25 |
曹县 | 213.14 | 287.75 | 296.42 | 1.35 | 2.92 |
注:差异率=100%(Y-X)/Y;修正幅度系数C=X/G 。 |
山东省城乡人口密度估算结果(图 6(a))和山东省县域平均人口密度估算结果(图 7)显示,山东省人口分布的空间差异性显著,信息较为丰富:①北部和西南部平原地区城镇分布密集,人口较多,中部山地和东部丘陵地区人口分布相对稀疏,总体呈现较为杂乱的分布格局;②人口密度的高低与到城市中心的距离在分布趋势上呈现近似正比关系,城镇区域人口聚集度高于乡村区域,而乡村区域人口在总体上向城镇聚集,且随着距离城镇的距离越近,人口密度值越高,将结果放大至单个城市,在滕州市郊区(图 6(c)),人口从乡村向城镇聚集,城镇中心处人口聚集度最高,其中城镇南部中的厂房较多,导致人口密度值较低,且向城中心聚集;③城镇人口密度高于乡村人口密度,2010年城镇平均估算人口密度在7 077.39人/km2左右,而乡村平均估算人口密度在3 484.36人/km2左右。
3.3 对比分析为探索本文估算方法的有效性,本文从定量和定性两个角度来衡量估算结果。
3.3.1 定量分析在山东省随机选取20个居民地图斑进行估算结果的验证。用由第6次人口普查中得出的县级户均人口数与居民地图斑面积的乘积来表示图斑上的真实人口数,通过计算真实值与估算值之间的差异来表示估算结果的准确度。计算结果表明样本图斑上的真实人口数与估算人口数在变化趋势上基本保持一致(图 8),在数值上仍存在一定的差距,但这种差距不大,保持在一个数量级以内。
3.3.2 定性分析选取GRUMP数据进行趋势对比分析。在总体分布规律上,两种山东省人口密度数据基本吻合,均呈现西南高、东北低,总体上杂乱无章的分布态势。此外,本文估算结果相对于GRUMP,具有以下3方面的优势:①在空间分辨率上,本文的估算结果要优于GRUMP约2个数量级,本文估算结果的最小空间分辨率为30 m,而GRUMP的最小空间单元为30″,局部放大至滕州市城乡结合处(图 6(c)和图 6(d)),GRUMP还会出现明显的马赛克现象;②在城乡范围划分和居民地轮廓描述上,本文是在30 m尺度上依照空间位置和人工校核来确定城乡居民地范围,无论在城镇还是乡村,均能表达居民地的外围轮廓细节,而GRUMP则是依靠灯光强度阈值划分城乡范围,其估算结果的城镇边界轮廓较为圆滑,对于轮廓细节的表现上较差,同时乡村范围被定义为除去城镇之外的行政区域,无法反映乡村居民地的分布;③在人口空间分布的表现上,本文的估算结果相对于GRUMP较好的表现了城镇内部人口空间分布的差异性和连续性,也能较好地反映乡村人口的空间分布(图 6(c)和图 6(d))。
4 结论与讨论本文针对以往人口密度估算结果空间分辨粗,无法准确反映城乡人口空间分布及其差异的问题,将GlobeLand30人造地表数据引入城乡人口密度估算中,并在山东省进行了试验。通过将试验结果与GRUMP数据进行趋势对比分析发现:两者在总体趋势上保持着较好的一致性,且由本文估算结果在空间分辨率上高出GRUMP约2个数量级,表达的城乡人口空间分布较GRUMP更精细。
本文的人口密度估算方法是对基于GlobeLand30数据和城乡人口差异模拟人口密度研究的一次尝试。在应用范围上,只要在GlobeLand30和DMSP/OLS夜间灯光数据覆盖的区域,该方法均能进行,具有较好的普及性。整个试验耗时10 d左右,其中大部分时间耗费在乡村居民地图斑面积估算上,未来将对方法进一步完善,并将人口密度估算工作推广至其他省市乃至全国或更广的区域。不难预见,随着GlobeLand30数据的应用和推广,GlobeLand30数据产品将在人口密度等社会经济研究领域发挥巨大的作用。
致谢:感谢同济大学硕士研究生孟雯同学给出的样本抽样理论指导性建议。
[1] | JIN Jun, LI Chengming, YIN Jie, et al. Investigation on the Model for Spatial Distribution of Population Data[J]. Acta Geodaetica et Cartographica Sinica, 2003, 32(3): 278-282. (金君, 李成名, 印洁, 等. 人口数据空间分布化模型研究[J]. 测绘学报, 2003, 32(3): 278-282.) |
[2] | LÜ Anming, LI Chengming, LIN Jianzhong, et al. Spatial Continuous Surface Model of Population Density[J]. Acta Geodaetica et Cartographica Sinica, 2003, 32(4): 344-348. (吕安民, 李成名, 林宗坚, 等. 人口密度的空间连续分布模型[J]. 测绘学报, 2003, 32(4): 344-348.) |
[3] | GE Meiling, FENG Zhiming. Population Distribution of China Based on GIS: Classification of Population Densities and Curve of Population Gravity Centers[J]. Acta Geographica Sinica, 2009, 64(2): 202-210. (葛美玲, 封志明. 中国人口分布的密度分级与重心曲线特征分析[J]. 地理学报, 2009, 64(2): 202-210.) |
[4] | HE Zongyi, HU Anhua, LIU Liwei, et al. Dasymetric Estimation of Census Population Density: A Geostatistical Approach[C]//Proceedings of the 17th International Conference on Geoinformatics.Fairfax, VA:IEEE, 2009: 1-6. |
[5] | LI Sha, LIU Weidong. Spatial Distribution of Population in Russia and Its Evolution[J]. Economic Geography, 2014, 34(2): 42-49. (李莎, 刘卫东. 俄罗斯人口分布及其空间格局演化[J]. 经济地理. 2014, 34(2): 42-49.) |
[6] | LIU X H, KYRIAKIDIS P C, GOODCHILD M F. Population-density Estimation Using Regression and Area-to-point Residual Kriging[J]. International Journal of Geographical Information Science, 2008, 22(4): 431-447. |
[7] | TIAN Yongzhong, CHEN Shupeng, YUE Tianxiang, et al. Simulation of Chinese Population Density Based on Land Use[J]. Acta Geographica Sinica, 2004, 59(2): 283-292. (田永中, 陈述彭, 岳天祥, 等. 基于土地利用的中国人口密度模拟[J]. 地理学报, 2004, 59(2): 283-292.) |
[8] | HARVEY J T. Population Estimation Models Based on Individual TM Pixels[J]. Photogrammetric Engineering & Remote Sensing, 2002, 68(11): 1181-1192. |
[9] | LIAO Shunbao, SUN Jiulin. GIS Based Spatialization of Population Census Data in Qinghai-Tibet Plateau[J]. Acta Geographica Sinica, 2003, 58(1): 25-33. (廖顺宝, 孙九林. 基于GIS的青藏高原人口统计数据空间化[J]. 地理学报. 2003, 58(1): 25-33.) |
[10] | TIAN Yongzhong, YUE Tianxiang, ZHU Lifen, et al. Modeling Population Density Using Land Cover Data[J]. Ecological Modelling, 2005, 189(1-2): 72-88. |
[11] | ZHUO Li, CHEN Jin, SHI Peijun, et al. Modeling Population Density of China in 1998 Based on DMSP/OLS Nighttime Light Image[J]. Acta Geographica Sinica, 2005, 60(2): 266-276. (卓莉, 陈晋, 史培军, 等. 基于夜间灯光数据的中国人口密度模拟[J]. 地理学报, 2005, 60(2): 266-276.) |
[12] | DEICHMANN U, BALK D, YETMAN G. Transforming Population Data for Interdisciplinary Usages: From Census to Grid[EB/OL].[2001-10-01]. http://sedac.ciesin.org/downloads/docs/gpw-v3/gpwdocumentation.pdf. |
[13] | YANG Mei, WANG Shixin, ZHOU Yi, et al. Review on Applications of DMSP/OLS Night-time Emissions Data[J]. Remote Sensing Technologyand Application, 2011, 26(1): 45-51. (杨眉, 王世新, 周艺, 等. DMSP/OLS夜间灯光数据应用研究综述[J]. 遥感技术与应用, 2011, 26(1): 45-51.) |
[14] | DOBSON J E, BRIGHT E A, COLEMAN P R, et al. LandScan: A Global Population Database for Estimating Populations at Risk[J]. Photogrammetric Engineering &Remote Sensing, 2000, 66(7): 849-857. |
[15] | BHADURI B, BRIGHT E, COLEMAN P, et al. Urban LandScan USA: A High-resolution Geospatial and Temporal Modeling Approach for Population Distribution and Dynamics[J]. GeoJournal, 2007, 69(1-2): 103-117. |
[16] | BALK D, YETMAN G, SHERBININA D. Construction of Gridded Population and Poverty Data Sets from Different Data Sources[C]//E-proceedings of European Forum for Geostatistics Conference.Tallinn,Estonia: EFG,2010: 12-20. |
[17] | CHEN Lijun, CHEN Jun, LIAO Anping, et al. Preliminary Classffication Results for Global Land Cover Mapping at 30 Meters Resolution[J]. Bulletin of Surveying and Mapping, 2012(S1): 350-353,361. (陈利军, 陈军, 廖安平, 等. 30m全球地表覆盖遥感分类方法初探[J]. 测绘通报, 2012(S1): 350-353,361.) |
[18] | CHEN Jun, CHEN Jin, LIAO Anping, et al. Concepts and Key Techniques for 30m Global Land Cover Mapping[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(6): 551-557. (陈军, 陈晋, 廖安平, 等. 全球30m地表覆盖遥感制图的总体技术[J]. 测绘学报, 2014, 43(6): 551-557.) |
[19] | CHEN Jun, LIAO Anping, CHEN Lijun, et al. The Content and Composition of 30 Meters Resolution Artificial Land Cover Dataset(2010)[J]. 2014, 69(sup),DOI:10.3974/geodb.2014.02.02.v1.(陈军, 廖安平, 陈利军, 等. 全球30米分辨率人造地表覆盖数据集(2010)[J/OL].地理学报, 2014, 69(增刊),DOI:10.3974/geodb.2014.02.02.v1.) |
[20] | CHEN Jun, CHEN Jin, LIAO Anping, et al. Global Land Cover Mapping at 30m Resolution: A POK-based Operational Approach[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014, 103: 7-27. |
[21] | MA Jiantang,ZHANG Weimin,LUO Lan.China Statistical Year Book (2011)[M]. Beijing: China Statistics Press, 2011. (马建堂, 张为民, 罗兰. 中国统计年鉴(2011)[M]. 北京: 中国统计出版社, 2011.) |