中国科学院大学学报  2020, Vol. 37 Issue (1): 83-92   PDF    
大面积建成区建筑密度遥感制图产品的精度验证
王帅1,2, 覃驭楚1, 杨富坤1,2     
1. 中国科学院遥感与数字地球研究所 遥感科学国家重点实验室, 北京 100101;
2. 中国科学院大学资源与环境学院, 北京 100049
摘要: 大面积建成区建筑密度遥感制图产品能够提供土地开发强度与人类居住环境的基础信息,是支撑人居环境研究和土地利用规划的重要数据。全球人类居住区层(global human settlement layer,GHSL)是由欧盟联合研究中心负责的大面积人居环境制图项目,建成区建筑密度遥感制图产品是GHSL重要的组成部分。目前该产品在欧美地区已经完成了GHSL建成区建筑密度遥感制图产品的验证。然而以中国为代表的东亚区域的建筑物形态和城市布局与欧美等区域有较大的差别,有必要在亚洲地区对其进一步验证。以中国的5个典型城市(上海、西安、长春、昆明和乌鲁木齐)大面积单体建筑物分布图为基础,通过聚合分析和邻域关键点搜寻匹配等算法,生成中国建成区建筑密度栅格图像产品作为验证数据,然后通过回归分析等方法,在像元尺度上对GHSL建成区遥感制图产品进行评价验证。结果显示,GHSL建成区建筑密度产品在较低分辨率下可以反映中国地区建筑密度情况,但在较高分辨率下在高值区过高估计密度。本研究可以为中国地区研发建成区建筑面积密度产品提供依据。
关键词: 全球人类居住区层    建成区面积    单体建筑分布图    验证    
Validation for building density remote sensing products of built-up areas at large scale
WANG Shuai1,2, QIN Yuchu1, YANG Fukun1,2     
1. State Key Laboratory of Remote Sensing Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100101, China;
2. College of Resources and Environment, University of Chinese Academy of Sciences, Beijing 100049, China
Abstract: Building density map (BDM) product derived from remotely sensed imagery over large areas is the vital data set for supporting studies of human settlement environment and land use planning. GHSL (global human settlement layer) is a mapping project for developing human settlement map product with remotely sensed data. It is sponsored by the Joint Research Center of European Commission. The BDM is an important component of GHSL. Currently, the BDM of GHSL has been validated over Europe and America. However, the shapes of buildings and the landscape patterns of urban areas in East Asia, especially in China, are significantly different from those in the EU and US, and the validation of BDM over Asia is vital for further applications of the GHSL products. This study takes large area individual building footprint data sets over 5 typical mega cities (Shanghai, Xi'an, Changchun, Kunming and Urumqi) as ground truth through the pixel aggregation and the neighboring points searching and location matching, and the ground truth map of the building density is produced as the validation data set. With regression analysis, the method for BDM assessment is explored by calculating accuracy indicators over large metro-areas in China. The results show that the GHSL building density products of built-up areas reflect the densities of buildings in China at lower resolutions, but at higher resolutions they overestimate the densities in high-value areas. This study provides a basis for research and development of built-up area density products in China.
Keywords: GHSL(global human settlement layer)    built-up area    individual building footprint data    validation    

土地覆盖是开展地表生态环境研究的重要内容,在土地覆盖/土地利用变化、环境污染、土地退化、生物多样性丧失等问题日趋严重的情况下,及时可靠的全球土地覆盖制图产品是地表生态环境研究的基础数据[1]。城市化是人类影响地表土地覆盖最显著的因素,目前全世界超过50%的人口居住在城市地区,而这一比例在1950年仅为30%,预计到2050年,城市人口会达到世界人口总数的66%[2]。虽然城市仅仅覆盖地球表面相对较小的部分,但城市区域的研究对人类住房需求、气候变化研究与应对、灾害风险防范以及城市发展等可持续发展目标有着至关重要的作用[3-4]。然而,目前并没有经过严格数据质量检验的全球尺度居民地制图产品来支撑地表生态环境变化的研究[5-6],因此研发大尺度建成区建筑密度遥感估算模型与算法,形成大尺度、长时间序列的建设区遥感制图产品就成为亟待解决的问题。

全球人类居住区层(global human settlement layer,简称GHSL)是由欧盟联合研究中心(Joint Research Centre,简称JRC)负责的大面积人居环境制图项目。全球人类居住区层为过去40年(1975—2015年)建筑和人口的增长提供了详细的数据,该资料中包含关于城市化评估、土地覆盖变化、城市规划和管理等[4, 7-9]较为全面的数据资料。GHSL是利用陆地卫星遥感影像提取的一套全球人类居住区制图产品。研究人员提出一种基于符号机器学习的新分类方法[10-11],利用尽可能长时间序列的遥感数据提取人居环境信息。GHSL尝试采用全球MSS(multispectral scanner sensor)数据进行人类居住地信息提取,这也是已知的首次探索使用数字高程模型数据辅助生成全球居民地制图产品的尝试。GHSL建成区建筑密度遥感制图产品作为实验性的产品,目前在欧洲和美国地区完成验证[5],该验证主要采用欧洲联盟统计办公室(EUROSTAT)发布的大面积实地调查数据和高于1:10000比例尺的建筑足迹数字制图产品作为验证数据集。其中GHSL在欧美的验证中使用LUCAS(land use/cover area frame survey)调查收集的土地覆盖类别[12],研究人员将人工土地类别(也称建筑类)划分为3个子类,即低建筑、高建筑和温室。低建筑指的是1~3层或者10m以下的建筑;高建筑指的是3层或者10m以上的房屋类建筑;温室指的是玻璃、塑料或者其他半透明但不透水的材料建造的建筑物。研究人员将LUCAS调查的高建筑、低建筑、温室等3种土地类别数据重分类为一个单独的建筑类,通过像元聚合构建与GHSL建成区建筑密度遥感制图产品相同空间分辨率的验证数据集,最后通过相关分析评价产品精度。从验证结果看,GHSL建成区建筑密度遥感制图产品与建筑物密度具有较好的相关性,GHSL在欧美区域是一个很好的建成区面积数据产品。然而,目前GHSL建成区建筑密度遥感制图产品在亚洲地区尤其是中国的高密度城市地区缺乏相应的精度信息。由于亚洲地区和欧洲地区人口分布密度、生态及建筑构造等因素存在很多方面的不同,GHSL在亚洲特别是中国区域的验证也就成为数据产品进一步应用的关键问题。本文主要致力于对GHSL的建成区建筑密度遥感制图产品在中国典型城市的精度进行验证与分析,以便于为GHSL数据在中国乃至于亚洲地区的应用提供可参考的精度信息。

本文主要以上海、西安、长春、昆明及乌鲁木齐5个城市单体建筑物分布图为基础数据,通过对单体建筑矢量数据的聚合,得出与JRC发布的建成区建筑密度遥感制图产品同等分辨率(250与1000m)的中国建成区面积密度栅格图像产品作为验证数据评估GHSL建成区建筑密度遥感制图产品在中国地区的精度,以期为GHSL建成区建筑密度遥感制图产品在中国地区的应用提供可参考的精度信息。

1 研究区域和数据介绍 1.1 研究区域

本研究选取中国不同地域的5个城市作为研究区域,东北地区选取长春,华东地区选取上海,西南地区选取昆明,西北地区选取乌鲁木齐和西安。由于5个城市的发展状态和人口数量不同,建筑物形态和分布也会存在差别,因此,本文选择的5个城市可作为中国大部分地区城市建成区建筑密度的代表。选取的5个城市的地理位置如图 1所示。

Download:
图 1 研究区示意图 Fig. 1 Study areas
1.2 数据介绍

建成区建筑密度通常用单位面积中单体建筑面积占用比例表示。本文从百度地图中提取的单体建筑物数据,处理得到250与1000m分辨率的建筑物密度数据作为验证数据,对GHSL建筑物密度产品数据进行验证。

1.2.1 GHSL产品数据

建成区产品使用的统计数据是随时间变化的卫星影像中提取的建筑信息,以1975、1990、2000和2014年4个时间节点为中心形成时间序列,统计建筑面积的变化。每个时间序列又分为38、250和1000m分辨率建成区产品。本文选取GHSL最新产品数据,即2014年250与1000m分辨率的建成区遥感制图产品在中国地区进行验证。GHSL建成区建筑物密度遥感制图在上海地区的示例如图 2所示。

Download:
图 2 GHSL建成区建筑物密度遥感制图(上海) Fig. 2 GHSL BDM of built-up areas (Shanghai)
1.2.2 单体建筑数据

在本次验证中所需的验证数据以地面真实建筑轮廓为依据,由于手工绘制单体建筑分布图耗时耗力,因此从百度地图(https://map.baidu.com/)最高缩放等级19级,根据房屋特征获取建筑物轮廓二值图(2017年获取),然后经过拼接、滤波、矢量化和配准等操作得到单体建筑轮廓的矢量数据。利用此方法获取乌鲁木齐、长春、上海、昆明和西安5个中国省会城市单体建筑物分布图。选取覆盖市中心的18km×18km的正方形研究区域。每个城市获取的建筑轮廓数据范围如图 3所示。

Download:
图 3 5个城市内研究范围的单体建筑分布图 Fig. 3 Individual building distributions in the study scopes of the five cities
2 数据处理

GHSL建成区建筑密度遥感制图产品的验证,需要将百度(BD)地图中提取处理的单体建筑矢量数据聚合成与GHSL建成区建筑密度产品同等分辨率的影像。处理过程如图 4所示。

Download:
图 4 数据聚合流程图 Fig. 4 Flow chart of data aggregation

具体处理可分为以下4个步骤:

1) 生成格网:将单体建筑矢量数据转换成与GHSL建成区建筑密度遥感制图产品空间分辨率一致的栅格数据,需要有与GHSL建成区建筑密度遥感制图产品栅格位置一致的矢量格网数据。因此,利用GHSL建成区建筑密度遥感制图产品的栅格数据生成1000m分辨率的本文所需的格网。

2) 交集运算:将格网与单体建筑矢量数据进行交集运算,以将单体建筑矢量数据的属性叠加到每个网格中。

3) 建筑面积密度计算:建筑面积密度的计算公式为

$ P_{i, j}=S_{i, j} / S, $ (1)

式中:Pi, j是每个网格中的建筑密度,Si, j是第(i, j)个网格中单体建筑的面积,S是网格面积。

4) 矢量转栅格:将带有建筑密度属性的网格数据转换成栅格数据,得到本文需要的建筑密度验证数据。

3 结果与分析

由于GHSL建筑物密度产品为2014年数据产品,而获取的BD建筑物密度数据为2017年更新数据,因此在谷歌地图上选择2014年12月影像数据与2016年12月影像数据进行目视对比(如图 5所示),发现5个城市在研究区域内地物变化不大,并且所选区域为城市主城区,城区内拆建对研究影响并不明显,因此可以保证两个时期建筑物密度对比结果有一定的指示意义。

Download:
图 5 5个城市研究区域2个时期(2014年12月与2016年12月)谷歌地图对比 Fig. 5 Comparison between Google maps in December 2014 and in December 2016 for the five urban research areas

将BD建筑物密度数据处理得到与GHSL建筑物密度产品同一分辨率下,并且在同一色度范围(0~1)内进行对比。如图 6所示,GHSL建筑物密度数据相比BD建筑物密度数据在整体上要偏高,但是数据高值区与低值区分布相似,1000m分辨率的影像对比中更加明显。由于GHSL建筑密度数据是由Landsat 30m分辨率数据得到,在建筑分类时受到混合像元的影响[5, 13],部分道路(尤其是沥青混凝土道路)、绿化等会混入像元中,因此对于单一像元会产生较大的误差,这种误差会造成整体建筑物密度偏高;并且对于大部分为绿化或者道路的像元中,如果混入建筑物,单栋建筑和被植被包围的小型聚落形态的建筑难以识别,会使得建筑物密度偏低。

Download:
图 6 250与1000m分辨率下5个城市研究区域BD建筑密度分布图与GHSL建筑密度图 Fig. 6 BD built-up areas map and GHSL built-up areas products in the five urban research areas at the 250 and 1000m resolutions

为了更加直观地对GHSL建筑物密度数据与BD建筑物密度数据进行对比,本文对上海、长春、西安、乌鲁木齐和昆明5个城市研究区域内的像元进行统计,在250与1000m分辨率下对不同密度等级下的像元数进行柱状图统计(图 7),并得到不同城市在不同密度等级下像元占比,如表 1所示。除昆明外,其他4个城市GHSL建筑密度主要集中于0.8以上,占比超过50%,尤其是上海和长春建筑相对密集的城市,其占比超过70%;BD建筑密度主要集中于0~0.3,由于是对单体建筑物进行提取,在进行栅格处理时不会受到混合像元的影响,因此可以认为BD建筑密度数据为城市建筑密度真实值。结合图 5图 6可以看出,昆明城市区域建筑相对稀疏,在建筑密度上主要集中于0.4以下。

Download:
图 7 250与1000m分辨率下5个城市研究区域内建筑密度各等级像元数柱状图统计 Fig. 7 Histogram statistics of building density in the five urban research areas at the 250 and 1000m resolutions

表 1 250与1000m分辨率下5个城市研究区域内建筑密度各等级像元数占比 Table 1 Proportions of building density in the five urban research areas at the 250 and 1000m resolutions %

为了定量验证GHSL建筑物密度产品,对GHSL建筑物密度数据与BD建筑物密度数据进行逐像元对比。如图 8图 9所示,相比BD建筑密度,GHSL建筑密度数据存在较多的高值,尤其是在250m分辨率下。1000m分辨率下各个城市研究区像元对比得到的R整体高于250m分辨率。并且相比于250m分辨率对比结果,5个城市在1000m分辨率下对比验证的均方根误差(RMSE)整体偏低,RMSE均小于0.1,因此在实际应用中,GHSL建筑物密度产品数据在较低分辨率时,有更高的应用价值。

Download:
图 8 GHSL建筑密度数据与BD建筑密度数据回归分析结果(250m) Fig. 8 Regression analysis results of GHSL built-up areas product and BD built-up areas map (250m resolution)

Download:
图 9 GHSL建筑密度数据与BD建筑密度数据回归分析结果(1000m) Fig. 9 Regression analysis results of GHSL built-up areas product and BD built-up areas map (1000m resolution)
4 结论

本研究主要开展JRC研发的GHSL建成区建筑密度遥感制图产品在中国区域的验证对比工作,选取5个代表性城市划定研究区域,提供GHSL建成区建筑密度遥感制图产品定量化的质量评价信息,为该数据产品在中国地区的应用提供参考依据。根据分析结果得到的主要结论如下:

BD建成区建筑密度数据与GHSL建成区建筑密度遥感制图产品数据存在良好的线性关系,特别是在1000m分辨率下,GHSL建成区建筑密度遥感制图产品可以基本反映中国地区建成区建筑密度。

在GHSL中,建筑物类被定义为特定传感器收集的所有空间单元的联合,包含建筑或它周围的一部分[11]。由于混合像元的影响,单一像元内会包含单体建筑物、道路、植被以及建筑物本身阴影等信息[5, 13],在建筑较密集地区, 道路(尤其是沥青混凝土道路)和建筑区域的混淆都可能被误分为建筑区域, 因此GHSL建筑密度产品会呈现明显的高估现象;由于所使用的Landsat图像分辨率为30m,在这种分辨率下,单体建筑和被植被包围的较小建筑聚落可能难以识别,因此在相对较低的建筑聚集区建筑密度呈现低估的现象。

本研究只在5个城市开展了产品验证与精度评价的探索研究,未来将继续收集覆盖全中国的地面单体建筑分布图,在开展GHSL建筑密度产品精度验证的基础上,研发中国全境范围内的建成区建筑密度遥感制图产品。

参考文献
[1]
Ban Y F, Gong P, Gini C. Global land cover mapping using Earth observation satellite data:recent progresses and challenges[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 103: 1-6. Doi:10.1016/j.isprsjprs.2015.01.001
[2]
Crocker-Buque T, Mindra G, Duncan R, et al. Immunization, urbanization and slums:a systematic review of factors and interventions[J]. BMC Public Health, 2017, 17(1): 556. Doi:10.1186/s12889-017-4473-7
[3]
杨朝斌, 张树文, 卜坤, 等. 高分辨率遥感影像在城市LUCC中的应用[J]. 中国科学院大学学报, 2016, 33(3): 289-297.
[4]
陈晋, 卓莉, 史培军, 等. 基于DMSP/OLS数据的中国城市化过程研究:反映区域城市化水平的灯光指数的构建[J]. 遥感学报, 2003, 7(3): 168-175.
[5]
Pesaresi M, Corbane C, Julea A, et al. Assessment of the added-value of Sentinel-2 for detecting built-up areas[J]. Remote Sensing, 2016, 8(4): 299. Doi:10.3390/rs8040299
[6]
Pesaresi M, Ehrlich D, Ferri S, et al. Global human settlement analysis for disaster risk reduction[J]. ISPRS International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2015, XL-7/W3(7): 837-843.
[7]
Chrysoulakis N, Feigenwinter C, Triantakonstantis D, et al. A conceptual list of indicators for urban planning and management based on earth observation[J]. ISPRS International Journal of Geo-Information, 2014, 3(3): 980-1002. Doi:10.3390/ijgi3030980
[8]
何春阳, 曹鑫, 史培军, 等. 基于Landsat 7 ETM+全色数据纹理和结构信息复合的城市建筑信息提取[J]. 武汉大学学报(信息科学版), 2004, 29(9): 800-804.
[9]
Godefroid S, Koedam N. Urban plant species patterns are highly driven by density and function of built-up areas[J]. Landscape Ecology, 2007, 22(8): 1227-1239. Doi:10.1007/s10980-007-9102-x
[10]
Pesaresi M, Syrris V, Julea A. Benchmarking of the symbolic machine learning classifier with state of the art image classification methods: application to remote sensing imagery[R]. EUR-Scientific and Technical Research Reports JRC97964, 2015.
[11]
Pesaresi M, Daniele E, Stefano, et al. Operating procedure for the production of the global human settlement layer from Landsat data of the epochs 1975, 1990, 2000, and 2014[R]. EUR-Scientific and Technical Research Reports JRC97705, 2016.
[12]
Eurostat. LUCAS, the EU's land use and land cover survey[M]. Luxembourg: The Publications Office of the European Union, 2013.
[13]
王永刚, 王振亚, 王宏斌. 基于高分辨率遥感影像的建筑物轮廓信息提取[J]. 国土资源信息化, 2008(5): 7-11.