2. 上海市商务委员会, 上海 200125;
3. 上海健康信息协同研究中心, 上海 200041
2. Shanghai Municipal Commission of Commerce, Shanghai 200125, China;
3. Shanghai Health Information Center, Shanghai 200041, China
为防止药店在人口集中区域“扎堆”开设,随着近年来上海市人口分布、经济发展重心、城镇化水平等发生巨大变化,药品零售终端的空间布局应进行相应的调整。受2001年出台的《上海市转发市商委等五部门关于加强本市药品零售业规划和管理意见的通知》(沪府办发〔2001〕45号)规制,对环境有着极高敏感度的药品零售业发展缓慢,局限开始显现。自Porter[1]提出地理上的接近性可使企业获得国家竞争优势并促进产业发展以来,集聚研究成为了产业经济发展所关注的焦点。集聚效应产生的区域品牌影响力和内化的竞争动力可助力药品零售产业的蓬勃发展,因此,上海市有必要打造零售药店集聚区。现阶段,上海市表面上已形成了若干个零售药店分布密集区,为进一步确认集聚程度,本研究进行上海市零售药店布局空间集聚研究。由于数据条件、数据处理软件等原因,我国集聚研究多使用基尼系数、H指数、Ellison-Glaeser模型等方法对企业进行集聚程度的静态分析[2],而忽视了对象的空间特征。然而,作为一种地理上的资源汇聚,集聚所产生的种种效应在很大程度上会受空间位置的影响,即空间上邻近的数据通常会比较远的数据具有更高的相似性。故应将数据的空间属性纳入分析,包括方位、距离、邻接性等。本研究结合Anselin[3]等创立的空间统计学方法,通过R语言、ArcGIS软件、OpenGeoDa等空间数据分析工具对上海市零售药店的空间分布特征和集聚发展状况进行研究,以期对该市药品零售端布局格局和集聚状况形成整体认识,为决策者科学引导药品零售业发展和执行政策提供理论支撑。
1 空间集聚研究 1.1 空间分析的空间自相关性诊断空间分析是指通过空间数据的变化形式,提取数据中潜在的有用信息来研究空间现象的一种统计方法。空间自相关性诊断是空间分析的前期工作,是指同一个变量在空间位置上互相的关联性,是度量空间单元属性值聚集程度的指标[4],其目的在于明确后期分析时选取何种回归模型以避免结果的偏差。空间自相关性的理论基础来自Tobler的地理学第一定律:任何地理事物在空间上都存在集聚(clustering)、随机(random)、规则(regularity)分布的关系,但距离近的事物关联(连接)更紧密[5]。就零售药店的选址来说,选址除了受所在区域环境的影响,也会受到来自周边已有药店布局的影响,距离越近,连接越密,影响就越大。空间自相关性诊断包括全局和局部诊断两种,前者用于探测整个研究区域的空间模式,可用莫兰指数(Moran’s I)、Geary’s C、Getis’s G系数、交叉K函数等[4, 6]表达,后者用于计算每一个空间单元与邻近单元某一属性的相关程度。
1.2 空间集聚方法及操作步骤 1.2.1 对象地理信息的空间化空间信息可视化多以点、线、面等要素作为表达载体,是所有空间研究的基础。它将样本的地理信息空间化,并映射至数字地图上,即将一维的地理数据二维化,在保留数据基本信息的基础上,直观表达其位置、几何、拓扑等空间信息。精确的地理信息(地址)是空间信息可视化的前提。最有效的方法是前往每个样本点,利用全球定位系统(global positioning system,GPS)进行实时定位,但此方法效率较低,且易受限制。有研究提出,可通过地图应用软件的GPS定位功能将地址信息转化为经纬度坐标,近似认为以此获得的经纬度可精确反映地址信息。
首先,获得对象地址并构建数据库,指标包括对象名称与地址;其次,运用地图应用软件的api地理逆编码功能,将各样本的详细地址信息转化为经纬度坐标,形成符合定位要求的经纬度信息定位数据库;继而用ArcGIS 10.3软件将位置信息纳入至空间体系框架之中,步骤为“文件”—“添加数据”—“添加XY数据”;参数设置要统一坐标系,步骤如“编辑”—“选择”—“Geographic Coordinate Systems”—“Asia”—“Beijing1954.prj”;最后,导出图层。
若样本数量庞大,可进行批量空间化操作[3](通过R语言实现,代码在此不详述)。地址多有非结构化特征,可通过“正则”表达式将源数据库中不同形式的地址标准化为“省-市-区-路-号”的结构化格式,再通过web请求api。
1.2.2 空间自相关性诊断全局Moran’s I是一个有理数,经方差归一化后值域在-1.0~1.0。其测算方式一般有两种:一是假设研究数据在空间上的分布是正态的[7],二是假设研究数据在空间上的分布是随机的。两种方法所得结果的差异较小。ArcGIS 10.3软件默认使用第二种方式,其本质是使用了蒙特卡洛模拟的方法。步骤为“Spatial Statistics Tools”—“Analyzing Patterns”—“Spatial Autocorrelation(Moran I)”。参数设置中,“Conceptualization of Spatial Relationships”(空间概念化模型)可选择“CONTIGUITY_EDGES_CORNERS”(即Queen’s Case),标准化选择“ROW”(行标准化,即空间权重矩阵的标化)。或者通过R语言实现,以上海市行政区划及上海市零售药店空间位置图层为例,语句为[4]:
shanghai_nb < -poly2nb(shanghai)
shanghai_wt < -nb2listw(shanghai_nb,zero.policy=T)
moran.test(shanghai$pharmacy,listw=shanghai_wt,zero.policy=T)# morani
moran.plot(shanghai$pharmacy,listw=shanghai_wt,labels=F,zero.policy=T,main=paste("MoranI=",round(moran.test(shanghai$pharmacy,listw=shanghai_wt,zero.policy=T)$p.value,7),sep=""),xlab="样本数目",ylab="样本空间滞后值")
通过局部空间自相关分析确认是否存在高值或低值的局域空间聚集。Local Moran’s I是最常用的局部自相关的测度指数。局部相关性分析可通过OpenGeoDa软件实现。首先,构建空间权重文件“file”—“new project from”—“esrishp”导入对象图层,“tools”—“weights”—“create”,点击“add id variable”—选择“ID项”,点击“addvariable”—“threshold distance”,其余设为默认即可;其次,进行局部空间自相关性诊断,点击“space”—“univariate local moran’s I”—“variable settings”选择参数,继而添加所构建的空间权重矩阵即可。
1.2.3 对象之间的路网距离测算为进一步探究研究对象间的集聚程度,可通过ArcGIS 10.3软件进行对象间的路网距离测算,含两种方式,操作步骤如下。第一种:点击“ArcToolbox”—“Analysis Tools”—“Proximity”—“Point Distance”,计算对象空间图层中任两点之间的最小距离,距离结果可在ArcMAP中查看,继而导出结果,使用R语言或SAS软件等按点之间距离进行排序,选取最小距离。第二种:点击“ArcToolbox”—“Analysis Tools”—“Proximity”—“Near”,计算对象空间图层中两点间的最小距离,距离结果直接在ArcMAP中查看。
2 上海市零售药店布局空间集聚结果 2.1 药店地理信息空间化截至2016年底,上海市有零售药店3 770家(中心城区981家,非中心城区2 789家),分布在16个区的209个街镇,平均每个街镇有18家药店。将药店地理信息空间化后发现存在地理上的密集布局现象,即药店集中在市区和各行政区划的中心地区。
2.2 药店空间自相关性诊断首先进行全局空间自相关性诊断。研究以地理空间是否接壤(即使用Queen’s Case)界定规划区域基层药事服务圈的空间邻接。图 1为研究使用数据的空间邻接情况。按照权重测算方法,研究使用R语言得到整个上海市基层药事服务圈6 148×6 148的行标准化空间权重矩阵(研究以居民10 min步行距离范围内的基层药事服务圈作为基本分析单元[8],共计6 148个)。对所有药店进行全局空间相关性检验,得到Moran’s I值为0.55,P≈0(2.2×10-16),可认为零售药店布局在上海市内存在显著的空间集聚现象,零售药店多(少)的基层药事服务圈,其周围服务圈的平均零售药店数量也较多(少)。
![]() |
图 1 上海市基层药事服务圈的空间邻接情况 |
继而进行局部空间自相关性诊断。从图 2可知:市中心全区以及嘉定区、松江区、青浦区、闵行区、普新区等行政区划中心(红色区域)的空间关联模式为高-高关联,即此类区域的零售药店数量多,且被同样药店数量较多的区域包围;大多数郊区或非人口居住区的空间关联模式为低-低关联,即此类区域的零售药店数量少,且被同样药店数量少的区域包围。
![]() |
图 2 上海市零售药店局部空间自相关性诊断结果 |
在此基础上,为进一步确认集聚程度,对具有高关联性区域内的零售药店进行了路网距离测算,发现只有不到10%的零售药店间距在300 m之内,区域内零售药店集聚程度并不高。
3 讨论关于空间统计和空间自相关的既往研究众多,但并非所有问题都得到了有效解决。其中就包括最大的可塑性面积单元问题,空间权重矩阵如何选择和准确赋值等。
3.1 可塑性面积单元问题空间数据具有多粒度、多尺度的特性,其所产生的可塑性面积单元问题(modifiable areal unit problem,MAUP)是空间分析结果产生差异的不确定因素之一。仍以零售药店空间自相关性诊断为例,10 min步行距离的范围太小,易导致表达不清晰,故研究采用15 min步行距离范围内的基层药事服务圈/地区乡镇街道/行政区划作为基本分析单元。由于空间邻接性不同,所得到的零售药店空间相关性诊断结果有差异,见图 3、图 4。以15 min步行距离范围内的基层药事服务圈为基本单元,上海市零售药店空间相关性诊断的Moran’s I值为0.61,P≈0,差异有统计学意义,可认为药店存在空间聚集现象;以乡镇街道为基本单元,上海市零售药店空间相关性诊断的Moran’s I值为0.35,P≈0,差异有统计学意义,可认为药店存在空间聚集现象;以上海58个医疗服务区为基本单元,上海市零售药店空间相关性诊断的Moran’s I值为0.08,P=0.1,差异无统计学意义,可认为药店不存在空间聚集现象;以行政区划为基本单元,上海市零售药店空间相关性诊断的Moran’s I值为-0.04,P=0.35,差异无统计学意义,可认为药店不存在空间聚集现象。空间滞后值不同会造成后续空间回归结果的不同。MAUP是客观存在的,可采用多种分析单元颗粒度大小和划分方式进行综合分析,寻求最适宜的表达方式和单元颗粒度,以降低MAUP对空间分析造成的误差。
![]() |
图 3 针对可塑性面积单元问题采用不同分析单元所得的上海市零售药店空间邻接 |
![]() |
图 4 针对可塑性面积单元问题采用不同分析单元所得的上海市零售药店空间相关性情况 |
同样以零售药店集聚研究为例,研究讨论空间权重矩阵选择和赋值方法。首先对上海市地域进行了网格化划分,随机抽取了其中6个基层药事服务圈作为研究对象,数字地图ID号分别为136、1044、4912、5009、5010、5011。作为案例,对研究对象的ID号重新赋值为1、2、3、4、5、6,分别有5、3、5、1、1、7家药店。见图 5。
![]() |
图 5 随机选取的上海市6个基层药事服务圈 |
通常,地理要素以点、线、面三种方式呈现,各自空间关系的展示形式不同,如点的空间关系有重叠或分离,线有相交或相离,面有包含、邻接、分离等。基层药事服务圈作为一阶面图层,研究着重讨论面的邻接关系。邻接在ArcGIS 10.3中有两类:“Polygon contiguity(edges only)”和“Polygon contiguity(edges and corners)”,又称Rook’s Case(又称CONTIGUITY_EDGES_ONLY,共享边)和Queen’s Case(又称CONTIGUITY_EDGES_CORNERS,共享边或角)。Rook’s Case指若规划空间区域间具有一条及以上的公共边,则被认为呈邻接关系。如图 6所示,此时1号面的邻接面为2和3。Queen’s Case指规划空间区域间若有一条及以上公共边或一个及以上公共角的,均为邻接关系。如图 6所示,1号面的邻接面为2和3和4。考虑到基层药事服务圈的形状,研究以地理空间是否接壤(即Queen’s Case)界定规划区域基层药事服务圈的空间邻接,并得到空间邻接说明(表 1)。
![]() |
[注]Rook’s Case为CONTIGUITY_EDGES_ONLY(共享边);Queen’s Case为CONTIGUITY_EDGES_CORNERS(共享边或角) 图 6 空间邻接类型示意 |
表 1 随机选取的上海市6个基层药事服务圈的空间邻接情况 |
![]() |
在此基础上,将基层药事服务圈a与基层药事服务圈b的邻接关系用Cab=0(不邻接)或1(邻接)赋值,转化为6×6的空间邻接矩阵,见表 2。
表 2 随机选取的上海市6个基层药事服务圈的空间邻接矩阵 |
![]() |
继而计算各药事服务圈内零售药店的空间滞后量,通过ArcGIS 10.3软件(或R语言)生成研究区域的空间权重矩阵,并执行标准化,每个权重都会除以每行的和(所有相邻要素的权重和)。再通过“Spatial Statistics Tools”—“Utilities”—“Convert Spatial Weights Matrix to Table”导出权重矩阵。见表 3、表 4。
表 3 随机选取的上海市6个基层药事服务圈的空间权重矩阵(行标化) |
![]() |
表 4 随机选取的上海市6个基层药事服务圈的空间滞后量 |
![]() |
本研究介绍了空间集聚研究的方法及操作步骤,具有实操性,值得借鉴。研究对上海市零售药店布局集聚程度进行了实证:通过全局空间自相关性诊断,得到Moran’s I值为0.55,P≈0,可认为上海市零售药店存在显著的空间集聚现象。局部空间自相关性诊断显示,市中心、各行政区划中心城区零售药店空间关联模式为高-高关联,已形成了多个零售药店布局密集区;药店间路网距离测算发现,密集区域内路网距离小于300 m的药店占比为10%左右,集聚程度不高,上海市现阶段并未形成零售药店布局聚集区。针对MAUP以及空间权重矩阵如何选择和准确赋值问题,课题组会进行后续重点研究。
·作者声明本文无实际或潜在的利益冲突
[1] |
PORTER M E. The competitive advantage of nations[J]. Harv Bus Rev, 1990, 68(2): 73-93. |
[2] |
李太平, 钟甫宁, 顾焕章. 衡量产业区域集聚程度的简便方法及其比较[J]. 统计研究, 2007, 24(11): 64-68. DOI:10.3969/j.issn.1002-4565.2007.11.012 |
[3] |
ANSELIN L. Spatial econometrics:methods and models[M]. Netherlands: Springer, 1988.
|
[4] |
GETIS A, ORD J K. The analysis of spatial association by use of distance statistics[J]. Geogr Anal, 1992, 24(3): 189-206. |
[5] |
MILLER H J. Tobler's first law and spatial analysis[J]. Ann Assoc Am Geogr, 2004, 94(2): 284-289. DOI:10.1111/j.1467-8306.2004.09402005.x |
[6] |
GEARY R C. The contiguity ratio and statistical mapping[J]. Inc Stat, 1954, 5(3): 115-127. |
[7] |
CLIFF A D, ORD K. Evaluating the percentage points of a spatial autocorrelation coefficient[J]. Geog Anal, 1971, 3(1): 51-62. |
[8] |
张天天, 李健梅, 周奕男, 等. 基层药事服务圈的界定和可视化表达方法[J]. 中国卫生政策研究, 2017, 10(9): 63-67. DOI:10.3969/j.issn.1674-2982.2017.09.009 |