文章信息
- 冯象初, 欧阳照玮, 赵晨萍, 李晓晖
- FENG Xiangchu, OUYANG Zhaowei, ZHAO Chenping, LI Xiaohui
- 基于地理信息的密度估计方法
- Density Estimation Based on Geographic Information
- 武汉大学学报(理学版), 2017, 63(5): 434-438
- Journal of Wuhan University(Natural Science Edition), 2017, 63(5): 434-438
- http://dx.doi.org/10.14188/j.1671-8836.2017.05.008
- 
						                	文章历史
- 收稿日期:2017-01-05
 
概率密度分布图是一项通过一系列的基于独立的离散事件来产生概率密度从而预测发生此类事件的可能区域的技术[1].对于一系列给定了时间空间坐标的离散数据,我们可以构造一个概率密度来估计离散事件发生在一个区域的可能性.
常用的进行密度估计的方法是核密度估计法[2],它通过求核函数的和来逼近真实密度.高斯分布核函数是最常用的核函数,它具有光滑、空间对称以及非紧支撑的特点.其他概率密度估计方法有紧弦法、log-样条法和总变差最大罚似然估计模型等.但是,这些模型当中均未采用客观的地理信息,从而导致密度估计在无效区域存在有非零的事件发生概率,与客观实际不符合.如离散犯罪事件中入室盗窃和其他类似的犯罪不应当出现在海洋,山脉等无效区域.理想情况下,我们希望能确保概率密度被限制在有效区域当中.所以应当将地理信息有关的数据纳入概率密度估计模型之中.
本文提出新的模型和算法,引入了地理信息,将概率密度估计支撑限定在有效区域内以保证事件发生的真实性.该模型是以最大惩罚项似然估计法为基础的演化方法.密度估计由预设的能量函数最小值计算得出.本文提出的方法中的能量函数是关于有效区域显式独立的,使密度估计遵循我们对于其支撑所提出的假设.
1 最大罚似然估计假设u(x)是关于
|   | (1) | 
(1) 式由两项组成,惩罚项P(u)和最大似然项
现阶段被提出的惩罚项函数已经有很多,例如
为了加入地理信息,从而区分出有效与无效区域,我们对近几年最大罚似然估计模型的研究成果[8~10]进行了拓展,提出了新的修正的最大罚似然估计方法(modified total variation MPLE,MTV-MPLE).MTV-MPLE针对地理信息做了改进,引入一个依赖于无效区域的惩罚项函数,使无效区域可由地理图像或者其他预设的地理信息数据来表示.
传统的TV-MPLE方法如下所示
|   | (2) | 
对于一个设定好的有效区域,希望密度函数u的等高线在有效区域的边缘处对齐.TV-MPLE法允许其最小解不连续的情况出现.
通过使等高线在有效区域的边缘处对齐,在此处产生不连续的情况从而保证密度估计不会因为演化过程而光滑进无效区域.∇(u)/|∇u|表示u的水平曲线的归一化向量,为了避免出现分母为0的情况,有θ=∇(1D)/|∇(1D)|ε,
|   | (3) | 
或要求∫Ω|∇u|-θ·∇udx=∫Ω|∇u|+u∇·θdx最小化.将∫Ω|∇u|+u∇·θdx项包含在(2) 式中,从而得到MTV-MPLE能量函数
|   | (4) | 
MTV-MPLE是一个约束优化问题,有两个约束条件必须要满足:0≤u(x)来保证概率本身为正;∫Ωu(x)dx=1来保证u(x)本身是一个概率密度估计.常用的求解方法是约束用罚函数形式来表述,增加一个L2惩罚项得到一个新的极小化问题[9]
|   | (5) | 
但是常用的求解方法存在不足,该方法的L2惩罚项的系数γ如果过大,会影响求解的数值稳定性;若γ取值较小,虽然能保证数值稳定性,但是约束较弱以至于不能保证∫Ωu(x)dx=1.因此,我们采用梯度投影下降方法来对约束优化问题求解[10, 11].
对于(4) 式中求解极小问题,令
|   | (6) | 
通过梯度下降和投影交替迭代求解
|   | (7) | 
先进行梯度下降,τ为下降步长,对J(u)求微分
|   | (8) | 
其中
|   | (9) | 
我们通过不断的梯度下降与投影来迭代求解un+1的解.实践中为了保证解收敛并且有一个好的实验结果,选取下降步长τ为8E-6, 参数λ选择1.0到1.2之间效果较好.μ选取与u有关,m为矩阵的行数,n为矩阵的列数.μ为1/(mn).
4 数值实验 4.1 模拟数据实验为了证实我们的模型切实可行,我们预先定义了一个有着尖锐梯度的概率分布图,并根据其在区域内随机产生8 000个离散事件.这8 000个离散事件中,有6 000个发生在区域对角线的右上方,其余2 000个发生在区域对角线左下方,无效区域内没有离散事件.之后依靠MTV-MPLE来得到概率密度分布图并与核密度估计方法和传统的MPLE方法相比较.如图 1所示.
|   | 
| 图 1 模拟数据效果图 Figure 1 The effect diagram of simulation data | 
图 1(a),(b),(c)是密度估计的先验,(d),(e),(f)是针对先验数据的估计结果.其中,有效区域如图 1(a)所示.真实密度和8 000个离散事件在图 1(b)及图 1(c)中所示.同时,我们也给出了核密度估计法以及TV-MPLE法的结果.核密度估计的变量σ=2.结果在图 1(d)及图 1(e)中.MTV-MPLE的结果在图 1(f)中所示.由于引入了地理信息,我们的方法保持了无效区域的边界,并且和预设的真实的解十分接近.而核密度估计法和传统的TV-MPLE法在无效区域内均有概率密度存在.此外,在密度估计过程中,该方法还保持了概率密度边缘尖锐的梯度.表 1中为这三种方法的L2误差.L2误差的定义为(∫Ω u(x)dx-1)2, 用来刻画求解结果u是否满足前文提出的第二个约束.
| 离散数据 | Kernel density | TV-MPLE | MTV-MPLE | 
| 4 000 events | 7.3937E-6 | 7.7628E-6 | 5.6769E-7 | 
| 8 000 events | 8.1079E-6 | 6.6155E-6 | 4.1213-6 | 
误差越小表示算法收敛性越好,预测结果更契合实际.比较表 1中的3种方法计算效果的L2误差可以看出,在模拟的4 000个或8 000个离散数据的情况下,MTV-MPLE均比核密度估计法以及传统的TV-MPLE法收敛性好.说明其对约束条件满足得更好.
4.2 某城市犯罪事件概率密度估计实验运用真实的数据测试新方法的效果.实验选取2013年到2015年6月的某市区及其周边区域的犯罪数据,一共1 273个符合条件的犯罪事件.每个犯罪事件均有发生时间与犯罪地点的经纬度坐标.该市及周边地区的地理信息可以由公开的地图数据得到,由地图所示,河流内部及西北方的湖泊为无效区域.用MTV-MPLE进行密度估计,实验结果如图 2所示.
|   | 
| 图 2 某城市犯罪密度估计效果图 Figure 2 The criminal density estimation map of city | 
实验选取的区域的地图如2(a)所示,包括该市区以及其周边区域.图 2(b)为犯罪事件的散点分布图.图 2(c)为有效区域,如图所示,在贯穿该市的河流中是没有犯罪事件发生的.图 2(d)为MTV-MPLE估计的概率密度分布图.将犯罪密度分布和实际的地图相对应,比较直观.图像的尺寸为450×650.
从实验结果来看,该市的犯罪密度集中分布在火车站及其周围的街道以及该市一所高校附近.地图上有一条横贯城区的河,其为无效区域,在迭代演化过程中,概率密度具有光滑性且有效区域的边界也得到了很好的保持.该城市的河湖等无效区域也没有概率密度分布.改进的概率密度估计方法在面对实际数据的检验时取得良好的效果,已经在实际应用中对警方布控起到了指导作用.
犯罪事件的发生地点是警方用GPS定位的.测定离散事件的空间信息时受制于GPS设备定位精度的影响,测量过程存在细微的误差.比如有少量离散事件发生在有效区域和无效区域的边缘,由于测量误差的存在会被认为发生在无效区域中.但实验表明,新算法在测量存在误差的实际数据中取得了和模拟数据一样的良好效果.主要是因为(4) 式所定义的TV-MPLE能量函数中λ∫Ω u∇·θdx能够保证概率密度分布在无效区域中为0,能量函数关于有效区域是显式独立的.这说明新的方法对实际数据有很好的适用性.
5 结论本文主要研究了如何将地理信息引入概率密度估计的方法.传统的根据离散事件生成概率密度分布图的方法并不考虑地理信息,从而可能会导致预测的概率密度出现在根本不可能发生事件的无效区域.
以解决此类问题为目的,我们提出了修正的TV-MPLE模型和算法.与传统的方法相比较,该方法既能依据地理信息区分有效区域与无效区域,又能确保概率密度的支撑.根据实际地理信息.在无效区域中,对事件的发生概率的估计为0.在模拟数据实验中,修正的TV-MPLE法的收敛性要优于核密度估计方法与传统的MPLE方法.
本文将该方法用于构建基于地理信息的某城市犯罪概率密度分布图,估计效果直观且符合实际.在湖泊、河流等无效区域内,犯罪事件的概率密度为0.相关方法已经被用于警用软件的开发,用于为各地警方布控提供更合理的参考.
| [1] | 
    ROSSMO D K.Geographic Profiling[C]//Encyclopedia of Criminology and Criminal Justice. New York:Springer-Verlag, 2014:1934-1942. DOI:10.1007/978-1-4614-5690-2_678.     
 | 
| [2] | 
        MOHLER G O, SHORT M B. Geographic profiling from kinetic models of criminal behavior[J]. SIAM Journal on Applied Mathematics, 2012, 72(1): 163-180. DOI:10.1137/100794080     | 
| [3] | 
        EGGERMONT P P B, LARICCIA V N, LARICCIA V N. Maximum Penalized Likelihood Estimation[M]. New York: Springer, 2001. DOI:10.1007/b12285    
 | 
| [4] | 
        WOODWORTH J T, MOHLER G O, BERTOZZI A L, et al. Non-local crime density estimation incorporating housing information[J]. Phil Trans R. Soc A, 2014, 372(2028): 20130403. DOI:10.1098/rsta.2013.0403     | 
| [5] | 
    BAUDAINS P J.Spatio-temporal Modelling of Civil Violence:Four Frameworks for Obtaining Policy-relevant Insights[D]. London:UCL (University College London), 2015.      http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.639698
 | 
| [6] | 
    GRIMM V, MCLACHLAN R I, MCLAREN D, et al. The Use of Discrete Gradient Methods for Total Variation Type Regularization Problems in Image Processing[DB/OL].[2016-09-13].https://arxiv.org/abs/1603.07515.     
 | 
| [7] | 
        MAAS J, RUMPF M, SCHÖNLIEB C, et al. A generalized model for optimal transport of images including dissipation and density modulation[J]. ESAIM:Mathematical Modelling and Numerical Analysis, 2015, 49(6): 1745-1769. DOI:10.1051/m2an/2015043     | 
| [8] | 
        MOHLER G O, BERTOZZI A L, GOLDSTEIN T A, et al. Fast TV regularization for 2d maximum penalized likelihood estimation[J]. Journal of Computational and Graphical Statistics, 2011, 20(2): 479-491. DOI:10.1198/jcgs.2010.09048     | 
| [9] | 
        SMITH L M, KEEGAN M S, WITTMAN T, et al. Improving density estimation by incorporating spatial information[J]. EURASIP Journal on Advances in Signal Processing, 2010, 2010(1): 1. DOI:10.1155/2010/265631     | 
| [10] | 
        CHAMBOLLE A. An algorithm for total variation minimization and applications[J]. Journal of Mathematical Imaging and Vision, 2004, 20(1-2): 89-97. DOI:10.1023/B:JMIV.0000011325.36760.1e     | 
| [11] | 
    COMPTON R, JURGENS D, Allen D. Geotagging One Hundred Million Twitter Accounts with Total Variation Minimization[DB/OL].[2016-10-13].http://cs.stanford.edu/~jurgens/docs/compton-jurgens-allen_bigdata-2014.pdf. DOI:10.1109/BigData.2014.7004256.     
 | 
 2017, Vol. 63
				2017, Vol. 63
				 
											 
											 
											 
											 
												 
								