Multitype crime prediction model integrating spatiotemporal interaction features and spatiotemporal correlation of crimes
-
摘要: 现有犯罪时空预测模型大多针对单一犯罪类型,导致应用成本较高。为此,本文构建了一种融合时空交互特征与犯罪时空关联性的多类型犯罪预测模型,该模型核心功能模块由时空交互特征提取和多类型联合学习两部分组成,分别负责捕捉环境特征数据中不同类型犯罪的关键特征,以及通过整合不同类型犯罪之间的时空关联性,实现多类型预测的联合优化。基于芝加哥和纽约的抢劫与入室盗窃犯罪数据的实验表明:本文所提模型对抢劫和入室盗窃的预测RMSE(root mean squard error)最低为0.365和0.288,MAE(mean absolute error)最低为0.277和0.226,较基线模型最高可提升31.1%和36.6%。消融实验表明,环境特征数据对模型的预测性能贡献最大,其次为不同类型犯罪之间的时空关联性;所提模型能够有效捕捉环境特征数据对不同犯罪类型的差异化影响,并通过整合犯罪间的时空关联性显著提升模型性能。Abstract: To address the high deployment costs of single-crime prediction models in policing practice, a multitype crime prediction model integrating spatiotemporal interaction features and spatiotemporal correlation of crimes (MCPM) was constructed. The model’s fundamental functionality encompasses two primary components: spatiotemporal interaction feature extraction and multitype joint learning. The spatiotemporal interaction feature extraction component is designed to capture the key characteristics of environmental features data related to different types of crime, while the multitype joint learning component integrates the spatiotemporal correlations among different types of crime, facilitating the joint optimization of spatiotemporal prediction for multiple crime types. A series of experiments have been conducted on data concerning robbery and burglary crime from Chicago and New York. The following conclusions were reached: The MCPM model demonstrates superior performance in terms of prediction accuracy, with a minimum prediction root mean square error of 0.365 for robbery and 0.288 for burglar and mean absolute error reaches a minimum of 0.277 and 0.226, respectively, indicating a significant margin of improvement over baseline models, with a maximum difference of 31.1% and 36.6%, respectively. Ablation experiments reveal that environmental features data variables contribute the most to the model’s predictions, followed by spatiotemporal correlations between different types of crime. The MCPM model effectively captures the differentiated impact of environmental features data on various crime types, enhancing model performance through the integration of spatiotemporal correlations among crimes.
-
城市犯罪时空预测对维护公共安全具有重要意义,公安机关可根据犯罪时空预测的结果进行警力资源、巡控路线、治理方案的优化[1],从而为犯罪活动的防控提供有效的情报引导。在日常接警处警工作中,公安机关所需要应对的警情类型十分复杂,包括了暴力犯罪(如杀人、寻衅滋事、故意伤人等)、侵财类犯罪(如盗窃、抢劫等)、新型网络犯罪(电信网络诈骗、跨境网络赌博等)、毒品犯罪、危害公共安全等。这些犯罪不仅是对特定个体利益的侵犯,更是对整个社会秩序、安全和共同体价值的威胁[2]。然而,目前人们所提出的各类犯罪时空预测模型大多服务于单一类型犯罪的预测[3],而较少考虑同时对多类犯罪的时空分布进行预测,这一现状导致公安机关在开展犯罪时空预测时不得不为每一类犯罪单独构建预测模型。而这种单一犯罪预测模式在实际应用中面临显著局限性:从应用开发成本来看,犯罪预测系统的软硬件开发成本高昂[4],例如美国部分地区警方使用的ShotSpotter系统,其覆盖每平方英里的部署费用高达4万美元[5],多数地方政府难以长期承担多个单一犯罪预测模型并行的运维成本;从计算资源分配来看,每类单一犯罪预测模型需分别部署物理集群、分布式文件系统及Spark计算框架,并依赖图形处理器(graphics processing unit,GPU)算力支撑[6],导致计算资源重复投入和利用率低下;从数据管理效率来看,对海量数据信息进行特征研究和规律挖掘是犯罪预测的前提和基础,而多模型独立存储犯罪事件数据时,数据冗余率显著提升(如重复录入的时空坐标、环境因子等),此外跨模型数据格式差异也增加了数据清洗和整合的成本。上述问题提高了犯罪时空预测模型的应用门槛,限制了该类模型在公安机关的大规模应用,因此,研究一种面向多类型犯罪预测的犯罪时空预测模型已成为公安机关亟待解决的问题之一。
近年来,国内外围绕犯罪时空预测开展了大量的研究,提出了一系列的预测方法及模型。早期的犯罪时空预测模型主要是利用犯罪活动的时空自相似性来开展预测,代表性的模型有核密度估计[7]、临近重复[8]、随机森林[9]等。而随着深度学习算法的发展,更为复杂的模型被用于犯罪时空特征的分析和预测,如门控循环单元(gated recurrent unit,GRU)、长短期记忆网络(long short-term memory,LSTM)[10]、图卷积网络(graph convolutional network,GCN)[11]、图注意力网络(graph attention network,GAT)[12]、时空图卷积网络(spatial-temporal graph convolutional network,ST-GCN)[13]等。目前犯罪时空预测的主流模型综合了环境特征数据对犯罪的解释性以及犯罪活动的时空特征来开展预测,如GAERNN(graph self-coding recurrent neural network)[14]、STCPM(spatio temporal crime prediction model)[15]、TCP(temporal-dpatial correlations for crime prediction)[16]、Ada-GCNLSTM(adaptive-GCNLSTM)[17]模型等。
目前,用于犯罪时空预测的环境特征数据包括了天气[18]、POI(point of interest)[19]、交通路网[20]、动态人流[21]、社会经济因素[22]等,预测的犯罪类型则包括了入室盗窃[23]、抢劫[24-26]、扒窃[27-28]等。但是,从已有的研究来看,不同类型的环境特征数据对不同类型犯罪的预测有着不同的解释性和贡献度。例如,针对财产类犯罪,徐冲等[29]利用线性回归和地理加权回归等分析方法,发现公交站点数量、交叉路口数量等微观环境特征数据对街头抢劫犯罪具有重要解释作用;Feng等[30]将土地利用和POI数据在盗窃犯罪建模中的有效性进行了比较,发现POI类环境特征数据对盗窃犯罪的发生具有强解释性。在暴力犯罪的研究中,Lee等[31]利用空间滞后模型进行空间回归分析,发现地方安全理事会(local security council)、城市监控系统以及种族异质性和离婚率等社会安全类和人口类数据对谋杀等暴力类犯罪具有较强解释性;Summers等[32]采用空间句法技术评估了各个街道段的往返运动潜力,并通过回归分析证明了路网类环境数据与室外暴力犯罪的发生具有强相关性。近来,随着大数据技术和移动感知技术的进步,越来越多的动态环境数据被纳入考虑范畴,例如Ristea等[33]将包含地理位置的Twitter数据和涉及暴力信息的“推文”子集数据引入犯罪预测模型,发现社交媒体类环境特征数据对机动车盗窃和损害财物两类犯罪的发生具有显著影响性;沈兵[34]建立了FFT(fast Fourier Transform)与LSTM-GCN(long short term memory-graph convolutional network)融合的时空预测模型,证明天气类环境特征数据对抢夺、抢劫、故意伤害和强奸等暴力犯罪具有较强的解释性。通过归纳以上研究可以发现,POI等建成环境数据对盗抢类财产犯罪具有重要的解释性,而暴力型犯罪与社会安全类、路网类以及天气类环境特征数据有着重要的关联。由此可以看出,不同类型犯罪的时空分布受环境特征数据的影响存在着一定的差异。
此外,不同类型犯罪虽然具有不同的时空分布特征,但是不同类型犯罪的时空分布之间却存在着一定的关联性。例如,在理论层面,社会失序理论[35]认为轻微犯罪的聚集会导致严重犯罪的增加。而在实证研究层面,大量研究成果对犯罪时空特征进行了统计学分析,为不同类型犯罪之间的时空关联性提供了更直观的证据。例如,柳林等[36]使用K均值聚类法及决策树模型对不同类型犯罪的共生空间进行识别和分析,发现公共空间内的盗窃与接触诈骗犯罪之间存在共生现象,入室盗窃、抢劫抢夺和寻衅滋事等3类犯罪之间也存在共生的城市空间;王文汐等[37]引入了产业聚集度DO(duranton-overman index)指数探究了毒品犯罪对其次生犯罪的诱发性,发现毒品犯罪与抢劫、强奸、危险驾驶罪、故意杀人等4类犯罪在空间上呈现出小尺度共聚关系;Celik[38]进一步考虑了不同类型犯罪的时间属性,识别出纵火与盗窃犯罪之间存在时空同现模式;Li等[39]提出时空加权协同区位商来验证不同类型犯罪之间的时空自相关现象,揭示了毒品犯罪和非法持有武器犯罪间存在较强的时空关联性,而入室盗窃、抢劫和机动车犯罪之间,以及扒窃、自行车盗窃和其他盗窃之间也具有显著的时空交互作用。以上研究均证实了不同类型犯罪在时空分布上存在着一定的关联性。
综上,通过对已有文献的梳理可以发现,不同类型犯罪的时空分布在受环境特征数据影响方面存在着一定的差异性,并且不同类型犯罪的时空分布之间也存在着密切的关联。因此,构建一种能够同时预测多类犯罪的犯罪时空预测模型需要解决两个方面的问题:一是有效挖掘环境特征数据对不同类型犯罪的关键特征,二是有效整合不同类型犯罪之间的时空关联性。
1. 模型框架
本文提出并设计了一个融合时空交互特征与犯罪时空关联性的多类型犯罪预测模型(multi-type crime prediction model integrating spatiotemporal interaction features and spatiotemporal correlation of crimes,MCPM),模型框架如图1所示。该模型核心功能由时空交互特征提取和多类型联合学习两部分组成,其中时空交互特征提取部分包含多个时空交互注意力机制模块,多类型联合学习部分包含特征提取模块和联合训练模块。首先,将环境特征数据(如天气、路网、POI等)输入至时空交互注意力机制模块进行数据重加权处理,从而实现对不同类型犯罪的时空交互特征的有效抽取。其次,构建基于图神经网络的特征提取模块,对每种犯罪类型,在进行环境特征数据的“私有特征”提取的同时,使用域适应技术获取不同类型犯罪之间的时空关联特征,即“共享特征”,从而将不同类型犯罪之间的时空关联性整合到模型中。最后将两种特征输入联合训练模块,通过对两种特征的动态融合实现多类型犯罪时空预测的联合优化。
1.1 时空交互注意力机制模块
对环境特征数据而言,其在犯罪预测中的解释性具有时空动态性[15],且同一环境特征数据作为解释变量对不同类型犯罪的影响程度也存在差异[40]。为充分挖掘环境特征数据对不同类型犯罪的关键特征,捕捉环境特征数据对不同犯罪类型的差异化影响,本文设计了一种时空交互注意力机制模块,用于提取环境特征数据对不同犯罪类型的时空交互特征。时空交互注意力机制模块数量与犯罪类型数量需保持一致,从而针对不同类型犯罪的特点,自适应地调整环境特征数据的权重分配,保证每种类型犯罪均能够聚焦其关键特征。
时空交互注意力机制模块结构如图2所示,给定输入
${\bf{R}}^{N \times T \times C}$ ,其中N表示区域数量,T表示时间步数量,C表示特征维度。使用形状为(N,1)和(1,T)的两个池化核分别沿空间和时间对每个特征进行编码。第c个特征z在空间位置n和时间位置t的输出可分别表示为$$ {\textit{z}}_c^n\left( n \right) = \frac{1}{T}\mathop \sum \limits_{0 \leqslant j \leqslant T} {x_c}\left( {j,n} \right) $$ (1) $$ {\textit{z}}_c^t\left( t \right) = \frac{1}{N}\mathop \sum \limits_{0 \leqslant i \leqslant N} {x_c}\left( {t,i} \right) $$ (2) 随后,为了保留全局感受野并且捕捉不同数据源特征的局部依赖关系,分别从时间和空间两个方向独立地进行卷积操作。空间方向上,利用得到的
${{\boldsymbol{z}}^n} \in {\bf{R}}^{N \times 1 \times C}$ 进行输入输出维度相同的图卷积;时间方向上,利用得到的${{\boldsymbol{z}}^t} \in {\bf{R}}^{1 \times T \times C}$ 进行输入输出维度相同的时域卷积(temporal convolutional network,TCN),具体过程为$$ {{\boldsymbol{f}}^N} = {\delta} \left( {{\mathrm{BN}}\left( {{\mathrm{GCN}}\left( {{{\boldsymbol{z}}^N}} \right)} \right)} \right) $$ (3) $$ {{\boldsymbol{f}}^T} = {\delta} \left( {{\mathrm{BN}}\left( {{\mathrm{TCN}}\left( {{{\boldsymbol{z}}}}^T \right)} \right)} \right) $$ (4) 式中:
$\delta $ 为非线性激活函数;BN代表进行BatchNorm归一化操作;GCN为图卷积操作,用来捕捉各特征的空间局部依赖关系;TCN为时域卷积操作,用来捕捉各特征的时间局部依赖关系;${{\boldsymbol{f}}^N} \in {\bf{R}}^{N \times 1 \times C}$ 、${{\boldsymbol{f}}^T} \in {\bf{R}}^{1 \times T \times C}$ 分别为沿空间维度和时间维度编码得到的中间隐藏层。利用得到的中间隐藏层对输入变量重新分配权重,得到:$$ {\hat {\boldsymbol{X}}^N} = {\boldsymbol{X}} \times {\sigma }\left( {{{\boldsymbol{f}}^N}} \right) $$ (5) $$ {\hat {\boldsymbol{X}}^T} = {\boldsymbol{X}} \times \sigma \left( {{{\boldsymbol{f}}^T}} \right) $$ (6) 式中:
$\sigma $ 为Sigmoid函数,用以重新校准时间分支和空间分支的特征权重。下一步,进行时空维度的交互聚合,捕捉时间−空间−环境特征三者之间的复杂依赖关系。对空间重加权的特征矩阵
$ {{ {\hat {\boldsymbol{X}}}}^N} \in {{\bf{R}}^{N \times T \times C}} $ ,进行池化核大小为(N,T)的二维全局平均池化,从而将保留空间注意力的信息编码到各个特征中,再将其转换为相应的维度形状${\bf{R}}_N^{C \times 1}$ ,使用Softmax函数拟合线性变换得到空间注意力权重。将时间分支的输入直接转换为匹配的维度形状$ {\bf{R}}_T^{NT \times C} $ ,与空间分支的输出进行矩阵点积运算$ {\bf{R}}_T^{NT \times C} \odot {\bf{R}}_N^{C \times 1} $ ,得到第一个时空注意向量。可以发现,该向量用空间注意力权重调节时间尺度特征,能够在同一处理过程中收集时间和空间两个方向的信息。对${{ {\hat {\boldsymbol{X}}}}^T}$ ,采用相同的操作。最后将两个分支的输出向量相加,通过Sigmoid函数生成时空注意力权重值进行二次重加权,从而得到最终特征矩阵${ {\hat {\boldsymbol{X}}}} \in {\bf{R}}^{N \times T \times C}$ 。通过以上时空交互特征提取过程,可关注环境特征数据的重要时空位置,充分挖掘环境特征数据对不同类型犯罪的关键特征。1.2 基于图神经网络的特征提取模块
得益于图结构的非欧氏关系建模能力在犯罪时空预测方面的良好表现[41],可将不同类型犯罪的特征提取建模为图神经网络的预测任务。本文参考Zhao等[42]提出的T-GCN (temporal graph convolutional network)模型,采用图卷积网络与门控循环单元相结合的方式进行时空特征提取。
对于每种犯罪类型,输入由t张图构成时序图结构G=(G1,G2,…,Gt),其中Gt=(X(t),A),
$ {\boldsymbol{X}} \in {{\bf{R}}^{N \times T \times {\mathrm{I}}}} $ 为上一步得到的环境特征数据解释变量特征与犯罪数量特征的拼接矩阵,X(t)为t时刻的节点特征,N表示节点数量,I表示特征维度;A代表邻接矩阵,且$ { \boldsymbol {A}} \in {{\bf{R}}_N}_{ \times N} $ 。模块通过两层图卷积来捕捉空间上的依赖关系,卷积操作表示为
$$ f({ \boldsymbol {X}},{ \boldsymbol {A}}) = \sigma ({ \hat {\boldsymbol{A}}}{{\mathrm{ReLU}}} ({ \hat {\boldsymbol{A}}{\boldsymbol{X}}}{{\boldsymbol{W}}_0}){{\boldsymbol{W}}_1}) $$ (7) 式中:
$ \hat {\boldsymbol A} $ 表示归一化的拉普拉斯矩阵,$ { \boldsymbol {X}} $ 是节点特征矩阵,W0和W1是可学习的第一层和第二层的权重矩阵,$ \sigma $ 为激活函数。由于犯罪活动在时间上具有临近重复现象[43],可通过门控机制来捕捉时间上的依赖关系。GRU的核心结构由重置门和更新门两部分组成,其结构示意图如图3所示。其公式为
$$ {{ {{{{\boldsymbol{z}}}}}}_t} = \sigma ({{\boldsymbol{W}}_{\textit{z}}}\left[ {f({ \boldsymbol {A}},{{ \boldsymbol {X}}_t}),{{ \boldsymbol {h}}_{t - 1}}} \right] + {{ \boldsymbol {b}}_{\textit{z}}}) $$ (8) $$ {{ \boldsymbol {r}}_t} = \sigma ({{\boldsymbol{W}}_r}\left[ {f({ \boldsymbol {A}},{{ \boldsymbol {X}}_t}),{{ \boldsymbol {h}}_{t - 1}}} \right] + {{ \boldsymbol {b}}_r}) $$ (9) $$ {{ {\tilde {\boldsymbol{h}}}}_t} = \tanh ({{\boldsymbol{W}}_h}\left[ {f({ \boldsymbol {A}},{{ \boldsymbol {X}}_t}),({{ \boldsymbol {r}}_t} \odot {{ \boldsymbol {h}}_{t - 1}})} \right] + {{\boldsymbol{b}}_h})) $$ (10) $$ {{ \boldsymbol {h}}_t} = (1 - {{ \boldsymbol {{\textit{z}}}}_t}) \odot {{ \boldsymbol {h}}_{t - 1}} + {{ \boldsymbol {{\textit{z}}}}_t} \odot {{ {\tilde {\boldsymbol{h}}}}_t} $$ (11) 式中:zt是更新门,控制当前时刻的状态更新。rt是重置门,决定如何结合过去的状态信息。
$ {{ {\tilde {\boldsymbol{h}}}}_t} $ 是候选状态,提供新的候选特征。ht是当前时刻的隐藏状态。W是权重矩阵,b是偏置项。T-GCN模块的结构如图4所示。首先,使用历史t个时间序列数据作为输入,利用图卷积网络捕捉空间依赖性;其次,将得到的具有空间特征的时间序列输入门控递归单元模型以捕捉时间依赖性;最后,通过全连接层得到输出特征表示。经过T-GCN模块,得到隐藏特征表示
$ {\boldsymbol{H}} \in {{\bf{R}}^{N \times T \times H}} $ 和第t+1个时间序列的特征向量表示$ { \boldsymbol {E}} \in {{\bf{R}}^{N \times O}} $ 。私有特征提取模块与共享特征提取模块的设计基本一致,不同的是,私有特征提取模块由单个T-GCN块组成,负责学习每种类型犯罪的特有犯罪模式,例如扒窃易发生在人流密集的地区和时段,这与其他类型的犯罪完全不同,因此,可经过该模块得到私有特征表示Es。而共享特征提取模块由n个T-GCN块组成,n个模块之间通过域适应技术进行交互,从而挖掘不同类型犯罪间潜在的共同犯罪模式,如入室盗窃、寻衅滋事和抢劫抢夺犯罪往往发生在同一热点区域[36],经过该模块可得到共享特征表示Ej。
1.3 联合训练模块
1.3.1 联合特征表示学习
为挖掘不同类型犯罪之间的时空关联性,本文借鉴域适应技术,通过共享特征提取模块提取不同类型犯罪的共享犯罪特征,捕捉不同类型犯罪之间的隐式时空依赖关系。
在迁移学习中,域适应技术(domain adaptation)被用于解决源领域和目标领域数据分布不一致的问题[44],其基本思想是将两个分布不同的数据映射到同一特征空间,采用统一度量准则衡量其相似性,实现两类数据分布的接近。该方法可用于不同类型犯罪之间共享时空特征的提取[17],利用一种类型犯罪的数据增强另一种犯罪类型的学习效果,通过挖掘跨犯罪类型时空关联规律提升犯罪时空预测的性能。
考虑到不同类型犯罪时空关联性在动态环境中的变化,使用在共享特征提取模块中得到的t个步长的隐藏层特征矩阵衡量其分布差异。同时为度量不同类型犯罪在城市空间内的全局差异,应用最大均值差异DMM(maximum mean discrepancy,MMD)来计算不同类型犯罪的分布距离,以两种类型犯罪为例,其公式为
$$ \begin{gathered} {{{D}}_{{\mathrm{MM}}}}{\text{ = }}\left\| {\frac{1}{n}\sum\limits_{i = 1}^n {f({x_i}) - \frac{1}{m}\sum\limits_{j = 1}^m {f({x_j})} } } \right\|_\mathcal{H}^2 = \\ \frac{1}{{{n^2}}}\sum\limits_{i = 1}^n {\sum\limits_{i' = 1}^n {k({x_i},{x_{i'}})} } - \frac{2}{{nm}}\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {k({x_i},{y_j})} } + \\ \qquad\qquad\frac{1}{{{m^2}}}\sum\limits_{j = 1}^m {\sum\limits_{j' = 1}^m {k({y_j},{y_{j'}})} } \\ \end{gathered} $$ (12) 式中:
$ \mathcal{H} $ 表示高维再生核希尔伯特空间(reproducing kernel Hilbert space, RKHS),$ k( \cdot , \cdot ) $ 为高斯径向基函数(radial basis function,RBF),其计算公式为$ k({ \boldsymbol {x}},{ \boldsymbol {x}}') = \exp \left( - \dfrac{{{{\left\| {{ \boldsymbol {x}} - { \boldsymbol {x}}'} \right\|}^2}}}{{2{\sigma ^2}}}\right) $ ,σ是核函数的MMD宽度参数。通过最小化
${L_{\mathrm{d}}} = \displaystyle\sum\limits_{1 \leqslant i,j \leqslant n}^{i \ne j} {{{\mathrm{MMD}}} ({{ \boldsymbol {H}}_i},{{ \boldsymbol {H}}_j})} $ 以捕获共有犯罪模式,其中${ \boldsymbol {H}} \in {{\bf{R}}^{T \times N \times H}}$ ,H代表每个隐藏层的输出特征维度。为找到使MMD值尽量小的希尔伯特空间,本文采用了一种多核MMD计算方法,以增强模型对复杂数据分布的适应能力。具体地,设置了5个带宽为{B×2−2,B×2−1,B×20,B×21,B×22}的高斯核矩阵,其中B代表使用自适应带宽,其计算方式为所有样本的L2距离均值,将多个核映射后的MMD取均值作为最终取值。
此外,引入私有和共享特征权重的自适应融合机制,实现不同类型犯罪私有特征和共享特征的动态融合。对于每种类型犯罪,两种特征的联合特征表示为
$\hat E = {\lambda _0}{E_{\mathrm{s}}} + {\lambda _1}{E_{\mathrm{j}}}$ ,其中λ0、λ1分别代表控制私有特征表示和共享特征表示的自适应权重参数。最终将得到的联合特征表示$ \hat E $ 输入全连接层,得到预测结果${\hat y_i}$ 。1.3.2 损失函数设计
在训练过程中,目标是捕获不同类型犯罪之间的时空关联性,同时最小化实际犯罪值与预测犯罪值之间的误差。因此,模型的损失函数公式为
$$ L = \alpha {L_{\mathrm{d}}} + \sum\limits_{i = 1}^n {{\beta _i}L_{{\mathrm{pre}}}^i} + \gamma {L_{{\mathrm{reg}}}} $$ (13) 式中:Ld表示不同类型犯罪之间的MMD损失,
${L_{{\mathrm{pre}}}} = {\mathrm{MSE}}({y_i},{\hat y_i})$ ,i表示第i种犯罪类型,yi表示实际犯罪值,${\hat y_i}$ 表示预测犯罪值,Lreg为正则化项,α和γ分别表示调节各部分影响力的超参数。为避免不同类型犯罪数据规模差异导致的训练不平衡问题,加入动态加权因子β,来动态调整每类犯罪的损失权重,其计算方式为
$\beta = \dfrac{{{\sigma _R}}}{{{\mu _R}}}$ ,其中,R代表当前epoch损失比率,计算方式为$ {R_t} = \dfrac{{{L_t}}}{{{\mu _{t - 1}}}} $ ,Lt是第t个epoch的损失,μt−1是积累到t−1个epoch所有损失的均值,σR和μR分别代表该比率的均值和标准差。通过标准化损失比率R消除绝对损失值对权重的影响,避免大尺度损失任务主导优化方向,同时当某类犯罪损失持续偏高时(R>μR),β自动增大其权重,使模型关注欠拟合任务,最终确保模型在数据规模差异下仍能公平学习不同类型犯罪特征。2. 实验与结果分析
2.1 实验设计
2.1.1 实验数据
为了开展实验验证,本文收集了芝加哥[45]和纽约[46]2020年6月1日至2023年5月31日的犯罪数据,数据包含的标签有报案时间、案发地址等多种字段。抢劫和入室盗窃由于其高发性和较大的社会影响,往往成为警方重点关注的犯罪类型;同时,已有研究表明,这两类犯罪往往受特定社会经济因素、地理位置和时间模式的影响[47]。基于侵财类犯罪的邻近重复性及较高的时空规律性[48],本文选择这两种犯罪类型用于预测研究。为了衡量不同类型犯罪之间的时空相似性,本文采用余弦相似度进行计算[3],结果显示在芝加哥和纽约的所有类型犯罪中,抢劫和入室盗窃的时空相似度分别达到了0.79和0.86。经筛选,得到芝加哥的抢劫数据
25509 条、入室盗窃数据22234 条,纽约的抢劫数据25857 条、入室盗窃数据16972 条。在区域划分方面,按照警务辖区分别将芝加哥和纽约划分为22个和71个空间单元。在城市环境解释变量方面,收集了与犯罪相关的多类环境特征数据,包括有POI、路网以及天气等。对收集的数据进行清洗和标准化,采用线性插值法填充缺失值,基于IQR法(阈值1.5倍)剔除异常值,并通过Z-score标准化消除量纲差异,最终构建三维特征矩阵
${{ \boldsymbol {X}}_i} \in {{\bf{R}}^{T \times N \times {C_i}}}$ ,其中i表示模型输入的域个数,T表示时间步数量,N表示区域数量,Ci表示第i个领域特征维度。表1列出了用于创建特征张量的数据描述和张量形状,该张量与模型要求兼容,并用于训练网络。表 1 特征张量的含义和表示形状Table 1 Definition and shape of feature tensors数据类型 描述 表示 犯罪数据 带有纬度、经度和时间戳的点数据 ${{ \boldsymbol {X}}_{\mathrm{c}}} \in {{\bf{R}}^{N \times T \times 2}}$ POI数据 包含7种分类:饮食、教育与公共服务、零售、金融与办公、休闲与娱乐、交通与基础设施、住宿服务 ${{ \boldsymbol {X}}_{{\mathrm{POI}}}} \in {{\bf{R}}^N}^{ \times T \times 7}$ 天气数据 大气温度、大气压、相对湿度、平均风速、水平能见度 ${{ \boldsymbol {X}}_{{\mathrm{wea}}}} \in {{\bf{R}}^{N \times T \times 5}}$ 路网数据 路网密度,每平方米的道路长度/(m/m2) ${{ \boldsymbol {X}}_{{\mathrm{road}}}} \in {{\bf{R}}^{N \times T \times 1}}$ 2.1.2 参数设置与评估指标
从警务实战的角度出发,警务巡逻调度往往以“天”为单位制定并调整计划,同时为平衡短期动态模式捕捉与长期趋势建模,选择以日尺度为基本单元划分数据集,并将数据按照时间顺序以8∶2的比例分为训练集和测试集。对于每个区域的每种类型犯罪,利用前t个时间步的数据进行训练,预测未来一个时间步长的犯罪数量。使用Adam优化器对模型进行了100个epoch的优化,并设置梯度裁剪策略来防止梯度爆炸或梯度消失,初始学习率为0.001,私有特征向量和共享特征向量的自适应权重参数λ0和λ1初始值为0.5。通过交叉验证将损失函数中的权重α设置为3,γ设置为1×e−3。
为了验证本文提出的MCPM在犯罪时空预测方面的有效性,选取其他代表性犯罪时空预测模型进行比较。为全面覆盖不同方法类型,对比模型包括经典时序模型和传统机器学习模型,同时由于空间网络结构更加贴近实际犯罪风险传播的模式[49],因此在捕捉空间依赖性上选择基于图结构的模型,其拓扑结构构建方式与本文模型保持一致。最终选择包括普通线性回归(ordinary linear regression, OLR)、长短期记忆网络(LSTM)、XGBoost[50]、随机森林(random forest)[51]、时空卷积图神经网络(spatial-temporal graph convolutional network,STGCN)[13]、图卷积长短期记忆网络(graph convolutional long short-term memory,GC-LSTM)[52]、动态时空图卷积递归神经网络(diffusion convolutional recurrent neural network,DCRNN)[53]、Graph Wavenet[54]、自适应时空图卷积网络(attention based spatial-temporal graph convolutional network,ASTGCN)[55]等9类模型。
以绝对误差和相对改进率[3]作为评估指标。绝对误差采用不同类型犯罪预测结果的均方根误差(root mean squard error,RMSE)和平均绝对误差(mean absolute error,MAE)值,相对改进率指当前方法相对于不同基线方法的平均表现性能,相对改进率计算公式为
$$ \varDelta = \frac{1}{n}\sum\limits_{i = 1}^n {\frac{{M_i^{\mathrm{B}} - {M_i}}}{{M_i^{\mathrm{B}}}}} \times 100\% $$ (14) 式中:n代表模型评价指标的数量,本文n=2,分别代表RMSE和MAE两种评价指标。
$ {M_i} $ 和$ M_i^{\mathrm{B}} $ 分别表示当前模型和不同基线模型在某一类型犯罪的评价指标i的数值。2.2 模型性能对比
各基线模型预测性能结果如表2所示。可以看出本文所提出的方法在两个数据集上均优于其他模型。对于芝加哥数据集而言,本文提出的MCPM比OLR模型在抢劫预测的相对改进率为27.2%,在入室盗窃预测上则提升了21.9%。与仅考虑时间维度的LSTM模型相比,MCPM在两种类型犯罪的预测相对改进率分别为25.6%和19.2%。相较于XGBoost、Random Forest等机器学习模型,MCPM在抢劫预测的相对改进率分别为25.5%和25.1%,在入室盗窃犯罪预测的相对改进率分别为20.3%,和19.3%。相较于GC-LSTM、STGCN、DCRNN这类同时考虑犯罪时空关联性的模型,MCPM在抢劫预测的相对改进率分别为24.8%、21.4%和17.4%,在入室盗窃犯罪预测的相对改进率分别为16.7%、14.1%和12.0%。相对于加入自适应邻接矩阵的Graph Wavenet模型与加入注意力机制的ASTGCN模型而言,MCPM在抢劫预测上相对改进率分别为14.9%和8.7%,在入室盗窃预测的准确性上分别有10.9%和7.6%的提升。
表 2 各模型性能比较Table 2 Comparison of various model performance方法 芝加哥 纽约 抢劫 入室盗窃 抢劫 入室盗窃 RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% OLR 0.755 0.529 27.2 0.647 0.464 21.9 0.548 0.389 31.1 0.463 0.350 36.6 LSTM 0.743 0.515 25.6 0.616 0.455 19.2 0.528 0.378 28.8 0.444 0.331 33.4 XGBoost 0.746 0.512 25.5 0.635 0.454 20.3 0.525 0.374 28.2 0.438 0.324 32.3 Random Forest 0.741 0.509 25.1 0.627 0.448 19.3 0.525 0.365 27.3 0.434 0.320 31.5 GC-LSTM 0.738 0.507 24.8 0.604 0.437 16.7 0.521 0.364 26.9 0.426 0.319 30.8 STGCN 0.705 0.486 21.4 0.582 0.426 14.1 0.506 0.352 24.6 0.415 0.304 28.1 DCRNN 0.647 0.478 17.4 0.574 0.412 12.0 0.441 0.332 16.9 0.382 0.294 23.9 Graph Wavenet 0.612 0.475 14.9 0.571 0.404 10.9 0.417 0.304 10.7 0.367 0.264 18.0 ASTGCN 0.566 0.446 8.7 0.540 0.397 7.6 0.409 0.302 9.5 0.354 0.258 15.5 MCPM 0.515 0.409 0.0 0.500 0.366 0.0 0.365 0.277 0.0 0.288 0.226 0.0 注:MCPM模型参数为,使用Adam优化器,初始学习率η0=0.001,epoch=100,α=3,γ=1×e−3,自适应权重参数λ0和λ1初始值为0.5。 在纽约数据集上,MCPM较OLR模型在抢劫和入室盗窃预测上的相对改进率为31.1%和36.6%,提升幅度较大。相比Graph Wavenet、ASTGCN此类表现性能较好的基线模型,MCPM在抢劫预测的相对改进率分别为10.7%和9.5%,在入室盗窃预测的相对改进率分别为18.0%和15.5%。以上结果证明,MCPM模型在抢劫和入室盗窃两类犯罪的时空预测准确度上均表现出了较好的性能。
为检验不同模型在空间维度上的实际预测效果,本文随机选择测试集中的一天进行预测误差空间可视化分析,结果如图5所示。可以看出,OLR以及LSTM等经典时序模型和XGBoost、Random Forest此类机器学习模型的预测结果与实际结果相差较大,加入图拓扑结构的STGCN模型的预测效果优于LSTM此类不考虑空间结构的模型,但也出现了对犯罪热点预测不敏感的情况,这可能与图卷积过程中的过度平滑有关。而Graph Wavenet、ASTGCN模型的表现性能相对较好,可能由于其能够捕捉节点间潜在的空间关系,但在犯罪热点周边的低发区域,也存在误差较大的情况。相比之下,MCPM预测误差相对较小,能够较为准确地识别出犯罪热点地区,同时区分其周围的犯罪冷点,具有空间上的区分度。
为了评估各模型在时间维度上的性能表现,随机选择芝加哥的一个警务辖区对2023年3月的预测结果进行时间可视化分析,如图6所示。由时间序列的局部放大图可以看出,尽管大多数模型都能捕捉到犯罪在平稳趋势下的规律,但在出现非平稳性变化的情况下,MCPM捕捉非单调变化趋势的性能明显优于其他模型,在局部微观层面,MCPM同样具备较强的预测能力。
2.3 消融分析
为了评估MCPM各个模块的作用,本文设计了5种变体。变体M1去除了时空交互注意力机制模块,即将环境特征数据作为节点特征直接输入到预测模型中;变体M2去除了共享特征提取模块,即分别将抢劫和入室盗窃视作单任务预测模型,而不考虑其犯罪关联性;变体M3去除了损失函数中的Ld,即MMD值;变体M4去除了损失函数中不同类型犯罪损失的动态加权因子β;变体M5去除了环境特征数据解释变量,仅考虑历史犯罪数据。
以MCPM为基准,计算其不同变体的相对改进率Δ,消融实验结果如表3所示,可视化结果见图7。总体来看,与抢劫相比,入室盗窃的数据规模相对较小,无论是MCPM本身,还是5个变体均展现出在较小规模数据集上预测性能提升更明显。这一结果表明,本文提出的多类型犯罪时空预测模型能够有效缓解数据稀疏性带来的问题。
表 3 模型及其变体预测性能统计Table 3 Statistical analysis of predictive performance of models and variants消融变体 芝加哥 纽约 抢劫 入室盗窃 抢劫 入室盗窃 RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% M1 0.629 0.531 −26.0 0.614 0.512 −31.4 0.454 0.310 −18.2 0.343 0.261 −17.3 M2 0.690 0.581 −38.0 0.670 0.536 −40.2 0.506 0.366 −35.4 0.439 0.319 −46.8 M3 0.642 0.552 −29.8 0.641 0.473 −28.7 0.473 0.325 −23.5 0.419 0.310 −41.3 M4 0.550 0.447 −8.0 0.545 0.394 −8.3 0.398 0.293 −7.4 0.408 0.302 −37.7 M5 0.690 0.592 −39.4 0.684 0.550 −43.5 0.556 0.404 −49.1 0.504 0.348 −64.5 MCPM 0.515 0.409 0.0 0.500 0.366 0.0 0.365 0.277 0.0 0.288 0.226 0.0 具体来看,5个变体中M5的预测相对改进率Δ下降最大,幅度在39.4%~64.5%,证明环境特征数据解释变量在犯罪预测中的作用极为重要。为更直观地展示环境特征数据对预测结果的影响,随机选择芝加哥测试集中的一天,对比MCPM完整模型与变体M5的预测结果,其可视化结果如图8(a)所示,可以看出POI密集区域及交通便利区域(如芝加哥东部卢普区)在M5中预测误差显著增加,印证了环境特征数据对犯罪预测的贡献。M5之后,M2的性能下降程度排第2,在芝加哥的抢劫和入室盗窃预测分别下降了38.0%和40.2%,在纽约的抢劫和入室盗窃预测分别下降了35.4%和46.8%,图8(b)给出了在芝加哥数据集中MCPM完整模型和变体M2对入室盗窃某月的预测误差对比,可以看出MCPM预测误差显著低于M2变体,同时M2在抢劫高发时段(如图8中26、27日)的预测误差较MCPM更大,表明将不同类型犯罪时空关联性融合进模型能够突破单一犯罪预测模型的信息孤立局限,显著提升预测性能。M3的预测性能下降幅度位于第3位,在23.5%~41.3%,证明通过加入MMD损失能有效避免多任务学习中存在的“负迁移”问题。M1在各类型犯罪的预测性能下降在17.3%~31.4%,表明加入时空交互注意力机制模块能更充分挖掘环境特征数据解释变量对不同类型犯罪的关键特征,有助于进一步提升预测精度。最后,在纽约数据集上,M4在入室盗窃预测的降幅为37.7%,而在抢劫预测的降幅为7.4%,这可能由于入室盗窃的数据规模远小于抢劫,证明在损失函数中加入不同类型犯罪动态加权因子能有效缓解数据规模不同导致的学习不平衡问题。
总结而言,变体M1和M5的性能显著下降(降幅分别达17.3%~31.4%和39.4%~64.5%),表明环境特征数据对于模型预测性能的贡献度最大:M1通过移除时空交互注意力模块削弱了对环境特征数据中关键特征的捕获能力,而M5完全去除环境特征数据则直接割裂了犯罪演化与时空环境的内在关联,两者共同证明了深度挖掘环境特征数据对不同类型犯罪关键特征的重要性。其次,变体M2和M3的性能下降(降幅最高达46.8%),揭示了整合不同类型犯罪之间时空关联性的重要性:M2因忽略犯罪类型关联性导致信息孤立局限,M3去除MMD损失引发多任务负迁移问题,二者印证了基于域适应技术融合犯罪类型时空关联的有效性。最后,变体M4表明了动态加权因子对缓解数据不平衡性的价值,从而有助于提升小样本犯罪类型的预测鲁棒性。这些结果共同验证了MCPM在多类型犯罪时空预测中的有效性和潜力。
2.4 多类型联合训练的作用分析
基于前文所述,本文提出的多类型联合预测模型可以有效提升犯罪时空预测性能。为进一步探究不同类型犯罪私有特征与共享特征的自适应融合机制如何平衡犯罪类型的特异性与关联性,本文将训练过程中共享特征和私有特征的动态权重进行了可视化分析,如图9所示。图9给出了100个epoch内,不同类型犯罪预测的共享特征和私有特征向量的权重值的统计情况。其中λ0表示私有特征向量的权重,λ1表示共享特征向量的权重。实验结果表明,在不同的城市中,不同类型犯罪间的特征贡献度存在差异:在芝加哥,对抢劫预测而言,其私有特征向量和共享特征向量的贡献程度在训练完成时基本持平,但对于入室盗窃预测,最后一次迭代的共享特征权重(λ1=0.543)高于私有特征(λ0=0.457),共享特征向量对犯罪预测的帮助作用更为显著,证明抢劫犯罪的时空分布特征对入室盗窃预测具有知识迁移效应。而在纽约,两类犯罪的私有特征权重均占主导地位,这可能由于城市规模扩大导致的犯罪模式复杂度提升,使得两种类型之间的共同犯罪时空模式更难以捕获。
值得注意的是,尽管存在区域差异,但λ1的分布始终没有出现为零或者过低的情况(最低为纽约入室盗窃的0.356),共享特征始终可以发挥积极的作用,证明了将不同类型犯罪之间的时空关联特征加入犯罪预测模型具有跨区域普适性,再次证实了构建多类型犯罪预测模型的有效性和通用性。
2.5 模型的敏感性分析
对于深度学习而言,参数的重要性不言而喻,因此本文通过开展敏感性实验来分析不同参数对预测结果的影响,从而确定能够取得最高精度预测结果的参数设置。在时间维度设定上,本研究基于犯罪学中的“临近重复理论”构建时间窗口范围,已有研究表明,不同犯罪案件的临近重复发生模式不同,入室盗窃的时空聚类通常持续1~2个月[8, 56],而街头抢劫的聚类周期相对较短,通常在一周内发生[57]。为覆盖短期动态模式与长期趋势,本文选择3 d(周内波动)、7 d(周波动)、15 d(半月)、30 d(月波动)、45 d(1.5个月)及60 d(2个月)作为时间窗口,覆盖犯罪临近重复现象的整个周期过程。实验结果如表4所示,可视化结果如图10所示,可以发现,随着时间窗口的增长,模型性能出现先下降后上升的趋势。在T=30时,预测性能最佳,说明时间步长的适度增加会提供更多的历史信息,而过长的时间步长会使模型的历史记忆中混入较多噪声,导致预测能力的下降或者产生过拟合问题。
表 4 不同时间窗口长度的预测性能统计Table 4 Statistical analysis of predictive metrics with different time window lengths数据集 时间窗口/d 抢劫 入室盗窃 RMSE MAE RMSE MAE 芝加哥 3 0.606 0.517 0.600 0.427 7 0.563 0.445 0.515 0.377 15 0.531 0.418 0.508 0.371 30 0.515 0.409 0.500 0.366 45 0.569 0.468 0.552 0.401 60 0.573 0.472 0.553 0.402 纽约 3 0.575 0.404 0.374 0.314 7 0.482 0.329 0.350 0.287 纽约 15 0.386 0.289 0.304 0.256 30 0.365 0.277 0.288 0.226 45 0.436 0.319 0.310 0.253 60 0.444 0.332 0.316 0.260 为探究特征提取模块中GRU单元隐藏层对模型性能的影响,将隐藏单元设置为Hsize={256,128,96,64,32,16,8}共7种维度。为评估带宽设置的合理性,共设计了7种带宽方案进行性能对比:B1即本文带宽设置方式,采用多个核矩阵与自适应生成带宽的方式;B2使用自适应带宽,但只使用一个核矩阵;B3、B4、B5、B6、B7仍采用多核MMD,但手动设置带宽,分别设置中间带宽B={0.001,0.01,0.1,1,10}。在芝加哥数据集上的实验结果如表5所示,可视化结果见图11。
表 5 不同隐藏层维度和带宽的预测性能统计Table 5 Statistical analysis of predictive metrics with different hidden layer dimensions and bandwidthsHsize 抢劫 入室盗窃 RMSE MAE RMSE MAE 256 0.577 0.455 0.577 0.408 128 0.574 0.445 0.548 0.407 96 0.550 0.424 0.505 0.402 64 0.518 0.404 0.517 0.395 32 0.515 0.409 0.500 0.366 16 0.524 0.437 0.556 0.402 8 0.611 0.541 0.605 0.413 带宽设置 抢劫 入室盗窃 RMSE MAE RMSE MAE B1 0.515 0.409 0.500 0.366 B2 0.546 0.437 0.525 0.386 B3 0.554 0.435 0.518 0.385 B4 0.539 0.429 0.509 0.374 B5 0.533 0.425 0.527 0.395 B6 0.536 0.426 0.517 0.383 B7 0.558 0.447 0.530 0.421 实验结果显示,当隐藏层维度为32、带宽设置方式为B1时,预测性能最佳,表明使用多个带宽能够在多个尺度上有效捕捉数据的特征,使得MMD的估计更加准确。尽管B3、B4、B5、B6、B7的性能表现在不同数据集上有所不同,但B1的性能表现均高于其他带宽设置,展现出较好的鲁棒性,证明MCPM能够根据数据特性的变化自适应调整响应,更好地适应不同的数据分布。
3. 结束语
为了实现多类型犯罪的时空预测,本文提出了一种融合时空交互特征与犯罪时空关联性的多类型犯罪预测模型(MCPM),在芝加哥和纽约两个城市的抢劫和入室盗窃数据集上进行了实验,主要结论如下:
1)相比聚焦于预测单一类型犯罪的时空预测模型,MCPM可同时进行多类型犯罪预测,并且在犯罪时空预测性能上有显著提升。本文所提模型在芝加哥数据集对抢劫、入室盗窃的预测RMSE为0.365和0.288,MAE为0.277和0.226,较基线模型性能提升分别为8.7%~27.2%、7.6%~21.9%,在纽约数据集对抢劫、入室盗窃的预测RMSE为0.365和0.288,MAE为0.277和0.226,较基线模型预测性能提升分别为9.5%~31.1%、15.5%~36.6%。
2)模型消融分析表明,环境特征数据解释变量对于模型预测性能的贡献度最大,有效捕捉环境特征数据对不同类型犯罪的关键特征是提升预测准确性的关键。其次为不同类型犯罪之间的时空关联性,验证了利用域适应技术融合不同类型犯罪时空关联性的合理性,进一步印证了多类型联合预测的有效性。此外,在不同规模数据集上,MCPM对小规模数据集的性能提升更为明显,揭示了多类型联合预测对数据稀缺问题的改进潜力。
3)在不同城市的数据集上,不同类型犯罪的私有特征和共享特征对犯罪预测的贡献程度略有差异,但共享特征始终可以发挥积极的作用,证明了不同犯罪类型之间的时空关联性具有一定的跨区域普适性,再次证实了构建多类型犯罪预测模型的有效性和通用性。
尽管本文在多类型犯罪预测方面取得了一定进展,但仍存在不足之处,未来可在以下方面深入研究:首先,本文仅选择了芝加哥和纽约两个城市中抢劫和入室盗窃两种类型犯罪作为研究对象,但不同城市的模式各有不同,后续研究需要进一步对其他城市以及其他类型犯罪进行实验,以测试模型的泛化能力。其次,本文仅使用两种犯罪类型进行实验分析,随着犯罪类型的不断增加,其共同犯罪模式可能更难以捕获,如何在最大程度利用其相关性的同时避免“负迁移”现象的干扰值得进一步研究。最后,在环境特征数据中仅选择了天气、路网、POI数据作为犯罪预测的解释变量,后续工作中可考虑加入人口和出行数据等其他环境特征数据,进一步提高模型的预测性能。
-
表 1 特征张量的含义和表示形状
Table 1 Definition and shape of feature tensors
数据类型 描述 表示 犯罪数据 带有纬度、经度和时间戳的点数据 ${{ \boldsymbol {X}}_{\mathrm{c}}} \in {{\bf{R}}^{N \times T \times 2}}$ POI数据 包含7种分类:饮食、教育与公共服务、零售、金融与办公、休闲与娱乐、交通与基础设施、住宿服务 ${{ \boldsymbol {X}}_{{\mathrm{POI}}}} \in {{\bf{R}}^N}^{ \times T \times 7}$ 天气数据 大气温度、大气压、相对湿度、平均风速、水平能见度 ${{ \boldsymbol {X}}_{{\mathrm{wea}}}} \in {{\bf{R}}^{N \times T \times 5}}$ 路网数据 路网密度,每平方米的道路长度/(m/m2) ${{ \boldsymbol {X}}_{{\mathrm{road}}}} \in {{\bf{R}}^{N \times T \times 1}}$ 表 2 各模型性能比较
Table 2 Comparison of various model performance
方法 芝加哥 纽约 抢劫 入室盗窃 抢劫 入室盗窃 RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% OLR 0.755 0.529 27.2 0.647 0.464 21.9 0.548 0.389 31.1 0.463 0.350 36.6 LSTM 0.743 0.515 25.6 0.616 0.455 19.2 0.528 0.378 28.8 0.444 0.331 33.4 XGBoost 0.746 0.512 25.5 0.635 0.454 20.3 0.525 0.374 28.2 0.438 0.324 32.3 Random Forest 0.741 0.509 25.1 0.627 0.448 19.3 0.525 0.365 27.3 0.434 0.320 31.5 GC-LSTM 0.738 0.507 24.8 0.604 0.437 16.7 0.521 0.364 26.9 0.426 0.319 30.8 STGCN 0.705 0.486 21.4 0.582 0.426 14.1 0.506 0.352 24.6 0.415 0.304 28.1 DCRNN 0.647 0.478 17.4 0.574 0.412 12.0 0.441 0.332 16.9 0.382 0.294 23.9 Graph Wavenet 0.612 0.475 14.9 0.571 0.404 10.9 0.417 0.304 10.7 0.367 0.264 18.0 ASTGCN 0.566 0.446 8.7 0.540 0.397 7.6 0.409 0.302 9.5 0.354 0.258 15.5 MCPM 0.515 0.409 0.0 0.500 0.366 0.0 0.365 0.277 0.0 0.288 0.226 0.0 注:MCPM模型参数为,使用Adam优化器,初始学习率η0=0.001,epoch=100,α=3,γ=1×e−3,自适应权重参数λ0和λ1初始值为0.5。 表 3 模型及其变体预测性能统计
Table 3 Statistical analysis of predictive performance of models and variants
消融变体 芝加哥 纽约 抢劫 入室盗窃 抢劫 入室盗窃 RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% RMSE MAE Δ/% M1 0.629 0.531 −26.0 0.614 0.512 −31.4 0.454 0.310 −18.2 0.343 0.261 −17.3 M2 0.690 0.581 −38.0 0.670 0.536 −40.2 0.506 0.366 −35.4 0.439 0.319 −46.8 M3 0.642 0.552 −29.8 0.641 0.473 −28.7 0.473 0.325 −23.5 0.419 0.310 −41.3 M4 0.550 0.447 −8.0 0.545 0.394 −8.3 0.398 0.293 −7.4 0.408 0.302 −37.7 M5 0.690 0.592 −39.4 0.684 0.550 −43.5 0.556 0.404 −49.1 0.504 0.348 −64.5 MCPM 0.515 0.409 0.0 0.500 0.366 0.0 0.365 0.277 0.0 0.288 0.226 0.0 表 4 不同时间窗口长度的预测性能统计
Table 4 Statistical analysis of predictive metrics with different time window lengths
数据集 时间窗口/d 抢劫 入室盗窃 RMSE MAE RMSE MAE 芝加哥 3 0.606 0.517 0.600 0.427 7 0.563 0.445 0.515 0.377 15 0.531 0.418 0.508 0.371 30 0.515 0.409 0.500 0.366 45 0.569 0.468 0.552 0.401 60 0.573 0.472 0.553 0.402 纽约 3 0.575 0.404 0.374 0.314 7 0.482 0.329 0.350 0.287 纽约 15 0.386 0.289 0.304 0.256 30 0.365 0.277 0.288 0.226 45 0.436 0.319 0.310 0.253 60 0.444 0.332 0.316 0.260 表 5 不同隐藏层维度和带宽的预测性能统计
Table 5 Statistical analysis of predictive metrics with different hidden layer dimensions and bandwidths
Hsize 抢劫 入室盗窃 RMSE MAE RMSE MAE 256 0.577 0.455 0.577 0.408 128 0.574 0.445 0.548 0.407 96 0.550 0.424 0.505 0.402 64 0.518 0.404 0.517 0.395 32 0.515 0.409 0.500 0.366 16 0.524 0.437 0.556 0.402 8 0.611 0.541 0.605 0.413 带宽设置 抢劫 入室盗窃 RMSE MAE RMSE MAE B1 0.515 0.409 0.500 0.366 B2 0.546 0.437 0.525 0.386 B3 0.554 0.435 0.518 0.385 B4 0.539 0.429 0.509 0.374 B5 0.533 0.425 0.527 0.395 B6 0.536 0.426 0.517 0.383 B7 0.558 0.447 0.530 0.421 -
[1] 刘恩博, 谌恺祺, 石岩, 等. 数据不确定性下的犯罪事件热点探测方法[J]. 武汉大学学报(信息科学版), 2024, 49(12): 2342−2354. LIU Enbo, CHEN Kaiqi, SHI Yan, et al. Hot spot detection method of criminal events under data uncertainty[J]. Geomatics and Information Science of Wuhan University, 2024, 49(12): 2342−2354. [2] 卢建平, 王昕宇. “党的十八大”以来犯罪形势的宏观、中观与微观考察: 基于司法统计数据的分析[J]. 犯罪研究, 2023(1): 32−51. LU Jianping, WANG Xinyu. A macro, meso and micro observation of the crime situation since the 18th National Congress of the CPC: an analysis based on criminal statistics[J]. Chinese criminology review, 2023(1): 32−51. [3] ZHAO Xiangyu, FAN Wenqi, LIU Hui, et al. Multi-type urban crime prediction[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2022, 36(4): 4388−4396. doi: 10.1609/aaai.v36i4.20360 [4] 阎耀军, 张明. 犯罪预测时空定位信息管理系统的构建[J]. 中国人民公安大学学报(社会科学版), 2013, 29(4): 73−80. YAN Yaojun, ZHANG Ming. Construction of information management system for spatial and temporal location of crime prediction[J]. Journal of People’s Public Security University of China (social sciences edition), 2013, 29(4): 73−80. [5] 新浪科技.美警方测试犯罪预测软件可大幅降低犯罪率[EB/OL].(2012−07−17) [2025−05−14]. http://tech.sina.com.cn/d/2012-07-17/08017395390.shtml. [6] 姜春娇, 李慧. 基于犯罪预测智能平台的警务建设研究[J]. 公安研究, 2017(4): 34−40. JIANG Chunjiao, LI Hui. Research on police construction based on intelligent platform of crime prediction[J]. Policing studies, 2017(4): 34−40. [7] 赵锃泽, 刘大千, 郑滋椀, 等. 警务检查活动对盗窃犯罪的空间影响研究: 以浙江海宁市为例[J]. 地理科学进展, 2024, 43(11): 2298−2311. doi: 10.18306/dlkxjz.2024.11.015 ZHAO Zengze, LIU Daqian, ZHENG Ziwan, et al. Spatial influence of police inspection activities on theft crimes: a case study in Haining City, Zhejiang[J]. Progress in geography, 2024, 43(11): 2298−2311. doi: 10.18306/dlkxjz.2024.11.015 [8] 徐冲, 柳林, 周素红. 基于临近相似性考虑的犯罪热点密度图预测准确性比较: 以DP半岛街头抢劫犯罪为例[J]. 地理科学, 2016, 36(1): 55−62. XU Chong, LIU Lin, ZHOU Suhong. The comparison of predictive accuracy of crime hotspot density maps with the consideration of the near similarity: a case study of robberies at DP peninsula[J]. Scientia geographica sinica, 2016, 36(1): 55−62. [9] 柳林, 刘文娟, 廖薇薇, 等. 基于随机森林和时空核密度方法的不同周期犯罪热点预测对比[J]. 地理科学进展, 2018, 37(6): 761−771. doi: 10.18306/dlkxjz.2018.06.003 LIU Lin, LIU Wenjuan, LIAO Weiwei, et al. Comparison of random forest algorithm and space-time kernel density mapping for crime hotspot prediction[J]. Progress in geography, 2018, 37(6): 761−771. doi: 10.18306/dlkxjz.2018.06.003 [10] HUANG Chao, ZHANG Junbo, ZHENG Yu, et al. DeepCrime: attentive hierarchical recurrent networks for crime prediction[C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management. Torino: ACM, 2018: 1423−1432. [11] HUANG Chao, ZHANG Chuxu, ZHAO Jiashu, et al. MiST: a multiview and multimodal spatial-temporal learning framework for citywide abnormal event forecasting[C]//The World Wide Web Conference. San Francisco: ACM, 2019: 717−728. [12] VELIčKOVIć P, CUCURULL G, CASANOVA A, et al. Graph attention networks[C]//International Conference on Learning Representations. Vancouver: ICLR, 2018: 1−12. [13] YU Bing, YIN Haoteng, ZHU Zhanxing. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]//Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence. Stockholm: International Joint Conferences on Artificial Intelligence Organization, 2018: 3634−3640. [14] ZHAO Liupeng. A study on the application of data mining-based crime prediction models in criminal justice[J]. Journal of combinatorial mathematics and combinatorial computing, 2024, 123(1): 559−575. doi: 10.61091/jcmcc123-40 [15] 林逸航, 郑坤, 夏书豪, 等. 融合区域空间相似性特征与事件时空特征的犯罪预测模型[J/OL]. 武汉大学学报(信息科学版). https://doi.org/10.13203/j.whugis20230395. LIN Yihang, ZHENG Kun, XIA Shuhao, et al. A crime prediction model incorporating regional spatial similarity characteristics and spatio-temporal characteristics of events[J/OL]. Geomatics and Information Science of Wuhan University. https://doi.org/10.13203/j.whugis20230395. [16] ZHAO Xiangyu, TANG Jiliang. Modeling temporal-spatial correlations for crime prediction[C]//Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. Singapore: ACM, 2017: 497−506. [17] SHAN Miaoxuan, YE Chunlin, CHEN Peng, et al. Ada-GCNLSTM: an adaptive urban crime spatiotemporal prediction model[J]. Journal of safety science and resilience, 2025, 6(2): 226−236. doi: 10.1016/j.jnlssr.2024.11.003 [18] 石拓, 张齐, 石磊. 多尺度视角特征动态融合的盗窃犯罪预测模型[J]. 智能系统学报, 2022, 17(6): 1104−1112. SHI Tuo, ZHANG Qi, SHI Lei. Prediction model of theft crime based on the dynamic fusion of multiscale perspective characteristics[J]. CAAI transactions on intelligent systems, 2022, 17(6): 1104−1112. [19] 柳林, 纪佳楷, 宋广文, 等. 基于犯罪空间分异和建成环境的公共场所侵财犯罪热点预测[J]. 地球信息科学学报, 2019, 21(11): 1655−1668. LIU Lin, JI Jiakai, SONG Guangwen, et al. Hotspot prediction of public property crime based on spatial differentiation of crime and built environment[J]. Journal of geo-information science, 2019, 21(11): 1655−1668. [20] 贺日兴, 唐宗棣, 姜超, 等. 顾及道路权重的图卷积犯罪时空预测模型[J]. 地球信息科学学报, 2023, 25(10): 1986−1999. HE Rixing, TANG Zongdi, JIANG Chao, et al. A graph convolution-based spatio-temporal crime prediction model considering road weights[J]. Journal of geo-information science, 2023, 25(10): 1986−1999. [21] LI Zhe, ZHANG Xinyue, XU Fang, et al. A multi-scale video surveillance based information aggregation model for crime prediction[J]. Alexandria engineering journal, 2023, 73: 695−707. doi: 10.1016/j.aej.2023.04.045 [22] 李卫红, 闻磊, 陈业滨. 改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 武汉大学学报(信息科学版), 2017, 42(8): 1110−1116,1171. LI Weihong, WEN Lei, CHEN Yebin. Property crime forecast based on improved GA-BP neural network model[J]. Geomatics and information science of Wuhan University, 2017, 42(8): 1110−1116,1171. [23] DAVIES T P, BISHOP S R. Modelling patterns of burglary on street networks[J]. Crime science, 2013, 2(1): 10. doi: 10.1186/2193-7680-2-10 [24] WHEELER A P, REUTER S. Redrawing hot spots of crime in Dallas, Texas[J]. Police quarterly, 2021, 24(2): 159−184. doi: 10.1177/1098611120957948 [25] WHEELER A P, STEENBEEK W. Mapping the risk terrain for crime using machine learning[J]. Journal of quantitative criminology, 2021, 37(2): 445−480. doi: 10.1007/s10940-020-09457-7 [26] YU Hongjie, LIU Lin, YANG Bo, et al. Crime prediction with historical crime and movement data of potential offenders using a spatio-temporal cokriging method[J]. ISPRS international journal of geo-information, 2020, 9(12): 732. doi: 10.3390/ijgi9120732 [27] HAN Xinge, HU Xiaofeng, WU Huanggang, et al. Risk prediction of theft crimes in urban communities: an integrated model of LSTM and ST-GCN[J]. IEEE access, 2020, 8: 217222−217230. doi: 10.1109/ACCESS.2020.3041924 [28] ZHANG Tianyi, RAN Yibing, WEI Dong. Application of grid management in spatio-temporal prediction of crime[C]//2021 33rd Chinese Control and Decision Conference. Kunming: IEEE, 2021: 2745−2749. [29] 徐冲, 柳林, 周素红, 等. 微观空间因素对街头抢劫影响的空间异质性: 以DP半岛为例[J]. 地理研究, 2017, 36(12): 2492−2504. XU Chong, LIU Lin, ZHOU Suhong, et al. Spatial heterogeneity of micro-spatial factors' effects on street robberies: a case study of DP peninsula[J]. Geographical research, 2017, 36(12): 2492−2504. [30] FENG Jiajia, LIANG Yuebing, HAO Qi, et al. Comparing effectiveness of point of interest data and land use data in theft crime modelling: a case study in Beijing[J]. Land use policy, 2024, 147: 107357. doi: 10.1016/j.landusepol.2024.107357 [31] LEE D W, LEE D S. Analysis of influential factors of violent crimes and building a spatial cluster in south Korea[J]. Applied spatial analysis and policy, 2020, 13(3): 759−776. doi: 10.1007/s12061-019-09327-1 [32] SUMMERS L, JOHNSON S D. Does the configuration of the street network influence where outdoor serious violence takes place? using space syntax to test crime pattern theory[J]. Journal of quantitative criminology, 2017, 33(2): 397−420. doi: 10.1007/s10940-016-9306-9 [33] RISTEA A, BONI M I, RESCH B, et al. Spatial crime distribution and prediction for sporting events using social media[J]. International journal of geographical information science, 2020, 34(9): 1708−1739. doi: 10.1080/13658816.2020.1719495 [34] 沈兵. 城市犯罪风险时空分布预测方法研究[D]. 北京: 中国人民公安大学, 2022. SHEN Bing. Study on the prediction method of urban crime risk spatial and temporal distribution[D]. Beijing: Chinese People’s Public Security University, 2022. [35] SAMPSON R J, GROVES W B. Community structure and crime: testing social-disorganization theory[J]. American journal of sociology, 1989, 94(4): 774−802. doi: 10.1086/229068 [36] 柳林, 杜方叶, 宋广文, 等. 犯罪共生空间的类型识别及其特征分析[J]. 地理科学, 2018, 38(8): 1199−1209. LIU Lin, DU Fangye, SONG Guangwen, et al. Detecting and characterizing symbiotic clusters of crime[J]. Scientia geographica sinica, 2018, 38(8): 1199−1209. [37] 王文汐, 霍宏涛, 蒋晨琛. 毒品犯罪与次生犯罪共生关系: 以华北沿海T市为例[J]. 科学技术与工程, 2023, 23(33): 14486−14496. WANG Wenxi, HUO Hongtao, JIANG Chenchen. Exploring colocalization relationship between drug-related crimes and secondary crimes: take T city on the coast of North China as an example[J]. Science technology and engineering, 2023, 23(33): 14486−14496. [38] CELIK M. Partial spatio-temporal co-occurrence pattern mining[J]. Knowledge and information systems, 2015, 44(1): 27−49. doi: 10.1007/s10115-014-0750-2 [39] LI Ling, CHENG Jianquan, BANNISTER J, et al. Geographically and temporally weighted co-location quotient: an analysis of spatiotemporal crime patterns in greater Manchester[J]. International journal of geographical information science, 2022, 36(5): 918−942. doi: 10.1080/13658816.2022.2029454 [40] DE OLIVEIRA V H, DE MEDEIROS C N, CARVALHO J R. Violence and local development in Fortaleza, Brazil: a spatial regression analysis[J]. Applied spatial analysis and policy, 2019, 12(1): 147−166. doi: 10.1007/s12061-017-9236-4 [41] ZHANG Yang, CHENG Tao. Graph deep learning model for network-based predictive hotspot mapping of sparse spatio-temporal events[J]. Computers, environment and urban systems, 2020, 79: 101403. doi: 10.1016/j.compenvurbsys.2019.101403 [42] ZHAO Ling, SONG Yujiao, ZHANG Chao, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE transactions on intelligent transportation systems, 2020, 21(9): 3848−3858. doi: 10.1109/TITS.2019.2935152 [43] FARRELL G, PEASE K. Once bitten, twice bitten: Repeat victimisation and its implications for crime prevention[M]. London: Home Office Police Research Group, 1993: 46−52. [44] SCHÖLKOPF B, PLATT J, HOFMANN T. Analysis of representations for domain adaptation[C]//Advances in Neural Information Processing Systems 19: Proceedings of the 2006 Conference. Vancouver: MIT Press, 2007: 137−144. [45] City of Chicago Open Data Portal[DB/OL]. (2024−07−30) [2025−01−04]. https://data.cityofchicago.org. [46] NYC Open Data[DB/OL]. (2024−12−01) [2025−01−04]. https://opendata.cityofnewyork.us. [47] ECK J E, WEISBURD D. Crime places in crime theory[J]. Social science electronic publishing, 1995, 4: 1−33. [48] 贺日兴, 陆宇梅, 姜超, 等. 近10年来犯罪时空预测国内外研究与实践进展[J]. 地球信息科学学报, 2023, 25(4): 866−882. HE Rixing, LU Yumei, JIANG Chao, et al. Progress in research and practice of spatial-temporal crime prediction over the past decade[J]. Journal of geo-information science, 2023, 25(4): 866−882. [49] 顾海硕, 陈鹏, 李慧波. 犯罪时空预测方法研究综述与展望[J]. 地球信息科学学报, 2021, 23(1): 43−57. GU Haishuo, CHEN Peng, LI Huibo. Overview and prospect for spatial-temporal prediction of crime[J]. Journal of geo-information science, 2021, 23(1): 43−57. [50] CHEN Tianqi, HE Tong, BENESTY M, et al. Xgboost: extreme gradient boosting[C]//Processdings of 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Franciso:Association for Gomputing Machinery, 2016: 785−799. [51] ALVES L G A, RIBEIRO H V, RODRIGUES F A. Crime prediction through urban metrics and statistical learning[J]. Physica A: statistical mechanics and its applications, 2018, 505: 435−443. doi: 10.1016/j.physa.2018.03.084 [52] SHI Xingjian, CHEN Zhourong, WANG Hao, et al. Convolutional LSTM network: a machine learning approach for precipitation nowcasting[C]//Advances in Neural Information Processing Systems 28 (NIPS 2015). Montreal: MIT Press, 2015: 802−810. [53] LI Yaguang, YU R, SHAHABI C, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting[EB/OL]. (2017−07−06)[2025−01−24]. https://arXiv.org/abs/1707.01926. [54] WU Zonghan, PAN Shirui, LONG Guodong, et al. Graph wavenet for deep spatial-temporal graph modeling[EB/OL]. (2019−06−01)[2025−01−24]. https://arxiv.org/abs/1906.00121. [55] RAYHAN Y, HASHEM T. AIST: an interpretable attention-based deep learning model for crime prediction[J]. ACM transactions on spatial algorithms and systems, 2023, 9(2): 1−31. [56] ZHANG Yan, ZHAO Jihong, REN Ling, et al. Space–time clustering of crime events and neighborhood characteristics in Houston[J]. Criminal justice review, 2015, 40(3): 340−360. doi: 10.1177/0734016815573309 [57] HABERMAN C P, RATCLIFFE J H. The predictive policing challenges of near repeat armed street robberies[J]. Policing, 2012, 6(2): 151−166. doi: 10.1093/police/pas012
下载:

















































