一种细粒度的城市犯罪预测方法及系统技术方案

技术编号:31831146 阅读:20 留言:0更新日期:2022-01-12 13:07
本发明专利技术涉及一种细粒度的城市犯罪预测方法,包括:给定P个目标区域、M个犯罪类别和T个时间段,组织成三维张量χ;给定目标区域之间的距离信息和目标区域的特征向量,计算拉普拉斯矩阵L1和L2;给定时间间隔K,对每个待预测的时间段t(K+1≤t≤T),将时间段t

【技术实现步骤摘要】
一种细粒度的城市犯罪预测方法及系统


[0001]本专利技术涉及城市计算领域,尤其涉及一种细粒度的城市犯罪预测方法及系统。

技术介绍

[0002]犯罪预测旨在预测给定的一个或多个区域未来某段时间内的犯罪活动情况。一方面,已有方法对“犯罪活动情况”的定义不尽相同。比如,有的方法试图推断给定区域在未来某段时间内是否有犯罪活动,有的方法致力于识别犯罪热点区域,即找出高危区域。这些方法的预测粒度比较粗,不能满足一些实际应用的需求。另一方面,犯罪活动具有显著的时间、空间和类别关联。比如,两个区域距离越近,犯罪数据(如案件数、犯罪率等)往往越相似。又如,一些盗窃类案件与毒品类案件密切相关。这是因为犯罪分子没有足够的钱购买毒品,铤而走险选择盗窃来获取财物以购买毒品。已有方法大多没有充分利用犯罪数据中蕴含的时间、空间和类别关联来提高预测性能。

技术实现思路

[0003]专利技术目的:本专利技术旨在提供一种细粒度的犯罪预测方法及系统,通过融合时间、空间和类别关联提高预测性能。其中,细粒度是指,预测给定区域在未来某段时间内隶属于每个犯罪类别的案件数。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种细粒度的城市犯罪预测方法,其特征在于,包括如下步骤:步骤一:给定P个目标区域、M个犯罪类别和T个时间段(如天、星期等),将历史犯罪数据组织成一个三维张量其中表示第i个区域内第m类案件在第t个时间段的数量;步骤二:给定目标区域之间的距离信息和目标区域的特征向量,计算拉普拉斯矩阵L1和L2;步骤三:给定时间间隔K,对每个待预测的时间段t,K+1≤t≤T,将时间段t

K到t

1内的犯罪数据组织成向量X
t
;步骤四:对每个待预测的时间段t,K+1≤t≤T,利用向量自回归模型推断该时间段内每个区域各类案件的数量,所有待预测的时间段对应的预测结果构成张量步骤五:利用张量和以及拉普拉斯矩阵L1和L2,构造目标函数进而得到优化问题其中是向量自回归模型中涉及的回归系数张量,rank(
·
)表示张量的秩;ρ表示低秩约束阈值;步骤六:求解优化问题,得到回归系数张量的估计值步骤七:给定时间段T

>T,将时间段T
′‑
K到T
′‑
1内的犯罪数据组织成向量X
T

,利用向量自回归模型推断该时间段内每个区域各类案件的数量。2.根据权利要求1所述的细粒度的城市犯罪预测方法,其特征在于,步骤二中,所述给定目标区域之间的距离信息和目标区域的特征向量,计算拉普拉斯矩阵L1和L2,具体包括:将区域i和i

之间的距离记为d
ii

,构造距离相似性矩阵其中μ1和σ1是所有区域之间距离的均值和方差;利用公式L1=D1‑
S1,计算得到拉普拉斯矩阵L1,其中是空间距离的相似矩阵,对角元素D
ii
=∑
j
S
ij
,剩余元素为0;将区域i对应的特征向量记为f
i
,构造特征相似性矩阵其中Dist(i,i

)是特征向量f
i
和f
i

之间的欧氏距离,μ2和σ2是所有特征向量之间距离的均值和方差;利用公式L2=D2‑
S2,计算得到拉普拉斯矩阵L2,其中是区域特征的相似矩阵,对角元素D
ii
=∑
j
S
ij
,剩余元素为0。3.根据权利要求1所述的细粒度的城市犯罪预测方法,其特征在于,步骤三中,所述给定时间间隔K,对每个待预测的时间段t,K+1≤t≤T,将时间段t

K到t

1内的犯罪数据组织成向量X
t
,具体包括:对每个待预测的时间段t,定义一个K
×
T的矩阵I
t
,其中I
i,t

(K

i+1)
=1,1≤i≤K;根据公式计算第m类案件对应的矩阵::m符号中冒号表示张量取对应维度的所有元素,冒号表示法下同;根据公式构造向量X
t
,表示矩阵
的第i行。4.根据权利要求1所述的细粒度的城市犯罪预测方法,其特征在于,步骤四中,所述对每个待预测的时间段t,K+1≤t≤T,利用向量自回归模型推断该时间段内每个区域各类案件的数量,所有待预测的时间段对应的预测结果构成张量具体包括:根据公式计算第m类案件在第t个时间段内的案件数,其中是待学习的回归系数张量,ξ
:tm
是第m类案件在第t个时间段内的噪声张量,服从均值为0、方差为1的多元高斯分布;张量中包含了所有待预测的时间段对应的预测结果。5.根据权利要求1所述的细粒度的城市犯罪预测方法,其特征在于,步骤五中,所述利用张量和以及拉普拉斯矩阵L1和L2,构造目标函数进而得到优化问题其中是向量自回归模型中涉及的回归系数张量,rank(
·
)表示张量的秩,具体包括:根据公式构造目标函数其中,M指犯罪类别数量,是从时间段K+1到T的历史犯罪数据对应的张量,α1和α2用于平衡两种空间因素的权重,tr(
·
)表示矩阵的迹;公式中后两项使得距离相近和特征相似的区域,具有相似的案件数;其中||
·
||
F
表示Frobenius范数;由于L1和L2是对称正定矩阵,所以有其中,H是由Cholesky分解得到的下三角矩阵,I
P
是P
×
P的单位矩阵;进而,将目标函数简化为在此基础上,得优化问题6.根据权利要求5所述的细粒度的城市犯罪预测方法,其特征在于,步骤六中,所述求解优化问题,得到回归系数张量的估计值具体包括:令那么等价于为了求得回归系数张量对做CANDECOMP/PARAFAC(CP)分解;具体来说,给定维度n,1≤n≤3,得优化问题其中,其中,其中,X

(n)
是把张量沿着第n维展开得到的矩阵,diag(X,X,

,X)表示以X为对角元素的块对角矩阵,是对做CP分解得到的因子矩阵,R是张量的CP
秩,

表示Khatri

Rao积;利用交替最小化算法,求得因子矩阵A、B、C的值;利用公式得到张量其中refOld1(
·
)表示将矩阵沿着第1个维度恢复为一个张量;利用公式得回归系数张量的估计值7.根据权利要求1所述的细粒度的城市犯罪预测方法,其特征在于,步骤七中,所述给定时间段T

>T,将时间段T
′‑
K到T
′‑
1内的犯罪数据组织成向量X
T

,利用向量自回归模型推断该时间段内每个区域各类案件的数量,具体包括:将第m类案件在时间段T
′‑
K到T
′‑
...

【专利技术属性】
技术研发人员:张璐伍之昂方昌健
申请(专利权)人:南京审计大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1