基于区域环境与犯罪事件数据的疑犯位置预测方法技术

技术编号:19544193 阅读:21 留言:0更新日期:2018-11-24 20:41
本发明专利技术公开了一种基于区域环境与犯罪事件数据的疑犯位置预测方法,包括空间网格化、疑犯社会活动时空分布、位置特征抽取、基于案件时空信息的疑犯关联性表达、张量和矩阵的协同分解、疑犯社会活动位置预测等步骤。本发明专利技术通过融合区域社会环境数据和犯罪历史数据,进行了疑犯社会活动位置预测建模,为疑犯位置跟踪数据稀疏性带来的问题提供有效的解决方法,对提高位置时空预测的有效性和健壮性有着重要的作用,实现疑犯位置的时空预测。

Prediction Method of Suspect Location Based on Regional Environment and Criminal Event Data

The invention discloses a suspect location prediction method based on regional environment and crime event data, which includes spatial gridding, spatial and temporal distribution of suspect social activities, location feature extraction, expression of suspect relevance based on case spatial and temporal information, cooperative decomposition of tensor and matrix, prediction of suspect social activities location, etc. The method integrates the regional social environment data and criminal history data, carries out the prediction model of suspect's social activity location, provides an effective solution to the problem caused by the sparseness of suspect's position tracking data, plays an important role in improving the validity and robustness of spatial-temporal location prediction, and realizes the time of suspect's position. Null prediction.

【技术实现步骤摘要】
基于区域环境与犯罪事件数据的疑犯位置预测方法
本专利技术属于地理信息科学、数据挖掘
,涉及疑犯时空位置预测、疑犯时空信息挖掘、尤其涉及基于区域环境与犯罪事件数据的疑犯位置预测方法。
技术介绍
受益于当前信息化技术的进步和普及,警方能通过多种信息化途径和设备对重点跟踪对象日常行为的发生位置进行监控,从而了解和掌握他们的行为及行为发生的位置。通过整合网吧监控、出租屋管理、旅店业管理、手机定位、进出港管理等业务系统中的业务数据,警用信息共享平台已经可以记录疑犯社会活动数据,了解疑犯的驻留情况。基于这些跟踪数据进行疑犯位置预测,能为揭示疑犯日常时空分布模式、进行警力配属分析和案件侦破提供重要技术支撑,具有重要的实战价值。在犯罪地理学中,与犯罪个体位置预测相关的研究称为犯罪地理画像(CrimeGeographicProfiling),研究者们基于犯罪个体的系列犯罪位置数据,采用平均作案距离、用地类型、犯罪类型、路网结构,同心圆、距离衰减函数、贝叶斯公式、动力学模型和回归模型等模型,估算锚点(住址或下一犯罪地点等预测者感兴趣的位置)在空间上的出现概率。然而,大部分CGP研究是依据系列犯罪分子的历史犯罪位置预测其住址的空间分布概率,目前还没有依据疑犯的日常社会活动数据预测疑犯在多种类型位置上的空间分布概率;其次,由于现实中位置探测源数量和类型有限,疑犯个体位置跟踪数据非常稀疏,仅能反映疑犯日常生活中零碎且片面的时空分布情况,这严重降低了位置预测的准确性;此外,已有CGP模型没有考虑时间因素对预测准确性的影响。因此,已有CGP模型在数据来源、目的和方法都难以满足警方对疑犯位置预测的要求。近年来,基于车辆定位数据、WIFI信号、移动手机信号数据、公共交通刷卡数据和地理社交网络check-in数据等的位置预测成为学术界和工业界的研究热点。为解决用户位置数据稀疏性的问题,这些研究将社交亲密度、路网密度或社会经济环境等外部信息引入预测模型,有效提高了模型准确性。然而,我们的应用中缺少疑犯间社交或通讯数据,也没有社会经济环境信息的支持,警方很难预测出疑犯的位置。
技术实现思路
本专利技术的目的为解决现有技术的上述问题,提供一种基于区域环境与犯罪事件数据的疑犯位置预测方法。本专利技术融合区域社会环境数据和犯罪历史数据,进行了疑犯社会活动位置预测建模,为疑犯位置跟踪数据稀疏性带来的问题提供有效的解决方法,对提高位置时空预测的有效性和健壮性有着重要的作用,实现疑犯位置的时空预测。为了达到上述所述技术效果,本专利技术采用以下技术方案:一种基于区域环境与犯罪事件数据的疑犯位置预测方法,实施包括以下步骤:(1)空间网格化:将疑犯位置数据集进行空间网格化得到疑犯位置访问强度网格,获得g×g格网,G={p1,p2,…,pi,…,pg×g},其中,G表示位置总数,pi为格网G中的单个网格,每个网格作为样本和结果表达基本空间单元,用以表示疑犯在该位置的时空驻留强度和犯罪事件数量;(2)疑犯社会活动时空分布:根据疑犯位置访问强度网格,利用张量和矩阵表达疑犯、时间与空间的关系,构建反映疑犯个体的时空位置访问频度“疑犯-位置-时段”张量Q、“位置-时段”矩阵D和“疑犯-位置”矩阵E,以表达疑犯群体的时空分布特征;(3)位置特征抽取:根据社会经济环境,将POI特征集Fp、路网特征集Fr、建筑物特征集Fb和人口统计特征集Fc按照网格尺度汇集,构建“位置-特征”矩阵;(4)基于案件时空信息的疑犯关联性表达:根据疑犯历史案情构建案件时空相似性,通过疑犯的犯罪案件时空相似性表达疑犯间的关联性,并据此建立“疑犯-疑犯”关联矩阵,以表达疑犯关联性;(6)张量和矩阵的协同分解:利用“疑犯-位置”矩阵E、“位置-时段”矩阵D、“位置-特征”矩阵C和“疑犯-疑犯”关联矩阵F信息的交互关系进行协同分解,获得融合疑犯移动趋势和疑犯间关联性的张量因子分解目标函数;(6)疑犯社会活动位置预测;根据步骤(5)的目标函数,基于PARAFAC-style张量分解方法找出该目标函数的最优解,实现疑犯个体在任意时空节点的驻留强度估算,最终预测出疑犯的所在位置。进一步地,在步骤(2)中,所述“疑犯-位置-时段”张量的建立过程步骤为:利用每个疑犯在各网格上的驻留次数,构建反映疑犯个体的时空位置访问频度“疑犯-位置-时段”张量:Q∈R|U|×|G|×|T|或Q≈δ×u×J×T,表达疑犯、位置和时间的相互关系;所述“疑犯-位置”矩阵为E∈R|U|×|G|或E≈u×JT,表达各疑犯的全局空间分布模式,该矩阵反映了各位置对所有疑犯的普遍重要程度;所述“位置-时段”矩阵为D∈R|G|×|T|或D≈J×TT,该矩阵刻画所有疑犯的全局时空分布模式,能为那些仅有很少跟踪记录的疑犯提供其时空分布的先验知识;其中,|U|为疑犯数量;|G|为网格数量;|T|为时段数量;J表示位置低价潜在因子矩阵T表示时间低价潜在因子矩阵δ表示核张量u表示疑犯低价潜在因子矩阵T表示矩阵的转置,du、dl和dt分别为各自矩阵的潜在因子维度,du≤u,dl≤g,dt≤t且du=dl=dt。进一步地,在步骤(3),所述POI特征集Fp为:该位置内POI的空间密度以及12个类型的POI数量共13个特征;为体现出该区域的独有社会经济环境特性,借鉴文TF-IDF方法,将位置i中类型为j的POI数量qij转换为POI类型重要度Yij:其中,O为POI类型数量;|G|表示位置总数;|{qi:qij>0}|表示具有POI类型j的位置个数;所述路网特征集Fr为:该位置内的路口数量和5个等级(高速公路、一级公路、二级公路、三级公路及四级公路)的道路长度共6个指标;所述建筑物特征集Fb为:楼房密度、5类房屋(住宅型、商业性、行政型、工业型、其他)的数量分布、3类高度(低层、多层、高层)房屋的数量分布共9个指标;所述人口统计特征集Fc为:涉及10个指标,分别是人口密度、4个年龄段的人口数量分布、5类教育程度的人口分布;4个年龄段分别为18岁以下、18-40岁,40-60岁,60岁以上;5类教育程度分别为文盲、初中、高中、大学、研究生。进一步地,在步骤(3),所述“位置-特征”矩阵:C∈RG×(p+r+b+c)或其中,p、r、b和c分别表示POI特征集Fp、路网特征集Fr、建筑物特征集Fb和人口统计特征集Fc的特征个数。进一步地,对于category类型属性,将其转变为1和0表示的one-hot向量结构,放入C中。进一步地,在步骤(4),所述“疑犯-疑犯”关联矩阵F∈R|U|×|U|或F≈u×uT,其中,|U|为疑犯数量。进一步地,在步骤(4),所述案件时空相似性的构建方法为:依据疑犯的历史案件数据隐含的时空位置信息和犯罪类型信息刻画他们的犯罪案件时空相似性,按照时间顺序将疑犯历史案件位置串起来形成轨迹,再通过比较两疑犯历史犯罪轨迹的最短k距离序列计算他们的犯罪案件时空相似性,疑犯m的历史犯罪轨迹Hm。进一步地,所述疑犯m的历史犯罪轨迹Hm为:Hm=s1(t1,p1,c1)→s2(t2,p2,c2)→…→sn(tn,pn,cn)其中t,p和c表示犯罪事件s发生的时间、地点和犯罪类型;最短k距离序列:给定轨迹H1=[a1,a2,…,ak]和H2=[本文档来自技高网
...

【技术保护点】
1.一种基于区域环境与犯罪事件数据的疑犯位置预测方法,其特征在于:实施包括以下步骤:(1)空间网格化:将疑犯位置数据集进行空间网格化得到疑犯位置访问强度网格,获得g×g格网,G={p1,p2,…,pi,…,pg×g},其中,G表示位置总数,pi为格网G中的单个网格,每个网格作为样本和结果表达基本空间单元,用以表示疑犯在该位置的时空驻留强度和犯罪事件数量;(2)疑犯社会活动时空分布:根据疑犯位置访问强度网格,利用张量和矩阵表达疑犯、时间与空间的关系,构建反映疑犯个体的时空位置访问频度“疑犯‑位置‑时段”张量Q、“位置‑时段”矩阵D和“疑犯‑位置”矩阵E,以表达疑犯群体的时空分布特征;(3)位置特征抽取:根据社会经济环境,将POI特征集Fp、路网特征集Fr、建筑物特征集Fb和人口统计特征集Fc按照网格尺度汇集,构建“位置‑特征”矩阵;(4)基于案件时空信息的疑犯关联性表达:根据疑犯历史案情构建案件时空相似性,通过疑犯的犯罪案件时空相似性表达疑犯间的关联性,并据此建立“疑犯‑疑犯”关联矩阵,以表达疑犯关联性;(5)张量和矩阵的协同分解:利用“疑犯‑位置”矩阵E、“位置‑时段”矩阵D、“位置‑特征”矩阵C和“疑犯‑疑犯”关联矩阵F信息的交互关系进行协同分解,获得融合疑犯移动趋势和疑犯间关联性的张量因子分解目标函数;(6)疑犯社会活动位置预测;根据步骤(5)的目标函数,基于PARAFAC‑style张量分解方法找出该目标函数的最优解,实现疑犯个体在任意时空节点的驻留强度估算,最终预测出疑犯的所在位置。...

【技术特征摘要】
1.一种基于区域环境与犯罪事件数据的疑犯位置预测方法,其特征在于:实施包括以下步骤:(1)空间网格化:将疑犯位置数据集进行空间网格化得到疑犯位置访问强度网格,获得g×g格网,G={p1,p2,…,pi,…,pg×g},其中,G表示位置总数,pi为格网G中的单个网格,每个网格作为样本和结果表达基本空间单元,用以表示疑犯在该位置的时空驻留强度和犯罪事件数量;(2)疑犯社会活动时空分布:根据疑犯位置访问强度网格,利用张量和矩阵表达疑犯、时间与空间的关系,构建反映疑犯个体的时空位置访问频度“疑犯-位置-时段”张量Q、“位置-时段”矩阵D和“疑犯-位置”矩阵E,以表达疑犯群体的时空分布特征;(3)位置特征抽取:根据社会经济环境,将POI特征集Fp、路网特征集Fr、建筑物特征集Fb和人口统计特征集Fc按照网格尺度汇集,构建“位置-特征”矩阵;(4)基于案件时空信息的疑犯关联性表达:根据疑犯历史案情构建案件时空相似性,通过疑犯的犯罪案件时空相似性表达疑犯间的关联性,并据此建立“疑犯-疑犯”关联矩阵,以表达疑犯关联性;(5)张量和矩阵的协同分解:利用“疑犯-位置”矩阵E、“位置-时段”矩阵D、“位置-特征”矩阵C和“疑犯-疑犯”关联矩阵F信息的交互关系进行协同分解,获得融合疑犯移动趋势和疑犯间关联性的张量因子分解目标函数;(6)疑犯社会活动位置预测;根据步骤(5)的目标函数,基于PARAFAC-style张量分解方法找出该目标函数的最优解,实现疑犯个体在任意时空节点的驻留强度估算,最终预测出疑犯的所在位置。2.根据权利要求1所述的基于区域环境与犯罪事件数据的疑犯位置预测方法,其特征在于:在步骤(2)中,所述“疑犯-位置-时段”张量的建立过程步骤为:利用每个疑犯在各网格上的驻留次数,构建反映疑犯个体的时空位置访问频度“疑犯-位置-时段”张量:Q∈R|U|×|G|×|T|或Q≈δ×u×J×T,表达疑犯、位置和时间的相互关系;所述“疑犯-位置”矩阵为E∈R|U|×|G|或E≈u×JT,表达各疑犯的全局空间分布模式,该矩阵反映了各位置对所有疑犯的普遍重要程度;所述“位置-时段”矩阵为D∈R|G|×|T|或D≈J×TT,该矩阵刻画所有疑犯的全局时空分布模式,能为那些仅有很少跟踪记录的疑犯提供其时空分布的先验知识;其中,|U|为疑犯数量;|G|为网格数量;|T|为时段数量;J表示位置低价潜在因子矩阵T表示时间低价潜在因子矩阵δ表示核张量u表示疑犯低价潜在因子矩阵T表示矩阵的转置,du、dl和dt分别为各自矩阵的潜在因子维度,du≤u,dl≤g,dt≤t且du=dl=dt。3.根据权利要求1所述的基于区域环境与犯罪事件数据的疑犯位置预测方法,其特征在于:在步骤(3),所述POI特征集Fp为:该位置内POI的空间密度以及12个类型的POI数量共13个特征;为体现出该区域的独有社会经济环境特性,借鉴文TF-IDF方法,将位置i中类型为j的POI数量qij转换为POI类型重要度Yij:其中,O为POI类型数量;|G|表示位置总数;|{qi:qij>0}|表示具有POI类型j的位置个数;所述路网特征集Fr为...

【专利技术属性】
技术研发人员:段炼胡宝清韦英岸
申请(专利权)人:广西师范学院
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1