当前位置: 首页 > 专利查询>石拓专利>正文

一种犯罪时空预测方法及系统技术方案

技术编号:26260260 阅读:25 留言:0更新日期:2020-11-06 17:55
本发明专利技术涉及一种犯罪时空预测方法及系统,对待预测区域的地图进行网格划分,利用多粒度卷积神经网络数据处理模型得到每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列,然后运用GloVe自然语言处理方法将各个序列表示为向量矩阵,所有向量矩阵按照日期拼接成每个网格的多维特征向量矩阵,基于自注意力机制的动态融合算法模型确定每个网格的加权多维特征向量矩阵,采用多窗口编码器对加权多维特征向量矩阵进行信息编码,获得的不同长度窗口捕获的编码特征作为训练集训练分类器,最后利用训练好的分类器预测每个网格在目标日期的犯罪案件发生数量,实现了高效地对犯罪开展时空分析预测。

【技术实现步骤摘要】
一种犯罪时空预测方法及系统
本专利技术涉及犯罪智能预测领域,特别是涉及一种犯罪时空预测方法及系统。
技术介绍
虽然人工智能技术在犯罪领域已经有了较大进步,但是由于犯罪数据获取困难的限制,很多成果还只是停留在研究层面,不能有效对接实战,无法为实战服务,且当前犯罪相关数据更多的还是停留于查询检索应用阶段,针对数据的深入分析研判和深度应用是十分薄弱的。
技术实现思路
本专利技术的目的是提供一种犯罪时空预测方法及系统,以实现高效地对犯罪开展时空分析预测。为实现上述目的,本专利技术提供了如下方案:一种犯罪时空预测方法,所述预测方法包括:对待预测区域的地图进行网格划分,并获取每个网格在预设历史时期内犯罪案件发生的时间;根据所述犯罪案件发生的时间,确定每个网格在预设历史时期内每天的犯罪案件个数;利用多粒度卷积神经网络数据处理模型,将每个网格在预设历史时期内每天的犯罪案件个数、每天的天气和每天的日期,以及每个网格所属的地域以天为单位分别填充成相同天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列;运用GloVe自然语言处理方法,将所述犯罪案件个数序列、所述天气序列、所述日期序列和所述地域序列分别表示为相同维度的向量矩阵,并将所有向量矩阵按照日期拼接成每个网格的多维特征向量矩阵;根据所述每个网格的多维特征向量矩阵,利用基于自注意力机制的动态融合算法模型,确定每个网格的加权多维特征向量矩阵;采用多窗口编码器对所述加权多维特征向量矩阵进行信息编码,获得不同长度窗口捕获的编码特征;将所述不同长度窗口捕获的编码特征作为训练集对分类器进行训练,获得训练好的分类器;将目标日期、目标日期的天气和每个网格所属的地域输入所述训练好的分类器,预测所述待预测区域的每个网格在目标日期的犯罪案件发生数量。可选的,所述根据所述犯罪案件发生的时间,确定每个网格在预设历史时期内每天的犯罪案件个数,之后还包括:确定每个网格在预设历史时期内所有的犯罪案件个数的中位数Xmedium;计算每个网格在预设历史时期内每天的犯罪案件个数分别与所述中位数的绝对偏差值;确定所有绝对偏差值的中位数MAD;根据所述犯罪案件个数的中位数Xmedium和所述绝对偏差值的中位数MAD,确定犯罪案件个数的范围为[Xmedium-n×MAD,Xmedium+n×MAD];将犯罪案件个数不在[Xmedium-n×MAD,Xmedium+n×MAD]范围内的网格的犯罪案件个数的值设置为0;其中,n为比例因子常量。可选的,所述利用多粒度卷积神经网络数据处理模型,将每个网格在预设历史时期内每天的犯罪案件个数、每天的天气和每天的日期,以及每个网格所属的地域以天为单位分别填充成相同天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列,具体包括:将预设历史时期内每天的犯罪案件个数按照日期表示为案件个数初始序列;将预设历史时期内每天的天气按照日期表示为天气初始序列;将预设历史时期内每天的日期按照日期表示为日期初始序列;将预设历史时期内每个网格所属的地域按照日期以天为单位表示为地域初始序列;利用多粒度卷积神经网络数据处理模型,将所述案件个数初始序列、所述天气初始序列、所述日期初始序列和所述地域初始序列填充成预设天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列。可选的,所述运用GloVe自然语言处理方法,将所述犯罪案件个数序列、所述天气序列、所述日期序列和所述地域序列分别表示为相同维度的向量矩阵,并将所有向量矩阵按照日期拼接成每个网格的多维特征向量矩阵,具体包括:利用训练好的基于GloVe方法的词向量表示模型,将所述犯罪案件个数序列中每天的犯罪案件个数、所述天气序列中每天的天气、所述日期序列中每天的日期和所述地域序列中的地域分别转化为相同维度的向量;所述犯罪案件个数序列中所有的向量构成犯罪案件个数向量矩阵,所述天气序列中所有的向量构成天气向量矩阵,所述日期序列中所有的向量构成日期向量矩阵,所述地域序列中所有的向量构成地域向量矩阵;将犯罪案件个数向量矩阵、天气向量矩阵、日期向量矩阵和地域向量矩阵中相同日期的个数向量、天气向量、日期向量矩阵和地域向量进行拼接,构成每个网格的多维特征向量矩阵。可选的,所述根据所述每个网格的多维特征向量矩阵,利用基于自注意力机制的动态融合算法模型,确定每个网格的加权多维特征向量矩阵,具体包括:将所述多维特征向量矩阵中每个日期对应的向量作为所述多维特征向量矩阵的元素,并将每个元素分别赋一个key值;分别计算第i个元素的key值与所述多维特征向量中的每个元素的key值的相似度;利用softmax将所有的相似度进行归一化,获得相似度的归一化值;根据公式xi′=k1x1+k2x2+…+knxn,获得第i个元素的加权向量xi′;所有加权向量构成每个网格的加权多维特征向量矩阵;其中,k1为第i个元素的key值与多维特征向量中第1个元素的key值的相似度的归一化值,k2为第i个元素的key值与多维特征向量中第2个元素的key值的相似度的归一化值,kn为第i个元素的key值与多维特征向量中第n个元素的key值的相似度的归一化值,x1、x2、xn分别为多维特征向量矩阵的第一个元素、第二个元素、第n个元素。可选的,所述将所述多窗口大小的编码特征作为训练集对分类器进行训练,获得训练好的分类器,具体包括:利用随机梯度下降算法对所述分类器的参数进行更新,将所述损失函数取值最小时的参数作为所述分类器的最优参数,得到训练好的分类器;所述损失函数为H(p,q)=-∑p(x)logq(x),其中,H(p,q)为损失函数,p(x)为历史日期的真实犯罪案件个数的概率分布,q(x)为历史日期的预测犯罪案件个数的概率分布。一种犯罪时空预测系统,所述预测系统包括:犯罪案件发生时间获取模块,用于对待预测区域的地图进行网格划分,并获取每个网格在预设历史时期内犯罪案件发生的时间;犯罪案件个数确定模块,用于根据所述犯罪案件发生的时间,确定每个网格在预设历史时期内每天的犯罪案件个数;序列获得模块,用于利用多粒度卷积神经网络数据处理模型,将每个网格在预设历史时期内每天的犯罪案件个数、每天的天气和每天的日期,以及每个网格所属的地域以天为单位分别填充成相同天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列;多维特征向量矩阵确定模块,用于运用GloVe自然语言处理方法,将所述犯罪案件个数序列、所述天气序列、所述日期序列和所述地域序列分别表示为相同维度的向量矩阵,并将所有向量矩阵按照日期拼接成每个网格的多维特征向量矩阵;加权多维特征向量矩阵确定模块,用于根据所述每个网格的多维特征向量本文档来自技高网...

【技术保护点】
1.一种犯罪时空预测方法,其特征在于,所述预测方法包括:/n对待预测区域的地图进行网格划分,并获取每个网格在预设历史时期内犯罪案件发生的时间;/n根据所述犯罪案件发生的时间,确定每个网格在预设历史时期内每天的犯罪案件个数;/n利用多粒度卷积神经网络数据处理模型,将每个网格在预设历史时期内每天的犯罪案件个数、每天的天气和每天的日期,以及每个网格所属的地域以天为单位分别填充成相同天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列;/n运用GloVe自然语言处理方法,将所述犯罪案件个数序列、所述天气序列、所述日期序列和所述地域序列分别表示为相同维度的向量矩阵,并将所有向量矩阵按照日期拼接成每个网格的多维特征向量矩阵;/n根据所述每个网格的多维特征向量矩阵,利用基于自注意力机制的动态融合算法模型,确定每个网格的加权多维特征向量矩阵;/n采用多窗口编码器对所述加权多维特征向量矩阵进行信息编码,获得不同长度窗口捕获的编码特征;/n将所述不同长度窗口捕获的编码特征作为训练集对分类器进行训练,获得训练好的分类器;/n将目标日期、目标日期的天气和每个网格所属的地域输入所述训练好的分类器,预测所述待预测区域的每个网格在目标日期的犯罪案件发生数量。/n...

【技术特征摘要】
1.一种犯罪时空预测方法,其特征在于,所述预测方法包括:
对待预测区域的地图进行网格划分,并获取每个网格在预设历史时期内犯罪案件发生的时间;
根据所述犯罪案件发生的时间,确定每个网格在预设历史时期内每天的犯罪案件个数;
利用多粒度卷积神经网络数据处理模型,将每个网格在预设历史时期内每天的犯罪案件个数、每天的天气和每天的日期,以及每个网格所属的地域以天为单位分别填充成相同天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列;
运用GloVe自然语言处理方法,将所述犯罪案件个数序列、所述天气序列、所述日期序列和所述地域序列分别表示为相同维度的向量矩阵,并将所有向量矩阵按照日期拼接成每个网格的多维特征向量矩阵;
根据所述每个网格的多维特征向量矩阵,利用基于自注意力机制的动态融合算法模型,确定每个网格的加权多维特征向量矩阵;
采用多窗口编码器对所述加权多维特征向量矩阵进行信息编码,获得不同长度窗口捕获的编码特征;
将所述不同长度窗口捕获的编码特征作为训练集对分类器进行训练,获得训练好的分类器;
将目标日期、目标日期的天气和每个网格所属的地域输入所述训练好的分类器,预测所述待预测区域的每个网格在目标日期的犯罪案件发生数量。


2.根据权利要求1所述的犯罪时空预测方法,其特征在于,所述根据所述犯罪案件发生的时间,确定每个网格在预设历史时期内每天的犯罪案件个数,之后还包括:
确定每个网格在预设历史时期内所有的犯罪案件个数的中位数Xmedium;
计算每个网格在预设历史时期内每天的犯罪案件个数分别与所述中位数的绝对偏差值;
确定所有绝对偏差值的中位数MAD;
根据所述犯罪案件个数的中位数Xmedium和所述绝对偏差值的中位数MAD,确定犯罪案件个数的范围为[Xmedium-n×MAD,Xmedium+n×MAD];
将犯罪案件个数不在[Xmedium-n×MAD,Xmedium+n×MAD]范围内的网格的犯罪案件个数的值设置为0;
其中,n为比例因子常量。


3.根据权利要求1所述的犯罪时空预测方法,其特征在于,所述利用多粒度卷积神经网络数据处理模型,将每个网格在预设历史时期内每天的犯罪案件个数、每天的天气和每天的日期,以及每个网格所属的地域以天为单位分别填充成相同天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列,具体包括:
将预设历史时期内每天的犯罪案件个数按照日期表示为案件个数初始序列;
将预设历史时期内每天的天气按照日期表示为天气初始序列;
将预设历史时期内每天的日期按照日期表示为日期初始序列;
将预设历史时期内每个网格所属的地域按照日期以天为单位表示为地域初始序列;
利用多粒度卷积神经网络数据处理模型,将所述案件个数初始序列、所述天气初始序列、所述日期初始序列和所述地域初始序列填充成预设天数长度的序列,获得每个网格在预设历史时期内的犯罪案件个数序列、天气序列、日期序列和地域序列。


4.根据权利要求1所述的犯罪时空预测方法,其特征在于,所述运用GloVe自然语言处理方法,将所述犯罪案件个数序列、所述天气序列、所述日期序列和所述地域序列分别表示为相同维度的向量矩阵,并将所有向量矩阵按照日期拼接成每个网格的多维特征向量矩阵,具体包括:
利用训练好的基于GloVe方法的词向量表示模型,将所述犯罪案件个数序列中每天的犯罪案件个数、所述天气序列中每天的天气、所述日期序列中每天的日期和所述地域序列中的地域分别转化为相同维度的向量;
所述犯罪案件个数序列中所有的向量构成犯罪案件个数向量矩阵,所述天气序列中所有的向量构成天气向量矩阵,所述日期序列中所有的向量构成日期向量矩阵,所述地域序列中所有的向量构成地域向量矩阵;
将犯罪案件个数向量矩阵、天气向量矩阵、日期向量矩阵和地域向量矩阵中相同日期的个数向量、天气向量、日期向量矩阵和地域向量进行拼接,构成每个网格的多维特征向量矩阵。


5.根据权利要求1所述的犯罪时空预测方法,其特征在于,所述根据所述每个网格的多维特征向量矩阵,利用基于自注意力机制的动态融合算法模型,确定每个网格的加权多维特征向量矩阵,具体包括:
将所述多维特征向量矩阵中每个日期对应的向量作为所述多维特征向量矩阵的元素,并将每个元素分别赋一个key值;
分别计算第i个元素的key值与所述多维特征向量中的每个元素的key值的相似度;
利用softmax将所有的相似度进行归一化,获得相似度的归一化值;
根据公式xi′=k1x1+k2x2+…+knxn,获得第i个元素的加权向量xi′;
所有加权向量构成每个网格的加权多维特征向量矩阵;
其中,k1为第i个元素的key值与多维特征向量中第1个元素的key值的相似度的归一化值,k2为第i个元素的key值与多维特征向量中第2个元素的key值的相似度的归一化值,kn为第i个元素的key值与多维特征向量中第n个元素的key值的相似度的归一化值,x1、x2、xn分别...

【专利技术属性】
技术研发人员:石拓田凯
申请(专利权)人:石拓
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1