一种犯罪研判模型训练方法、研判方法技术

技术编号：40133531 阅读：10 留言：0更新日期：2024-01-23 22:30

本发明专利技术提供一种犯罪研判模型训练方法，包括：S1、获取已有犯罪数据并对其进行样本均衡处理；S2、对样本均衡处理后的数据进行数据编码；S3、按照预设的数据处理规则对数据编码后的数据进行处理以得到目标数据；S4、构建初始模型，所述初始模型包括多个残差处理模块和多个注意力模块；S5、采用所述目标数据对所述初始模型进行多轮迭代训练以得到犯罪研判模型，并在迭代训练过程中采用交叉熵损失更新模型参数。本发明专利技术引入注意力机制和深度残差神经网络构建犯罪研判模型，其中，通过引入注意力机制可以自动关注犯罪数据中的关键犯罪特征以减少人工干预犯罪特征选择的过程，通过引入深度残差神经网络可以应对大规模数据场景下的犯罪研判要求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术公共安全领域，具体来说，涉及公共安全领域中的犯罪研判技术，更具体地说，涉及采用深度神经网络模型进行犯罪研判的技术，即一种犯罪研判模型训练方法、研判方法。

技术介绍

1、犯罪类型研判是指对不同类型的犯罪行为进行识别、分析的技术。目前，对犯罪类型研判分析的技术主要包括统计分析和数据挖掘等分析手段。

2、其中，统计分析通过收集和处理犯罪数据来分析犯罪的构成和特点，以此实现犯罪类型研判分析。虽然统计分析能够实现犯罪类型研判，但是这种分析方法只能从数据中获取已知的特征，很难发现意外的规律或异常，且需要大量的人为干预和解释，这会消耗大量的人工成本。

3、数据挖掘是一种基于数据分析的自动化技术，它可以挖掘数据中的未知规律和关联性，对犯罪类型进行分类和预测。和统计分析相比，数据挖掘技术具有更高的自动化程度和更广泛的应用范围。数据挖掘技术可以通过各种方法，如决策树、聚类分析等，进行数据分析和预测。虽然数据挖掘技术能够实现犯罪类型研判，但是数据挖掘技术在缺乏足够的人工细节情况下很难解释其中的结果和预测，且数据量急剧增长的情况下该技术的研判性能很难提升。

4、为了解决统计分析与数据挖掘技术中存在的问题，有研究人员提出采用人工智能技术进行犯罪类型研判。人工智能是一种新兴的技术，近年来在各行各业均有大量应用，其将大量的数据、模型和算法融合在一起，建立起一种智能化的犯罪类型识别和研判模型。人工智能技术主要包括机器学习、深度学习等技术，这些技术的核心思想是通过训练模型、学习规则，对犯罪类型进行预测和分类。

5、相较于统计分析和数据挖掘技术，人工智能技术可以自动化地执行不同的任务，同时保证结果准确性和一致性。但是现有的基于人工智能技术所提出的犯罪类型研判分析还存在如下不足：(1)随着数据量的急剧增长，现有的基于人工智能技术训练得到的犯罪研判模型无法应用于大规模数据的场景；(2)现有的基于人工智能技术训练得到的犯罪研判模型无法关注数据样本中关键特征，导致训练得到的犯罪预测模型预测效果不佳。

技术实现思路

1、因此，本专利技术的目的在于克服上述现有技术的缺陷，提供一种犯罪研判模型训练方法和一种犯罪研判方法。

2、本专利技术的目的是通过以下技术方案实现的。

3、根据本专利技术的第一方面，提供一种犯罪研判模型训练方法，所述方法包括：s1、获取已有犯罪数据并对其进行样本均衡处理；s2、对样本均衡处理后的数据进行数据编码；s3、按照预设的数据处理规则对数据编码后的数据进行处理以得到目标数据；s4、构建初始模型，所述初始模型包括多个残差处理模块和多个注意力模块；s5、采用所述目标数据对所述初始模型进行多轮迭代训练以得到犯罪研判模型，并在迭代训练过程中采用交叉熵损失更新模型参数。

4、在本专利技术的一些实施例中，所述已有犯罪数据包括多种犯罪类别的数据集，每种犯罪类别的数据集包括多个犯罪样本，每个犯罪样本上设置有与其自身对应的犯罪类别的标签，每个犯罪样本包括多种犯罪特征，且犯罪样本的一种犯罪特征对应一个犯罪特征数据，所述犯罪特征包括无规则犯罪特征和有规则犯罪特征，其中，所述无规则犯罪特征表示犯罪特征之间不存相互关系，所述有规则犯罪特征表示犯罪特征之间存在相互关系。

5、在本专利技术的一些实施例中，所述步骤s1包括：s11、从所述已有犯罪数据中选择犯罪样本数量最小的犯罪类别对应的数据集；s12、根据步骤s11选择的数据集的犯罪样本数量，从其余犯罪类别的数据集中分别随机选择与该犯罪样本数量一致的样本以得到其余犯罪类别对应的新的数据集；s13、将步骤s11选择的犯罪类别的数据集与步骤s12得到的其余犯罪类别对应的新的数据集进行组合。

6、在本专利技术的一些实施例中，所述步骤s2包括：s21、采用顺序编码将每个犯罪样本的无规则犯罪特征对应的犯罪特征数据编码为序列整数；s22、采用哑变量编码将每个犯罪样本的有规则犯罪特征对应的犯罪特征数据编码为二进制变量。

7、在本专利技术的一些实施例中，在所述步骤s3中，所述预设的数据处理规则为：

8、s31、按照如下方式对每个犯罪样本的每一犯罪特征对应的犯罪特征数据取对数处理：

9、

10、其中，x′i,n表示取对数处理后的犯罪样本xi的第n种犯罪特征对应的犯罪特征数据，xi,n表示数据编码处理后的犯罪样本xi的第n种犯罪特征对应的犯罪特征数据；

11、s32、按照如下方式对每个犯罪样本的每一犯罪特征对应的犯罪特征数据进行归一化处理：

12、

13、其中，表示归一化处理后的犯罪样本xi的第n种犯罪特征对应的犯罪特征数据，x′(i,n)min表示取对数处理后的犯罪样本xi的n种犯罪特征中特征值最小的犯罪特征数据；x′(i,n)max表示取对数处理后的犯罪样本xi的n种犯罪特征中特征值最大的犯罪特征数据；

14、s33、按照如下方式对每个犯罪样本的每一犯罪特征对应的犯罪特征数据进行正则化处理：

15、

16、

17、其中，表示正则化处理后的犯罪样本xi的第n种犯罪特征对应的犯罪特征数据，l(xi)表示正则化计算后的犯罪样本xi。

18、优选的，所述残差处理模块为resnext网络。

19、在本专利技术的一些实施例中，所述交叉熵损失为：

20、

21、其中，loss(·)表示交叉熵损失函数，l表示模型对犯罪样本的犯罪类别研判结果，y表示犯罪样本对应的实际犯罪类别，l＝[l0,…,ly,…,ln-1]，ly表示模型判定的犯罪样本为实际犯罪类别的概率，ln-1表示模型判定的犯罪样本为第n-1种犯罪类别的概率。

22、根据本专利技术的第二方面，提供一种犯罪研判方法，t1、获取待研判犯罪数据；t2、采用如本专利技术第一方面所述方法训练的犯罪研判模型对所述待研判犯罪数据进行处理以获取其对应的犯罪类型研判结果。

23、与现有技术相比，本专利技术的优点在于：通过样本均衡、数据编码和数据转换处理进行数据预处理以将原始犯罪数据转换为模型可处理的数据；还引入注意力机制和深度残差神经网络构建犯罪研判模型，其中，通过引入注意力机制可以自动关注犯罪数据中的关键犯罪特征以减少人工干预犯罪特征选择的过程，通过引入深度残差神经网络可以应对大规模数据场景下的犯罪研判要求。

本文档来自技高网...

【技术保护点】

1.一种犯罪研判模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述已有犯罪数据包括多种犯罪类别的数据集，每种犯罪类别的数据集包括多个犯罪样本，每个犯罪样本上设置有与其自身对应的犯罪类别的标签，每个犯罪样本包括多种犯罪特征，且犯罪样本的一种犯罪特征对应一个犯罪特征数据，所述犯罪特征包括无规则犯罪特征和有规则犯罪特征，其中，所述无规则犯罪特征表示犯罪特征之间不存相互关系，所述有规则犯罪特征表示犯罪特征之间存在相互关系。

3.根据权利要求2所述的方法，其特征在于，所述步骤S1包括：

4.根据权利要求3所述的方法，其特征在于，所述步骤S2包括：

5.根据权利要求4所述的方法，其特征在于，在所述步骤S3中，所述预设的数据处理规则为：

6.根据权利要求5所述的方法，其特征在于，所述残差处理模块为ResNeXt网络。

7.根据权利要求6所述的方法，其特征在于，所述交叉熵损失为：

8.一种犯罪研判方法，其特征在于，所述方法包括：

9.一种计算机可读存储介质，其特征

10.一种电子设备，其特征在于，包括：

...

【技术特征摘要】

1.一种犯罪研判模型训练方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，所述步骤s1包括：

4.根据权利要求...

【专利技术属性】
技术研发人员：邱大伟，刘畅，尚源峰，曹欢，赵紫旭，石晶林，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人