一种适用多地区犯罪事件数量预测的方法和系统技术方案

技术编号：40766436 阅读：2 留言：0更新日期：2024-03-25 20:16

本发明专利技术提供一种适用多地区犯罪事件数量预测的方法和系统，从各地区获取用于模型训练的按时间序列的历史犯罪数据和历史特征数据作为样本数据；获取待预测地区预定时间点之前按时间序列的历史犯罪数据和历史特征数据作为预测数据，处理样本数据用于训练deepAr模型，处理预测数据之后使用训练好的模型预测待预测地区在预定时间点之后犯罪事件预测量。无需对各地区分别进行模型训练及预测，大大节省算力开销，解决新增地区冷启动问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能和数据挖掘，尤其涉及一种适用多地区犯罪事件数量预测的方法和系统。

技术介绍

1、随着数据收集、整合和挖掘技术的进步，以数据驱动为主的技术方法成为警察部门执法的重要手段。目前，以数据为基础的犯罪预测在我国的运用日益广泛，预测警务这一新的警务运行模式随着国家“大数据战略”的推进也正在实践中深化运用。其中犯罪案件数量预测，即根据犯罪记录数据及其他可用数据预测地域在未来指定时间段内的犯罪案件数量，可以为优化部署巡逻警力提供指导，越来越受到青睐。

2、目前，犯罪案件数量预测的研究存在以下问题：目前的预测方法一个模型只能预测单个地区，如果有多个预测地区，则需要训练多个模型，增加训练成本和时间，现有预测方法存在冷启动的问题，若新增预测地区历史数据很少，则很难支撑模型做出准确的预测。

技术实现思路

1、基于上述问题，本专利技术提供一种适用多地区犯罪事件数量预测的方法和系统，旨在解决现有技术中一个模型只能预测单个地区等技术问题。

2、一种适用多地区犯罪事件数量预测的方法，包括：

3、步骤a1，从各地区获取用于模型训练的按时间序列的历史犯罪数据和历史特征数据作为样本数据；

4、步骤a2，分别对样本数据中的历史犯罪数据和历史特征数据进行预处理，形成犯罪数量序列和特征统计序列；

5、步骤a3，将犯罪数量序列和特征统计序列按第一时间单位和按地区进行关联，形成训练样本；

6、步骤a4，使用训练样本对构建的deepar

7、步骤a5，获取待预测地区预定时间点之前按时间序列的历史犯罪数据和历史特征数据作为预测数据，预测数据依次按照步骤a2的预处理方式以及步骤a3的关联方式进行处理，形成预测样本；

8、步骤a6，将预测样本输入已训练好的犯罪预测模型中，输出待预测地区在预定时间点之后犯罪事件预测量。

9、进一步的，步骤a2包括步骤a21：

10、对历史犯罪数据以第二时间单位进行聚合，得到各地区每周的犯罪事件数量，构成犯罪数量序列；

11、对历史特征数据以第二时间单位进行统计分析，得到各地区每周的特征值，构成特征统计序列；

12、在步骤a3中，第一时间单位包括第二时间单位。

13、进一步的，第二时间单位为周；

14、第一时间单位还包括年。

15、进一步的，历史特征数据包括天气数据、时间特征数据、人口密度数据、学历分布数据、人流量数据以及就业率数据；

16、特征值包括天气特征值、时间特征值、人口密度特征值、学历分布特征值、人流量特征值以及就业率特征值。

17、进一步的，天气特征值包括晴天天数、雨天天数、雪天天数、多云天数、平均最高温度、平均最低温度、平均最高湿度和平均最低湿度。

18、进一步的，时间特征值包括工作日天数、周末天数和节假日天数。

19、进一步的，在步骤a2中，步骤a21之后还包括：

20、步骤a22，剔除犯罪数量序列和特征统计序列中的异常值；

21、步骤a23，填充犯罪数量序列和特征统计序列中的空值。

22、进一步的，在步骤a23中，使用上一个第二时间单位相应的特征值填充空值。

23、进一步的，在步骤a6中，使用犯罪预测模型预测预定时间点之后连续至少两个以上的第二时间单位的犯罪事件预测量。

24、一种适用多地区犯罪事件数量预测的系统，用于实现前述的一种适用多地区犯罪事件数量预测的方法，包括：

25、数据获取模块，用于从各地区获取用于模型训练的按时间序列的历史犯罪数据和历史特征数据作为样本数据，以及获取待预测地区预定时间点之前按时间序列的历史犯罪数据和历史特征数据作为预测数据；

26、预处理模块，连接数据获取模块，用于对样本数据和预测数据中的历史犯罪数据和历史特征数据进行预处理，形成犯罪数量序列和特征统计序列；

27、数据关联模块，连接预处理模块，用于对犯罪数量序列和特征统计序列按照第一时间单位和按地区进行关联，分别形成训练样本和预测样本；

28、模型训练模块，连接数据关联模块，用于使用训练样本对构建的deepar模型进行训练，得到犯罪预测模型；

29、预测模块，分别连接数据关联模块和模型训练模块，用于将预测样本输入已训练好的犯罪预测模型中，输出待预测地区在预定时间点之后犯罪事件预测量。

30、本专利技术的有益技术效果在于：

31、本专利技术通过使用多个地区的历史数据对单一模型进行训练，使得通过一个多重时序预测模型能够实现对多个地区的犯罪事件数量预测，无需对各地区分别进行模型训练及预测，大大节省算力开销；

32、使用deepar模型可预测出犯罪事件数量的数据分布模型，对犯罪数量有更清晰的统计学认知；

33、如果新增地区的犯罪数量变化趋势以及特征数据与已有地区的数据相似，即可直接应用训练好的模型对新增地区进行犯罪事件数量预测，解决新增地区冷启动问题。

本文档来自技高网...

【技术保护点】

1.一种适用多地区犯罪事件数量预测的方法，其特征在于，包括：

2.如权利要求1所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，所述步骤A2包括步骤A21：

3.如权利要求2所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，所述第二时间单位为周；

4.如权利要求2所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，所述历史特征数据包括天气数据、时间特征数据、人口密度数据、学历分布数据、人流量数据以及就业率数据；

5.如权利要求4所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，所述天气特征值包括晴天天数、雨天天数、雪天天数、多云天数、平均最高温度、平均最低温度、平均最高湿度和平均最低湿度。

6.如权利要求4所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，所述时间特征值包括工作日天数、周末天数和节假日天数。

7.如权利要求4所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，在所述步骤A2中，所述步骤A21之后还包括：

8.如权利要求7所述的一种适用多地区犯罪事件数

9.如权利要求2所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，在所述步骤A6中，使用所述犯罪预测模型预测所述预定时间点之后连续至少两个以上的所述第二时间单位的犯罪事件预测量。

10.一种适用多地区犯罪事件数量预测的系统，其特征在于，用于实现如权利要求1-9任意一项所述的一种适用多地区犯罪事件数量预测的方法，包括：

...

【技术特征摘要】

1.一种适用多地区犯罪事件数量预测的方法，其特征在于，包括：

2.如权利要求1所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，所述步骤a2包括步骤a21：

3.如权利要求2所述的一种适用多地区犯罪事件数量预测的方法，其特征在于，所述第二时间单位为周；

6.如权利要求4所述的一种适用多地区犯罪事...

【专利技术属性】
技术研发人员：吴颖健，杨念，谭锐，王晔，石鑫，
申请(专利权)人：上海市大数据股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人