一种基于预训练模型的警情地址所属区域分类方法技术

技术编号:39809225 阅读:12 留言:0更新日期:2023-12-22 02:44
本发明专利技术公开了一种基于预训练模型的警情地址所属区域分类方法,涉及人工智能技术应用领域

【技术实现步骤摘要】
一种基于预训练模型的警情地址所属区域分类方法


[0001]本专利技术属于人工智能技术应用领域,特别是涉及一种基于预训练模型的警情地址所属区域分类方法


技术介绍

[0002]全国各地的发展日新月异,每天都可能会有大量新建社区

办公楼宇

娱乐场所

道路名

地址等

在城市区域,人口及其稠密,每天都会有海量的报警事件,每当接到报警事件时,警方会将警情地址归为若干区域,然后指派给该区域附近执勤的民警

目前均是以人工的方式,根据个人经验对警情地址划分区域,费时费力,有时候会比较容易出错;对于大量的报警地址数据准确及时的划分所属区域,有利于出警规划安排及提高出警效率

因此,对报警地址数据建立稳定可靠的所述区域分类模型,减少接警客服人员的工作量,提高出警效率及出警质量,维护公共安全尤为重要

[0003]目前,警情地址所述区域划分都是以传统人工的方式,相应的研究也比较匮乏

对分类算法技术研究的比较多;比如,
CN101201835A
公开的应急联动警情自动分类系统,其具体是基于关键词匹配的方法实现;又如
CN110990562A
公开的警情分类方法及其系统,其具体是基于传统机器学习算法实现,上述技术方案都是老方法,或者在其它方面上的实际应用

最近几年人工智能技术发展迅速,有很多新的算法模型层出不穷;采用新的算法模型解决实际问题,有利于进一步提高准确率,提升出警效率和出警质量


技术实现思路

[0004]本专利技术的目的就是为了克服现有技术存在的不足,提供一种基于预训练模型的警情地址所属区域分类方法,通过对警情地址及对应的所述区域数据处理,建立训练数据集

验证数据集

测试数据集,又通过更为先进的预训练深度学习网络分类模型
Bert

Softmax
建立预测模型,最后对模型评估

上线,具有针对性强的优点,能够一定程度上解决预测效果不如意的问题,满足接近系统警情地址所属区域分类的需求,从而解决了
技术介绍
中的问题

[0005]为解决上述技术问题,本专利技术是通过以下技术方案实现的:
[0006]本专利技术的一种基于预训练模型的警情地址所属区域分类方法,包括如下步骤:
[0007]S1、
获取接警系统中警情地址及对应人工标注的所述区域数据;
[0008]S2、
将原始警情地址及对应所属区域数据进行清洗

去重等预处理操作,得到同一规范化后的数据;
[0009]S3、
抽取规范化后的数据为训练数据集

验证数据集

测试数据集;
[0010]S4、
用训练数据集训练预训练深度学习网络分类模型
Bert

Softmax
,每批次训练深度学习网络分类模型后,用验证数据集校验该模型;
[0011]S5、
模型训练完成后,用测试数据集测试模型得到模型评估结果;
[0012]S6、
在评估结果达到要求后,上线模型,对线上的警情地址数据实时预测所属区域
分类

[0013]进一步地,所述
S2
步骤具体包括如下分步骤:
[0014]S21、
数据清洗:删除无效数据以及不全数据;
[0015]S22、
数据转换:将数据中的转义字符转换为正常字符;
[0016]S23、
数据去重:删除警情地址以及所属区域完全一样的数据,只保留二者相同数据中的一条;
[0017]S24、
处理为统一规范后的数据

[0018]进一步地,所述
S3
步骤具体包括如下分步骤:
[0019]S31、
规范化后的数据按所述区域

警情地址排序,根据一定步长从前往后均匀抽取一定数量的数据,保证抽取的样本数据分布与全量数据的分布一样;
[0020]S32、
按照上述方法分别抽取训练数据集

验证数据集

测试数据集,数量比例视情况而定,三个数据集的数据不能够有交叉

[0021]进一步地,所述
S4
步骤具体包括如下分步骤:
[0022]S41、
用训练数据集分多批次训练预训练深度学习网络分类模型
Bert

Softmax
,每批次数据训练模型后用验证数据集校验模型,若校验结果有提升则保存模型,训练数据集每训练完成一遍则算是一轮;
[0023]S42、
用训练数据反复训练多轮训练模型,直到多轮训练后校验结果再没有提升,训练结束

[0024]进一步地,所述
S5
步骤具体是在模型训练完成后,用测试数据集测试模型得到模型评估结果:准确率

精确率

召回率
、F1
综合指标

[0025]进一步地,所述
S6
步骤具体是在评估结果达到要求后,上线模型,对线上的警情地址数据实时预测,最终得到对应的所属区域

[0026]本专利技术相对于现有技术包括有以下有益效果:
[0027](1)
本专利技术实现了对警情地址及对应的类别数据处理,建立训练数据集

验证数据集

测试数据集,又通过更为先进的预训练深度学习网络分类模型
Bert

Softmax
建立预测模型,最后对模型进行评估

上线,具有针对性强的优点,能够在一定程度上减少人力劳动,解决了划分效果不如意的问题,提高了出警效率,满足接警系统警情地址所属区域分类的需求;
[0028](2)
本专利技术利用预训练深度学习网络分类模型,能够快速有效的预测出警情地址对应的所属区域,响应速度快,针对性强,预测效果好

[0029]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点

附图说明
[0030]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0031]图1为本专利技术的一种基于预训练模型的警情地址所属区域分类方法的流程框架图

具体实施方式
[0032]下面将结合本专利技术实施例中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于预训练模型的警情地址所属区域分类方法,其特征在于,包括如下步骤:
S1、
获取接警系统中警情地址及对应人工标注的所述区域数据;
S2、
将原始警情地址及对应所属区域数据进行清洗

去重等预处理操作,得到同一规范化后的数据;
S3、
抽取规范化后的数据为训练数据集

验证数据集

测试数据集;
S4、
用训练数据集训练预训练深度学习网络分类模型
Bert

Softmax
,每批次训练深度学习网络分类模型后,用验证数据集校验该模型;
S5、
模型训练完成后,用测试数据集测试模型得到模型评估结果;
S6、
在评估结果达到要求后,上线模型,对线上的警情地址数据实时预测所属区域分类
。2.
根据权利要求1所述的一种基于预训练模型的警情地址所属区域分类方法,其特征在于,所述
S2
步骤具体包括如下分步骤:
S21、
数据清洗:删除无效数据以及不全数据;
S22、
数据转换:将数据中的转义字符转换为正常字符;
S23、
数据去重:删除警情地址以及所属区域完全一样的数据,只保留二者相同数据中的一条;
S24、
处理为统一规范后的数据
。3.
根据权利要求1所述的一种基于预训练模型的警情地址所属区域分类方法,其特征在于,所述
S3
步骤具体包括如下分步骤:<...

【专利技术属性】
技术研发人员:王明光孙孝坤那正平高进蒋维徐佳申钟浩刘红志高友光
申请(专利权)人:道枢上海数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1