System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及紧急响应和人工智能,尤其涉及一种智能化警情分类方法、装置及可读存储介质。
技术介绍
1、现代社会中,公安警务管理面临着越来越复杂的挑战,特别是在警情分类方面。传统的警情处理流程高度依赖人工操作,从接听报警电话到信息录入,再到警情分类,这一系列步骤都需要人工完成。这不仅对接警员的反应速度和专业素养提出了很高的要求,而且由于人为因素,失误的几率也相对增大。整体而言,这一流程的效率和准确性有待提高。
技术实现思路
1、本申请实施例提供一种智能化警情分类方法、装置及可读存储介质,用以基于深度学习的bert模型,结合改进的focal loss损失函数以特别关注分层不平衡数据,来解决警情分类的问题。
2、本申请实施例提供一种智能化警情分类方法,包括如下步骤:
3、预先执行如下步骤执行模型训练:
4、获取原始警情数据集,并基于原始警情数据集进行预处理,以通过预处理对数据集进行数据增强,其中所述原始警情数据集包括采用文字描述的警情相关信息,数据增强用以增强警情相关信息的警情描述;
5、从多个预训练bert模型中选择一个基础bert模型作为警情分类预训练模型;
6、将预处理之后的始警情数据集,作为训练集,训练所述警情分类预训练模型,其中训练过程采用改进的focal loss作为的损失函数,且所述损失函数中引入有层次距离权重,所述层次距离权重用于描述真实类别和模型预测的类别之间的层次结构关系;
7、警情分类步骤:
...【技术保护点】
1.一种智能化警情分类方法,其特征在于,包括如下步骤:
2.如权利要求1所述的智能化警情分类方法,其特征在于,基于原始警情数据集进行预处理之前还包括:对原始警情数据集进行数据清洗,以去除无关信息以及数据噪声。
3.如权利要求1所述的智能化警情分类方法,其特征在于,通过预处理对数据集进行数据增强包括,对警情相关信息进行同义词替换、调换语句顺序,和/或,添加增强词汇,以增强警情相关信息的警情描述。
4.如权利要求1所述的智能化警情分类方法,其特征在于,从多个预训练Bert模型中选择一个基础Bert模型作为警情分类预训练模型包括选取Bert-Base作为基础Bert模型;
5.如权利要求4所述的智能化警情分类方法,其特征在于,训练所述警情分类预训练模型包括采用如下改进的Focal Loss作为损失函数,训练所述警情分类预训练模型:
6.如权利要求5所述的智能化警情分类方法,其特征在于,将待分类的警情数据,按照指定的格式封装包括:将待分类的警情数据,按照JSON格式封装;
7.一种智能化警情分类装置,其特征在于,包括
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的智能化警情分类方法的步骤。
...【技术特征摘要】
1.一种智能化警情分类方法,其特征在于,包括如下步骤:
2.如权利要求1所述的智能化警情分类方法,其特征在于,基于原始警情数据集进行预处理之前还包括:对原始警情数据集进行数据清洗,以去除无关信息以及数据噪声。
3.如权利要求1所述的智能化警情分类方法,其特征在于,通过预处理对数据集进行数据增强包括,对警情相关信息进行同义词替换、调换语句顺序,和/或,添加增强词汇,以增强警情相关信息的警情描述。
4.如权利要求1所述的智能化警情分类方法,其特征在于,从多个预训练bert模型中选择一个基础bert模型作为警情分类预训练模型包括选取bert-base作为基础bert模型;
5.如权利要求4所述的智能化警情分...
【专利技术属性】
技术研发人员:陈工,刘楠楠,张若铮,姜子健,毕严先,张瑞,高启龙,孙超利,肖岩,
申请(专利权)人:中国电子科技集团有限公司电子科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。