一种警情信息分层要素识别方法和计算机技术

技术编号：30139720 阅读：18 留言：0更新日期：2021-09-23 14:59

本发明专利技术实施例提供了一种警情信息分层要素识别方法及计算机，该方法包括：利用实体识别模型从警情信息中抽取粗粒度要素类别的粗粒度警情要素；利用阅读理解模型从粗粒度警情要素中提取细粒度要素类别的细粒度警情要素。经过实体识别和阅读理解这样的分层要素识别模型，能够准确且高效的从警情文本中抽取出细粒度的警情要素信息。粒度的警情要素信息。粒度的警情要素信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种警情信息分层要素识别方法和计算机

[0001]本专利技术涉及公安管理领域，特别是涉及一种警情信息分层要素识别方法和计算机。

技术介绍

[0002]警情要素识别任务是从海量的警情文本中抽取出关键的要素信息。例如，警情案件中参与的人，警情事件发生的时间、地点以及警情中涉及的物品、工具和相关金额。提取这些信息不仅有助于警情的分类，同时对各类警情案件的关联关系识别也起到关键性的作用。然而，传统的人工分析的方法，存在效率低，误差率高等问题。随着机器学习和深度神经网络技术的发展，通过自然语言处理领域的相关技术能够很好的辅助民警提取和分析警情文本中的信息。
[0003]常见的警情事件要素识别技术多采用实体识别的方法，例如“王月,王孟轩,张胜,等.基于BERT的警情文本命名实体识别[J].计算机应用,2020,40(2):535
‑
540.”公开了了一种的实体识别方法，即利用深度神经网络来学习警情文本的上下文信息，再通过条件随机场来预测文本中每一个字符的所属类别，即事先定义好的事件论元，例如，人物、时间、地点、工具等。
[0004]这种方法虽然简单直接，但警情文本中的信息多样且复杂，不同类型的警情所包含的要素类别也各有差距。例如，在诈骗类警情中存在嫌疑人、受害人，而在殴打类的警情人物中一般存在双方当事人。并且，人物信息中又细分姓名、性别、年龄、居住地、暂住地等信息。同时，时间和地方也各不相同。例如，案发时间和出警时间。仅仅通过一层实体识别模型很难将这些要素准确的抽取出来。当要素类别粒度较粗时，无...

【技术保护点】

【技术特征摘要】
1.一种警情信息分层要素识别方法，其特征在于，包括：利用实体识别模型从警情信息中抽取粗粒度要素类别的粗粒度警情要素；利用阅读理解模型从粗粒度警情要素中提取细粒度要素类别的细粒度警情要素。2.如权利要求1所述的方法，其特征在于，所述实体识别模型包括：用于获得上下文语义向量的语义向量模型，和用于为文本中每个字符预测其粗粒度要素类别标签的序列化标注模型。3.如权利要求2所述的方法，其特征在于，所述语义向量模型为Bert模型。4.如权利要求2所述的方法，其特征在于，所述序列化标注模型为Bi
‑
LSTM+CRF模型。5.如权利要求1所述的方法，其特征在于，所述粗粒度要素类别包括：时间、地点、任务、和物品。6.如权利要求1所述的方法，其特征在于，所述利用阅读理解模型从粗粒度警情要素中，提取细粒度要素类别的细粒度警情要素包括：将细粒度要素类别对应的问题和粗粒度警情要素作为阅读理解模型的输入，输出该粗粒...

【专利技术属性】
技术研发人员：吴瑞萦，何莹，李直旭，陈耀玲，
申请(专利权)人：苏州智汇谷科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人