一种基于要素知识的事件标签检测方法和计算机技术

技术编号：35816130 阅读：12 留言：0更新日期：2022-12-03 13:40

本发明专利技术提供了一种基于要素知识的事件标签检测方法和计算机，包括：基于关键特征对事件文本进行粗分类；对事件文本进行要素抽取操作，得到与细分类标签有映射关系的文本标签信息；基于规则过滤，结合粗分类结果和文本标签信息，确定事件的最终标签。该方案能够提升检测过程的灵活度和可维护性。测过程的灵活度和可维护性。测过程的灵活度和可维护性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于要素知识的事件标签检测方法和计算机

[0001]本专利技术涉及自然语言处理和公安管理领域，特别是涉及基于要素知识的事件标签检测方法和计算机。

技术介绍

[0002]随着深度神经网络模型(DNN)以及图形处理器(GPU)的发展，使得训练更大参数、更多层数的神经网络成为可能。而自然语言序列中蕴含着特定的模式和相关知识信息，尤其是在诸如事件文本等垂直领域，这种模式特征和知识蕴含更加明显。深度神经网络模型可以很好的学习和捕获这些文本序列中的模式和知识，并在未见到过的数据上进行预测。近年来公安机关等相关部门信息化办公程度的日益完善，在接处警的同时也积累了海量的警情文本等事件文本数据。但目前对于每天事件标签的验证方式，还是以人工逐条检查为主，这不仅消耗了大量人力而且效率低下。
[0003]有效利用已积累的海量事件数据，依据深度神经网络模型在序列标签分类的能力，再结合要素知识、规则后处理能够有效降低人工需要检查的数据量。最终通过人机耦合的方式，可以更快更高效的完成接处警数据标签的检查和验证。
[0004]现有技术中对于文本序列分类任务，主要采用端到端的预训练模型，如 BERT，其提出的自注意力机制(Self
‑
Attention)可以充分地学习和捕获文本序列中蕴含的特征,也证明了一个深度模型可以大幅度地提升自然语言处理任务的准确率，并且这个模型可以从无标记的数据语料中训练得到。对应到警情文本标签分类任务，BERT模型将警情文本序列作为输入，经过预训练的参数对该序...

【技术保护点】

【技术特征摘要】
1.一种基于要素知识的事件标签检测方法，其特征在于，包括：基于关键特征对事件文本进行粗分类；对事件文本进行要素抽取操作，得到与细分类标签有映射关系的文本标签信息；基于规则过滤，结合粗分类结果和文本标签信息，确定事件的最终标签。2.如权利要求1所述的方法，其特征在于，当基于规则过滤，结合粗分类结果和文本标签信息，确定事件的最终标签得到大于或等于2个标签时，所述方法还包括：对事件文本进行细分类；基于细分类结果对确定的标签进行过滤，得到事件的最终标签。3.如权利要求1所述的方法，其特征在于，所述基于关键特征对事件文本进行粗分类得到第二层级标签的判定。4.如权利要求1所述的方法，其特征在于，所述对事件文本进行要素抽取操作包括：对事件...

【专利技术属性】
技术研发人员：李明洹，刘加新，郑新，李直旭，陈耀玲，石挺豪，
申请(专利权)人：科大讯飞苏州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人