基于相似度和要素知识模型融合的事件标签检测方法技术

技术编号：35816131 阅读：18 留言：0更新日期：2022-12-03 13:40

本发明专利技术提供了一种基于相似度和要素知识模型融合的事件标签检测方法，其特征在于，包括：基于要素知识的事件标签检测模型，对事件文本进行标签检测，得到第一标签检测结果；利用相似度匹配模块，对事件文本进行标签检测，得到第二标签检测结果；通过网格搜索，对第一标签检测结果和第二标签检测结果进行融合，得到事件的最终标签检测结果。到事件的最终标签检测结果。到事件的最终标签检测结果。

全部详细技术资料下载

【技术实现步骤摘要】
基于相似度和要素知识模型融合的事件标签检测方法

[0001]本专利技术涉及自然语言处理和公安管理领域，特别是涉及基于相似度和要素知识模型融合的事件标签检测方法。

技术介绍

[0002]随着深度神经网络模型(DNN)以及图形处理器(GPU)的发展，使得训练更大参数、更多层数的神经网络成为可能。而自然语言序列中蕴含着特定的模式和相关知识信息，尤其是在诸如事件文本等垂直领域，这种模式特征和知识蕴含更加明显。深度神经网络模型可以很好的学习和捕获这些文本序列中的模式和知识，并在未见到过的数据上进行预测。近年来公安机关等相关部门信息化办公程度的日益完善，在接处警的同时也积累了海量的警情文本等事件文本数据。但目前对于每天事件标签的验证方式，还是以人工逐条检查为主，这不仅消耗了大量人力而且效率低下。
[0003]有效利用已积累的海量事件数据，依据深度神经网络模型在序列标签分类的能力，再结合要素知识、规则后处理能够有效降低人工需要检查的数据量。最终通过人机耦合的方式，可以更快更高效的完成接处警数据标签的检查和验证。
[0004]现有技术中对于文本序列分类任务，主要采用端到端的预训练模型，如 BERT，其提出的自注意力机制(Self
‑
Attention)可以充分地学习和捕获文本序列中蕴含的特征,也证明了一个深度模型可以大幅度地提升自然语言处理任务的准确率，并且这个模型可以从无标记的数据语料中训练得到。对应到警情文本标签分类任务，BERT模型将警情文本序列作为输入，经过预训练...

【技术保护点】

【技术特征摘要】
1.一种基于相似度和要素知识模型融合的事件标签检测方法，其特征在于，包括：基于要素知识的事件标签检测模型，对事件文本进行标签检测，得到第一标签检测结果；利用相似度匹配模块，对事件文本进行标签检测，得到第二标签检测结果；通过网格搜索，对第一标签检测结果和第二标签检测结果进行融合，得到事件的最终标签检测结果。2.如权利要求1所述的方法，其特征在于，所述相似度匹配模块是利用度量模型使用正例和负例训练后得到的。3.如权利要求2所述的方法，其特征在于，所述利用度量模型使用正例和负例训练相似度匹配模块采用的损失函数如下式：其中m是超参数，表示正负样例区分开的...

【专利技术属性】
技术研发人员：林玉峰，李明洹，郑新，李直旭，陈耀玲，刘加新，石庭豪，吴瑞萦，
申请(专利权)人：科大讯飞苏州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人