一种实体标注方法和电子设备技术

技术编号:37260464 阅读:17 留言:0更新日期:2023-04-20 23:35
一种实体标注方法和电子设备。在该方法中,通过命名实体识别模型来智能辅助标注工程师进行实体标注,在降低人工标注工作量从而提高标注效率的同时,提升了实体标注的准确性。提升了实体标注的准确性。提升了实体标注的准确性。

【技术实现步骤摘要】
一种实体标注方法和电子设备


[0001]本申请涉及人工智能领域,尤其涉及一种实体标注方法和电子设备。

技术介绍

[0002]命名实体识别(Named Entity Recognition,NER)是自然语言处理(Natural Language Processing,NLP)领域中一项基础的信息抽取任务,也是热点的研究方向之一。NER往往是关系抽取、知识图谱、问答系统等其他诸多NLP任务的基础。命名实体识别任务是指从给定的一个非结构化的文本中识别出其中的命名实体,并对实体进行分类,比如从非结构化的文本中识别出时间、人名、地名、机构名等类型的实体。
[0003]在相关技术中,大部分实体标注系统都是用户通过拖拽的方式给文本中某段序列添加对应的预定义实体类别标签。
[0004]当遇上文本长度特别长的文本时,需要耗费大量时间进行实体标注。过多的实体容易造成用户主观判断前后矛盾,且长时间重复性操作用户也容易出现误操作,从而导致错误标记情况频繁。

技术实现思路

[0005]本申请提供了一种实体标注方法和电子设备,用于提高实体本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种实体标注方法,其特征在于,包括:确定用户对当前标注项目中还未标注部分中的第一文本进行了第一实体标注;使用训练过的实体命名识别模型识别第一关联文本对应的是第二实体标注,所述第一关联文本包括所述第一文本中部分或全部内容;在确定所述第二实体标注与所述第一实体标注不相同、或所述第一关联文本与所述第一文本不相同的情况下,提醒用户是否标记错误;在接收到用户确定自己标记错误的指令的情况下,将对所述第一文本的所述第一实体标注更新对所述第一关联文本的第二实体标注;在接收到用户确定自己标记正确的指令或超出预设时长未接收到指令的情况下,保持对所述第一文本的所述第一实体标注并停止提醒。2.根据权利要求1所述的方法,其特征在于,所述确定用户对当前标注项目中还未标注部分中的第一文本进行了第一实体标注的步骤之前,所述方法还包括:接收用户指定的训练文本范围,所述训练文本范围包括当前标注项目中已标注部分的内容;使用训练文本范围中的原始文本与相应的已完成标注的文本作为训练数据,训练所述命名实体识别模型。3.根据权利要求2所述的方法,其特征在于,所述使用训练文本范围中的原始文本与相应的已完成标注的文本作为训练数据,训练所述命名实体识别模型的步骤之前,所述方法还包括:确定用户选定的命名实体识别模型。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还可以包括:在确定用户选定第二文本并选择智能标签进行标注的情况下,使用训练过的所述命名实体识别模型对所述第二文本中的各实体进行标注。5.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:响应于用户的第二操作,接收预标注指令,该预标注指令中包括所述当前标注项目中待预标注的文本范围;使用训练过的所述命名实体识别模型对所述待预标注的文本范围中的第二文本进行标注,得到预标注的第二文本;接收对所述预标注的第二文本中实体标注的修改,得到完成标注的第二文本。6.根...

【专利技术属性】
技术研发人员:曾思亮蔡子哲包智
申请(专利权)人:企知道网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1