命名实体识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39038729 阅读:18 留言:0更新日期:2023-10-10 11:51
本申请涉及人工智能技术领域,提供了一种命名实体识别方法、装置、电子设备及存储介质。该方法包括:获取待识别文本;通过预先设置的N个大语言模型,对所述待识别文本的命名实体进行识别,得到N个备选实体识别结果,其中N个大语言模型所对应的权重不同;根据所述N个备选实体识别结果和所述N个大语言模型分别对应的权重,得到目标实体识别结果。本实施例提高了命名实体的识别准确性。命名实体的识别准确性。命名实体的识别准确性。

【技术实现步骤摘要】
命名实体识别方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种命名实体识别方法、装置、电子设备及存储介质。

技术介绍

[0002]命名实体识别是自然语言处理中一项基础性的关键任务,是关系抽取、事件抽取、知识图谱、信息提取、问答系统、机器翻译等诸多自然语言处理任务的基础,被广泛应用在自然语言处理领域,在自然语言处理技术走向实用化的过程中占据重要地位。命名实体一般有两种划分:三大类和七小类;三大类是指实体类、时间类和数字类。七小类是指人名、地名、组织机构名、时间、日期、货币量和百分数。随着智能化和数字化技术的发展,智能化的设备也深入便捷人们生活,例如智能手机智能机器人都支持语音对话,在不同场合下会使用到不同的命名实体,可见命名实体在对话中一般都是十分重要的一部分,如果不能正确的理解与匹配,会阻碍人机对话给用户带来不好的体验。
[0003]当前,常用的命名实体识别的方法主要是基于词典的方法,但词典标注老旧,容易覆盖不全,又经常有许多新的命名实体的涌现,在实际的应用中,会出现命名实体识别不准确的问题。
[0004]所以,现有技术中存在对命名实体识别准确率不高的问题。

技术实现思路

[0005]有鉴于此,本申请实施例提供了一种命名实体识别方法、装置、电子设备及存储介质,以解决现有技术中存在对命名实体识别准确率不高的问题。
[0006]本申请实施例的第一方面,提供了一种命名实体识别方法,包括:
[0007]获取待识别文本;
[0008]通过预先设置的N个大语言模型,对所述待识别文本的命名实体进行识别,得到N个备选实体识别结果,其中N个大语言模型所对应的权重不同;
[0009]根据所述N个备选实体识别结果和所述N个大语言模型分别对应的权重,得到目标实体识别结果。
[0010]本申请实施例的第二方面,提供了一种命名实体装置,包括:
[0011]获取模块,用于获取待识别文本;
[0012]识别模块,用于通过预先设置的N个大语言模型,对所述待识别文本的命名实体进行识别,得到N个备选实体识别结果,其中N个大语言模型所对应的权重不同;
[0013]确定模块,用于根据所述N个备选实体识别结果和所述N个大语言模型分别对应的权重,得到目标实体识别结果。
[0014]本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0015]本申请实施例的第四方面,提供了一种可读存储介质,该可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0016]本申请实施例的有益效果是:
[0017]通过预先设置的N个大语言模型,对待识别文本的命名实体进行识别,得到N个备选实体识别结果,其中N个大语言模型所对应的权重不同,根据N个备选实体识别结果和N个大语言模型分别对应的权重,得到目标实体识别结果。由于预先设置的N个大语言模型的权重不同,且每个大语言模型均能够得到一个备选实体识别结果,充分利用了大语言模型的能力,且实现了对待识别文本利用N个备选实体识别结果以及权重得到目标实体识别结果,提高了命名实体识别的能力,从而解决了现有技术中对命名实体识别准确率不高的问题。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0019]图1是本申请实施例提供的一种命名实体的识别方法的流程示意图;
[0020]图2是本申请实施例提供的一种命名实体的识别装置的结构示意图;
[0021]图3是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0022]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0023]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0024]此外,需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0025]图1是本申请实施例提供的一种命名实体的识别方法的流程示意图。如图1所示,该命名实体的识别方法包括:
[0026]步骤101,获取待识别文本;
[0027]具体地,在命名实体识别应用过程中,首先需要获取待识别文本。本申请在此不对
待识别文本的具体领域做出限制和要求。
[0028]待识别文本中可以包括待识别的命名实体。作为一个示例,命名实体可以包括人名、地名、日期、数字等。
[0029]步骤102,通过预先设置的N个大语言模型,对待识别文本的命名实体进行识别,得到N个备选实体识别结果,其中N个大语言模型所对应的权重不同。
[0030]具体地,N大于等于2。预先设置的N个大语言模型为预先根据不同的预设规则,通过训练数据集进行训练得到。
[0031]N个大语言模型所对应的权重不同,这使得N个备选实体识别结果对应的权重也不相同,从而使得能够根据该权重确定每个备选实体识别结果的可参考程度,需要说明的是,权重越高,说明备选实体识别结果的准确性越高,该备选实体识别结果的可参考程度越高。
[0032]此外,通过预先设置的N个大语言模型,对待识别文本的命名实体进行识别时,可以将待识别文本分别输入至N个大语言模型,得到每个大语言模型输出的实体识别结果,该实体识别结果即为备选实体识别结果。
[0033]这样,通过得到N个大语言模型所对应的备选实体识别结果,使得能够通过多个备选实体识别结果为目标实体识别结果提供参考,从而提高了命名实体识别的准确率。
[0034]步骤103,根据N个备选实体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种命名实体的识别方法,其特征在于,包括:获取待识别文本;通过预先设置的N个大语言模型,对所述待识别文本的命名实体进行识别,得到N个备选实体识别结果,其中N个大语言模型所对应的权重不同;根据所述N个备选实体识别结果和所述N个大语言模型分别对应的权重,得到目标实体识别结果。2.根据权利要求1所述的方法,其特征在于,所述通过预先设置的N个大语言模型,对所述待识别文本的命名实体进行识别,得到N个备选实体识别结果之前,还包括:获取训练数据集,其中所述训练数据集包括训练样本和所述训练样本对应的标签,所述标签为所述训练样本中的命名实体所对应的实体类型;按照N个所述大语言模型针对输入文本和/或输出文本的预设规则,将所述训练样本和/或所述标签转换为N个目标训练样本和/或目标标签,其中N个所述目标训练样本和/或所述目标标签分别满足N个所述大预言模型所对应的预设规则;根据所述目标训练样本和/或目标标签,对所述目标训练样本和/或目标标签所对应的大语言模型进行训练,得到所述N个大语言模型。3.根据权利要求2所述的方法,其特征在于,N个所述大语言模型包括第一大语言模型、第二大语言模型和第三大语言模型;所述第一大语言模型所对应的预设规则包括:所述输入文本包括训练样本和提示文本的情况下,所述提示文本的输入语言包括至少两种语言;所述第二大语言模型所对应的预设规则包括:所述输出文本的输出格式为预设结构化数据格式;所述第三大语言模型所对应的预设规则包括:所述输入文本和所述输出文本的文本格式均为代码格式。4.根据权利要求2所述的方法,其特征在于,所述根据所述目标训练样本和/或目标标签,对所述目标训练样本和/或所述目标标签所对应的大语言模型进行训练,得到所述N个大语言模型之后,还包括:根据所述标签和所述N个大语言模型的输出文本,确定所述N个大语言模型对所述命名实体的识别准确率;根据所述识别准确率,确定N个所述大语言模型所对应的权重,其中所述权重与所述识别准确率成正比。5.根据权利要求2或3所述的方法,其特征在于,所述通过预先设置的N个大语言模型,对所述待识别文本的命名实体进行识别,得到N个备选实体识别结果...

【专利技术属性】
技术研发人员:张献涛支涛
申请(专利权)人:北京云迹科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1