命名实体识别模型的训练方法、命名实体识别方法及装置制造方法及图纸

技术编号:26479189 阅读:14 留言:0更新日期:2020-11-25 19:23
本申请公开了一种命名实体识别模型的训练方法、命名实体识别方法及装置,涉及人工智能的自然语言处理,适用于医疗领域。该方法包括:调用第一NER模型识别第一无标签数据集得到第一模型识别结果集;调用第二NER模型识别第一无标签数据集得到第二模型识别结果集;根据第二模型识别结果集修正第一模型识别结果集得到第三模型识别结果集;根据第三模型识别结果集训练更新第一NER模型;调用更新后的第一NER模型识别第二无标签数据集得到第一更新识别结果集,根据第一更新识别结果集更新第二NER模型的词典。该方法可以节省模型训练的人力成本,提高模型训练效率。

【技术实现步骤摘要】
命名实体识别模型的训练方法、命名实体识别方法及装置
本申请涉及人工智能的自然语言处理,特别涉及一种命名实体识别模型的训练方法、命名实体识别方法及装置。
技术介绍
人工智能技术是一门综合学科,自然语言处理(NaturalLanguageProcessing,NLP)是人工智能研究的一大方向,命名实体识别(NamedEntityRecognition,NER)是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。例如,对句子“小明早上8点去学校上课。”进行NER,应该能提取信息:人名:小明,时间:早上8点,地点:学校。相关技术中,对医疗领域的文本数据进行NER,使用人工标注的数据作为训练集来训练神经网络模型,通过神经网络模型来识别文本数据中的命名实体。该方法依赖于人工标注的数据,需要大量人力成本和时间成本来标注数据。
技术实现思路
本申请实施例提供了一种命名实体识别模型的训练方法、命名实体识别方法及装置,可以使用无标签数据训练模型,节省人力资源,提高模型训练效率。所述技术方案如下:根据本申请的一个方面,提供了一种命名实体识别模型的训练方法,所述方法包括:调用第一NER模型识别第一无标签数据集得到第一模型识别结果集,所述第一命名实体识别NER模型是基于预训练语言模型进行命名实体识别的模型;调用第二NER模型识别所述第一无标签数据集得到第二模型识别结果集,所述第二NER模型是基于词典进行命名实体识别的模型;根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集;根据所述第三模型识别结果集训练更新所述第一NER模型;调用更新后的所述第一NER模型识别第二无标签数据集得到第一更新识别结果,根据所述第一更新识别结果集更新所述第二NER模型的所述词典。根据本申请的另一个方面,提供了一种命名实体识别方法,所述方法包括:调用第一NER模型识别文本数据得到第一识别结果,所述第一NER模型是采用上述命名实体识别模型的训练方法训练得到的所述第一NER模型;或;调用第二NER模型识别所述文本数据得到第二识别结果,所述第二NER模型是采用上述命名实体识别模型的训练方法训练得到的所述第二NER模型;或;调用所述第一NER模型和所述第二NER模型识别所述文本数据得到第三识别结果。根据本申请的另一方面,提供了一种命名实体识别模型的训练装置,所述装置包括:第一模型模块,用于调用第一NER模型识别第一无标签数据集得到第一模型识别结果集,所述第一NER模型是基于预训练语言模型进行命名实体识别的模型;第二模型模块,用于调用第二NER模型识别所述第一无标签数据集得到第二模型识别结果集,所述第二NER模型是基于词典进行命名实体识别的模型;修正模块,用于根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集;训练模块,用于根据所述第三模型识别结果集训练更新所述第一NER模型;所述第一模型模块,还用于调用更新后的所述第一NER模型识别第二无标签数据集得到第一更新识别结果集;词典更新模块,用于根据所述第三模型识别结果集更新所述第二NER模型的所述词典。根据本申请的另一方面,提供了一种命名实体识别装置,所述装置包括:存储模块,用于存储第一NER模型和第二NER模型,所述第一NER模型是采用上述命名实体识别模型的训练方法训练得到的所述第一NER模型,所述第二NER模型是采用上述命名实体识别模型的训练方法训练得到的所述第二NER模型;第一调用模块,用于调用第一NER模型识别文本数据得到第一识别结果;或;第二调用模块,用于调用第二NER模型识别所述文本数据得到第二识别结果;或;第三调用模块,用于调用所述第一NER模型和所述第二NER模型识别所述文本数据得到第三识别结果。根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的命名实体识别模型的训练方法。根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的命名实体识别模型的训练方法。根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的命名实体识别方法。根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的命名实体识别方法。根据本公开实施例的另一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述可选实现方式中提供的命名实体识别模型的训练方法。根据本公开实施例的另一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述可选实现方式中提供的命名实体识别方法。本申请实施例提供的技术方案带来的有益效果至少包括:通过使用两个NER模型对同一个第一无标签数据集进行命名实体识别,得到两个命名实体识别结果,然后根据两个命名实体识别结果修正得到一个命名实体识别结果,使用修正得到的命名实体识别结果作为样本训练集,对基于深度学习的NER模型进行训练,调用更新后的基于深度学习的NER模型识别第二无标签数据集得到更新识别结果集,使用更新识别结果集扩充基于词典的NER模型的词典,从而同时更新两个模型,使NER模型可以根据无标签数据进行迭代更新,不需要人力来标注大量数据,降低人力成本投入,减少模型训练所需要的时间,提高模型训练的效率,提高模型的学习能力。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些本文档来自技高网...

【技术保护点】
1.一种命名实体识别模型的训练方法,其特征在于,所述方法包括:/n调用第一命名实体识别NER模型识别第一无标签数据集得到第一模型识别结果集,所述第一命名实体识别NER模型是基于预训练语言模型进行命名实体识别的模型;/n调用第二命名实体识别NER模型识别所述第一无标签数据集得到第二模型识别结果集,所述第二命名实体识别NER模型是基于词典进行命名实体识别的模型;/n根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集;/n根据所述第三模型识别结果集训练更新所述第一命名实体识别NER模型;/n调用更新后的所述第一命名实体识别NER模型识别第二无标签数据集得到第一更新识别结果集,根据所述第一更新识别结果集更新所述第二命名实体识别NER模型的所述词典。/n

【技术特征摘要】
1.一种命名实体识别模型的训练方法,其特征在于,所述方法包括:
调用第一命名实体识别NER模型识别第一无标签数据集得到第一模型识别结果集,所述第一命名实体识别NER模型是基于预训练语言模型进行命名实体识别的模型;
调用第二命名实体识别NER模型识别所述第一无标签数据集得到第二模型识别结果集,所述第二命名实体识别NER模型是基于词典进行命名实体识别的模型;
根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集;
根据所述第三模型识别结果集训练更新所述第一命名实体识别NER模型;
调用更新后的所述第一命名实体识别NER模型识别第二无标签数据集得到第一更新识别结果集,根据所述第一更新识别结果集更新所述第二命名实体识别NER模型的所述词典。


2.根据权利要求1所述的方法,其特征在于,所述第一无标签数据集包括K个无标签文本数据,所述第一模型识别结果集、所述第二模型识别结果集和所述第二模型识别结果集包括K个有标签文本数据,K是正整数;
所述根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集,包括:
根据所述第二模型识别结果集中的第i个有标签文本数据修正所述第一模型识别结果集中的第i个有标签文本数据,所述第二模型识别结果集中的第i个有标签文本数据与所述第一模型识别结果集中的第i个有标签文本数据存在至少一个标签不同的命名实体,i是小于或等于K的正整数。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第二模型识别结果集中的第i个有标签文本数据修正所述第一模型识别结果集中的第i个有标签文本数据,包括:
响应于所述第二模型识别结果集中的第i个有标签文本数据的第m个命名实体与所述第一模型识别结果集中的第i个有标签文本数据的第n个命名实体的起始位置相同且终止位置不同,使用所述第m个命名实体的标签替换所述第n个命名实体的标签,m、n是正整数;
或,
响应于所述第二模型识别结果集中的第i个有标签文本数据的第m个命名实体与所述第一模型识别结果集中的第i个有标签文本数据的第n个命名实体的起始位置不同且终止位置相同,使用所述第m个命名实体的标签替换所述第n个命名实体的标签,m、n是正整数。


4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
使用样本有标签数据集训练初始模型得到所述第一命名实体识别NER模型。


5.根据权利要求4所述的方法,其特征在于,所述使用样本有标签数据集训练初始模型得到所述第一命名实体识别NER模型之后,还包括:
调用所述第一命名实体识别NER模型识别所述第二无标签数据集得到更新识别结果集;
根据所述更新识别结果集构建所述第二命名实体识别NER模型的所述词典。


6.根据权利要4所述的方法,其特征在于,所述根据所述第三模型识别结果集训练更新所述第一命名实体识别NER模型,包括:
将所述第三模型识别结果集加入所述样本有标签数据集,更新所述样本有标签数据集;
使用更新后的所述样本有标签数据集训练更新所述第一命名实体识别NER模型。


7.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
调用更新后的所述第一命名实体识别NER模型识别所述第一无标签数据集得到第j-2模型识别结果集,j是3的整数倍且j为正数;
调用更新后的所述第二命名实体识别NER模型识别所述第一无标签数据集得到第j-1模型识别结果集;
根据所述第j-2模型识别结果集修正所述第j-1模型识别结果集得到第j模型识别结果集;
根据所述第j模型识别结果集训练更新所述第一命名实体识别NER模型;
调用更新后的所述第一命名实体识别NER模型识别所述第二无标签数据集得到第j-2更新识别结果集,根据所述第j-2更新识别结果集更新所述第二命名实体识别NER模型的所述词典;
重复上述步骤迭代更新所述第一命名实体识别NER模型和所述第二命名实体识别NER模型。


8.根据权利要求7所述的方法,...

【专利技术属性】
技术研发人员:谢德峰管冲陈曦
申请(专利权)人:腾讯云计算长沙有限责任公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1