命名实体识别模型的训练方法、命名实体识别方法及装置制造方法及图纸

技术编号：26479189 阅读：14 留言：0更新日期：2020-11-25 19:23

本申请公开了一种命名实体识别模型的训练方法、命名实体识别方法及装置，涉及人工智能的自然语言处理，适用于医疗领域。该方法包括：调用第一NER模型识别第一无标签数据集得到第一模型识别结果集；调用第二NER模型识别第一无标签数据集得到第二模型识别结果集；根据第二模型识别结果集修正第一模型识别结果集得到第三模型识别结果集；根据第三模型识别结果集训练更新第一NER模型；调用更新后的第一NER模型识别第二无标签数据集得到第一更新识别结果集，根据第一更新识别结果集更新第二NER模型的词典。该方法可以节省模型训练的人力成本，提高模型训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
命名实体识别模型的训练方法、命名实体识别方法及装置
本申请涉及人工智能的自然语言处理，特别涉及一种命名实体识别模型的训练方法、命名实体识别方法及装置。
技术介绍
人工智能技术是一门综合学科，自然语言处理(NaturalLanguageProcessing，NLP)是人工智能研究的一大方向，命名实体识别(NamedEntityRecognition，NER)是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具，在自然语言处理技术走向实用化的过程中占有重要地位。一般来说，命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。例如，对句子“小明早上8点去学校上课。”进行NER，应该能提取信息：人名：小明，时间：早上8点，地点：学校。相关技术中，对医疗领域的文本数据进行NER，使用人工标注的数据作为训练集来训练神经网络模型，通过神经网络模型来识别文本数据中的命名实体。该方法依赖于人工标注的数据，需要大量人力成本和时间成本来标注数据。
技术实现思路
本申请实施例提供了一种命名实体识别模型的训练方法、命名实体识别方法及装置，可以使用无标签数据训练模型，节省人力资源，提高模型训练效率。所述技术方案如下：根据本申请的一个方面，提供了一种命名实体识别模型的训练方法，所述方法包括：调用第一NER模型识别第一无标签数据集得到第一模型识别结果集，所述第一命名实体识别NER模型是基于预训练...

【技术保护点】
1.一种命名实体识别模型的训练方法，其特征在于，所述方法包括：/n调用第一命名实体识别NER模型识别第一无标签数据集得到第一模型识别结果集，所述第一命名实体识别NER模型是基于预训练语言模型进行命名实体识别的模型；/n调用第二命名实体识别NER模型识别所述第一无标签数据集得到第二模型识别结果集，所述第二命名实体识别NER模型是基于词典进行命名实体识别的模型；/n根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集；/n根据所述第三模型识别结果集训练更新所述第一命名实体识别NER模型；/n调用更新后的所述第一命名实体识别NER模型识别第二无标签数据集得到第一更新识别结果集，根据所述第一更新识别结果集更新所述第二命名实体识别NER模型的所述词典。/n

【技术特征摘要】
1.一种命名实体识别模型的训练方法，其特征在于，所述方法包括：
调用第一命名实体识别NER模型识别第一无标签数据集得到第一模型识别结果集，所述第一命名实体识别NER模型是基于预训练语言模型进行命名实体识别的模型；
调用第二命名实体识别NER模型识别所述第一无标签数据集得到第二模型识别结果集，所述第二命名实体识别NER模型是基于词典进行命名实体识别的模型；
根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集；
根据所述第三模型识别结果集训练更新所述第一命名实体识别NER模型；
调用更新后的所述第一命名实体识别NER模型识别第二无标签数据集得到第一更新识别结果集，根据所述第一更新识别结果集更新所述第二命名实体识别NER模型的所述词典。

2.根据权利要求1所述的方法，其特征在于，所述第一无标签数据集包括K个无标签文本数据，所述第一模型识别结果集、所述第二模型识别结果集和所述第二模型识别结果集包括K个有标签文本数据，K是正整数；
所述根据所述第二模型识别结果集修正所述第一模型识别结果集得到第三模型识别结果集，包括：
根据所述第二模型识别结果集中的第i个有标签文本数据修正所述第一模型识别结果集中的第i个有标签文本数据，所述第二模型识别结果集中的第i个有标签文本数据与所述第一模型识别结果集中的第i个有标签文本数据存在至少一个标签不同的命名实体，i是小于或等于K的正整数。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第二模型识别结果集中的第i个有标签文本数据修正所述第一模型识别结果集中的第i个有标签文本数据，包括：
响应于所述第二模型识别结果集中的第i个有标签文本数据的第m个命名实体与所述第一模型识别结果集中的第i个有标签文本数据的第n个命名实体的起始位置相同且终止位置不同，使用所述第m个命名实体的标签替换所述第n个命名实体的标签，m、n是正整数；
或，
响应于所述第二模型识别结果集中的第i个有标签文本数据的第m个命名实体与所述第一模型识别结果集中的第i个有标签文本数据的第n个命名实体的起始位置不同且终止位置相同，使用所述第m个命名实体的标签替换所述第n个命名实体的标签，m、n是正整数。

4.根据权利要求1至3任一所述的方法，其特征在于，所述方法还包括：
使用样本有标签数据集训练初始模型得到所述第一命名实体识别NER模型。

5.根据权利要求4所述的方法，其特征在于，所述使用样本有标签数据集训练初始模型得到所述第一命名实体识别NER模型之后，还包括：
调用所述第一命名实体识别NER模型识别所述第二无标签数据集得到更新识别结果集；
根据所述更新识别结果集构建所述第二命名实体识别NER模型的所述词典。

6.根据权利要4所述的方法，其特征在于，所述根据所述第三模型识别结果集训练更新所述第一命名实体识别NER模型，包括：
将所述第三模型识别结果集加入所述样本有标签数据集，更新所述样本有标签数据集；
使用更新后的所述样本有标签数据集训练更新所述第一命名实体识别NER模型。

7.根据权利要求1至3任一所述的方法，其特征在于，所述方法还包括：
调用更新后的所述第一命名实体识别NER模型识别所述第一无标签数据集得到第j-2模型识别结果集，j是3的整数倍且j为正数；
调用更新后的所述第二命名实体识别NER模型识别所述第一无标签数据集得到第j-1模型识别结果集；
根据所述第j-2模型识别结果集修正所述第j-1模型识别结果集得到第j模型识别结果集；
根据所述第j模型识别结果集训练更新所述第一命名实体识别NER模型；
调用更新后的所述第一命名实体识别NER模型识别所述第二无标签数据集得到第j-2更新识别结果集，根据所述第j-2更新识别结果集更新所述第二命名实体识别NER模型的所述词典；
重复上述步骤迭代更新所述第一命名实体识别NER模型和所述第二命名实体识别NER模型。

8.根据权利要求7所述的方法，...

【专利技术属性】
技术研发人员：谢德峰，管冲，陈曦，
申请(专利权)人：腾讯云计算长沙有限责任公司，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人