医疗命名实体识别模型的生成方法、装置和计算机设备制造方法及图纸

技术编号:29527332 阅读:15 留言:0更新日期:2021-08-03 15:13
本申请为数字医疗技术领域,本申请提供了一种医疗命名实体识别模型的生成方法、装置和计算机设备,其中,所述方法包括:从电子病历单中提取输入语句,并获取人工标注的医疗命名实体;将医疗命名实体嵌入输入语句的各个词之间,得到目标输入语句;将目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定目标输入语句的初始实体;随机选用遮蔽符号遮蔽目标输入语句中预定比例的初始实体,并预测被遮蔽的初始实体的原始实体;在原始实体与人工标注的医疗命名实体一致时,得到医疗命名实体识别模型。本发明专利技术同时利用了句子和实体对自然语言生成模型进行训练,提高了医疗命名实体识别模型对医疗命名实体的识别准确性。

【技术实现步骤摘要】
医疗命名实体识别模型的生成方法、装置和计算机设备
本申请涉及数字医疗
,具体而言,本申请涉及一种医疗命名实体识别模型的生成方法、装置和计算机设备。
技术介绍
电子病历单中的医疗命名实体识别涉及到患者的医疗诊断过程。例如:疾病名称、临床症状、药品名称、医疗方法等具有特定意义的医疗命名实体。电子病历单由于医生书写的非规范性,以及包含大量的专业术语缩略词等,使得对于电子病历单的医疗命名实体识别的难度较大。现有基于传统及机器学习方法进行的电子病历单的医疗命名实体识别都严重依赖训练数据的质量和规模,当训练数据的质量较差或规模有限时,则会使训练得到的医疗命名实体识别模型的识别效果较差。
技术实现思路
本申请的主要目的为提供一种医疗命名实体识别模型的生成方法、装置和计算机设备,提高医疗命名实体识别模型的识别效果。为了实现上述专利技术目的,本申请提供一种医疗命名实体识别模型的生成方法,其包括以下步骤:获取电子病历单,从所述电子病历单中提取输入语句,并根据所述输入语句从数据库中获取人工标注的医疗命名实体;其中,所述输入语句为未标注医疗命名实体的文本数据;将所述医疗命名实体嵌入所述输入语句的各个词之间,得到目标输入语句;将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定所述目标输入语句的初始实体;随机选用遮蔽符号遮蔽所述目标输入语句中预定比例的初始实体,并获取所述初始实体的上下文信息,根据所述上下文信息预测被遮蔽的初始实体的原始实体;判断所述原始实体与人工标注的医疗命名实体是否一致;当确定所述原始实体与人工标注的医疗命名实体一致时,完成所述自然语言生成模型的训练,得到医疗命名实体识别模型。优选地,所述将所述医疗命名实体嵌入所述输入语句的各个词之间的步骤,包括:当检测到所述医疗命名实体包括多个单词时,分别计算每个单词与所述输入语句的各个词之间的相似度,根据所述相似度确定每个单词嵌入所述输入语句的每个位置对应词嵌入的平均值;其中,所述词嵌入的平均值用于评估单词嵌入所述输入语句的每个位置的合理度;根据所述每个单词对应词嵌入的平均值确定每个单词对应嵌入的嵌入位置;按照所述嵌入位置将各个单词嵌入所述输入语句的各个词之间。优选地,所述根据所述上下文信息预测被遮蔽的初始实体的原始实体的步骤,包括:根据所述上下文信息采用softmax函数对被遮蔽的所述初始实体进行预测,得到多个预测实体及各个预测实体的概率值;将概率值最大的预测实体作为所述原始实体。进一步地,所述判断所述原始实体与人工标注的医疗命名实体是否一致的步骤之后,还包括:当确定所述原始实体与人工标注的医疗命名实体不一致时,获取所述原始实体与人工标注的医疗命名实体的差异信息;根据所述差异信息调整所述自然语言生成模型的参数,对调整参数后的所述自然语言生成模型进行再次训练,直至预测的原始实体与人工标注的医疗命名实体一致。优选地,所述将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定所述目标输入语句的初始实体的步骤,包括:在对所述自然语言生成模型的训练过程中,使用多种注意力机制计算所述目标输入语句的注意力得分,并筛选出注意力得分最高的注意力机制;根据所述注意力得分最高的注意力机制确定所述目标输入语句的初始实体。优选地,所述判断所述原始实体与人工标注的医疗命名实体是否一致的步骤,包括:利用预先训练好的Word2Vec词向量模型将所述原始实体及所述医疗命名实体分别转换成词向量;计算所述原始实体的词向量与所述医疗命名实体的词向量的余弦相似度;判断所述余弦相似度是否大于预设相似度阈值;若是,则所述原始实体与人工标注的医疗命名实体一致。优选地,所述从所述电子病历单中提取输入语句的步骤,包括:从所述电子病历单中提取文本信息;对所述文本信息进行数据清洗处理,以去除标点符号或特殊字符,得到所述输入语句。本申请还提供一种医疗命名实体识别模型的生成装置,其包括:获取模块,用于获取电子病历单,从所述电子病历单中提取输入语句,并根据所述输入语句从数据库中获取人工标注的医疗命名实体;其中,所述输入语句为未标注医疗命名实体的文本数据;嵌入模块,用于将所述医疗命名实体嵌入所述输入语句的各个词之间,得到目标输入语句;训练模块,用于将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定所述目标输入语句的初始实体;预测模块,用于随机选用遮蔽符号遮蔽所述目标输入语句中预定比例的初始实体,并获取所述初始实体的上下文信息,根据所述上下文信息预测被遮蔽的初始实体的原始实体;判断模块,用于判断所述原始实体与人工标注的医疗命名实体是否一致;确定模块,用于当确定所述原始实体与人工标注的医疗命名实体一致时,完成所述自然语言生成模型的训练,得到医疗命名实体识别模型。本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。本申请所提供的一种医疗命名实体识别模型的生成方法、装置、计算机设备和计算机可读存储介质,通过获取电子病历单,从电子病历单中提取输入语句,并根据所述输入语句从数据库中获取人工标注的医疗命名实体;将医疗命名实体嵌入输入语句的各个词之间,得到目标输入语句;然后将目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定目标输入语句的初始实体;随机选用遮蔽符号遮蔽目标输入语句中预定比例的初始实体,并根据上下文信息预测被遮蔽的初始实体的原始实体;判断原始实体与人工标注的医疗命名实体是否一致;当确定原始实体与人工标注的医疗命名实体一致时,完成自然语言生成模型的训练,得到医疗命名实体识别模型。由于将医疗命名实体嵌入输入语句的各个词之间,同时利用了句子和实体对自然语言生成模型进行训练,无需海量的训练数据即可完成训练;并随机选用遮蔽符号遮蔽目标输入语句中预定比例的初始实体,对初始实体的原始实体进行判断,提高了训练得到的医疗命名实体识别模型对医疗命名实体的识别准确性。附图说明图1为本申请一实施例的医疗命名实体识别模型的生成方法的流程示意图;图2为本申请一实施例的医疗命名实体识别模型的生成装置的结构示意框图;图3为本申请一实施例的计算机设备的结构示意框图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅本文档来自技高网...

【技术保护点】
1.一种医疗命名实体识别模型的生成方法,其特征在于,包括以下步骤:/n获取电子病历单,从所述电子病历单中提取输入语句,并根据所述输入语句从数据库中获取人工标注的医疗命名实体;其中,所述输入语句为未标注医疗命名实体的文本数据;/n将所述医疗命名实体嵌入所述输入语句的各个词之间,得到目标输入语句;/n将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定所述目标输入语句的初始实体;/n随机选用遮蔽符号遮蔽所述目标输入语句中预定比例的初始实体,并获取所述初始实体的上下文信息,根据所述上下文信息预测被遮蔽的初始实体的原始实体;/n判断所述原始实体与人工标注的医疗命名实体是否一致;/n当确定所述原始实体与人工标注的医疗命名实体一致时,完成所述自然语言生成模型的训练,得到医疗命名实体识别模型。/n

【技术特征摘要】
1.一种医疗命名实体识别模型的生成方法,其特征在于,包括以下步骤:
获取电子病历单,从所述电子病历单中提取输入语句,并根据所述输入语句从数据库中获取人工标注的医疗命名实体;其中,所述输入语句为未标注医疗命名实体的文本数据;
将所述医疗命名实体嵌入所述输入语句的各个词之间,得到目标输入语句;
将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定所述目标输入语句的初始实体;
随机选用遮蔽符号遮蔽所述目标输入语句中预定比例的初始实体,并获取所述初始实体的上下文信息,根据所述上下文信息预测被遮蔽的初始实体的原始实体;
判断所述原始实体与人工标注的医疗命名实体是否一致;
当确定所述原始实体与人工标注的医疗命名实体一致时,完成所述自然语言生成模型的训练,得到医疗命名实体识别模型。


2.根据权利要求1所述的医疗命名实体识别模型的生成方法,其特征在于,所述将所述医疗命名实体嵌入所述输入语句的各个词之间的步骤,包括:
当检测到所述医疗命名实体包括多个单词时,分别计算每个单词与所述输入语句的各个词之间的相似度,根据所述相似度确定每个单词嵌入所述输入语句的每个位置对应词嵌入的平均值;其中,所述词嵌入的平均值用于评估单词嵌入所述输入语句的每个位置的合理度;
根据所述每个单词对应词嵌入的平均值确定每个单词对应嵌入的嵌入位置;
按照所述嵌入位置将各个单词嵌入所述输入语句的各个词之间。


3.根据权利要求1所述的医疗命名实体识别模型的生成方法,其特征在于,所述根据所述上下文信息预测被遮蔽的初始实体的原始实体的步骤,包括:
根据所述上下文信息,采用softmax函数对被遮蔽的所述初始实体进行预测,得到多个预测实体及各个预测实体的概率值;
将概率值最大的预测实体作为所述原始实体。


4.根据权利要求1所述的医疗命名实体识别模型的生成方法,其特征在于,所述判断所述原始实体与人工标注的医疗命名实体是否一致的步骤之后,还包括:
当确定所述原始实体与人工标注的医疗命名实体不一致时,获取所述原始实体与人工标注的医疗命名实体的差异信息;
根据所述差异信息调整所述自然语言生成模型的参数,对调整参数后的所述自然语言生成模型进行再次训练,直至预测的原始实体与人工标注的医疗命名实体一致。


5.根据权利要求1所述的医疗命名实体识别模型的生成方法,其特征在于,所述将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练,确定所述目标输入语句的初始实体的步骤,包括:

【专利技术属性】
技术研发人员:于凤英王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1