医疗命名实体识别模型的生成方法、装置和计算机设备制造方法及图纸

技术编号：29527332 阅读：15 留言：0更新日期：2021-08-03 15:13

本申请为数字医疗技术领域，本申请提供了一种医疗命名实体识别模型的生成方法、装置和计算机设备，其中，所述方法包括：从电子病历单中提取输入语句，并获取人工标注的医疗命名实体；将医疗命名实体嵌入输入语句的各个词之间，得到目标输入语句；将目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练，确定目标输入语句的初始实体；随机选用遮蔽符号遮蔽目标输入语句中预定比例的初始实体，并预测被遮蔽的初始实体的原始实体；在原始实体与人工标注的医疗命名实体一致时，得到医疗命名实体识别模型。本发明专利技术同时利用了句子和实体对自然语言生成模型进行训练，提高了医疗命名实体识别模型对医疗命名实体的识别准确性。

全部详细技术资料下载

【技术实现步骤摘要】
医疗命名实体识别模型的生成方法、装置和计算机设备
本申请涉及数字医疗
，具体而言，本申请涉及一种医疗命名实体识别模型的生成方法、装置和计算机设备。
技术介绍
电子病历单中的医疗命名实体识别涉及到患者的医疗诊断过程。例如：疾病名称、临床症状、药品名称、医疗方法等具有特定意义的医疗命名实体。电子病历单由于医生书写的非规范性，以及包含大量的专业术语缩略词等，使得对于电子病历单的医疗命名实体识别的难度较大。现有基于传统及机器学习方法进行的电子病历单的医疗命名实体识别都严重依赖训练数据的质量和规模，当训练数据的质量较差或规模有限时，则会使训练得到的医疗命名实体识别模型的识别效果较差。
技术实现思路
本申请的主要目的为提供一种医疗命名实体识别模型的生成方法、装置和计算机设备，提高医疗命名实体识别模型的识别效果。为了实现上述专利技术目的，本申请提供一种医疗命名实体识别模型的生成方法，其包括以下步骤：获取电子病历单，从所述电子病历单中提取输入语句，并根据所述输入语句从数据库中获取人工标注的医疗命名实体；其中，所述输入语句为未标注医疗命名实体的文本数据；将所述医疗命名实体嵌入所述输入语句的各个词之间，得到目标输入语句；将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练，确定所述目标输入语句的初始实体；随机选用遮蔽符号遮蔽所述目标输入语句中预定比例的初始实体，并获取所述初始实体的上下文信息，根据所述上下文信息预测被遮蔽的初始实体的原始...

【技术保护点】
1.一种医疗命名实体识别模型的生成方法，其特征在于，包括以下步骤：/n获取电子病历单，从所述电子病历单中提取输入语句，并根据所述输入语句从数据库中获取人工标注的医疗命名实体；其中，所述输入语句为未标注医疗命名实体的文本数据；/n将所述医疗命名实体嵌入所述输入语句的各个词之间，得到目标输入语句；/n将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练，确定所述目标输入语句的初始实体；/n随机选用遮蔽符号遮蔽所述目标输入语句中预定比例的初始实体，并获取所述初始实体的上下文信息，根据所述上下文信息预测被遮蔽的初始实体的原始实体；/n判断所述原始实体与人工标注的医疗命名实体是否一致；/n当确定所述原始实体与人工标注的医疗命名实体一致时，完成所述自然语言生成模型的训练，得到医疗命名实体识别模型。/n

【技术特征摘要】
1.一种医疗命名实体识别模型的生成方法，其特征在于，包括以下步骤：
获取电子病历单，从所述电子病历单中提取输入语句，并根据所述输入语句从数据库中获取人工标注的医疗命名实体；其中，所述输入语句为未标注医疗命名实体的文本数据；
将所述医疗命名实体嵌入所述输入语句的各个词之间，得到目标输入语句；
将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练，确定所述目标输入语句的初始实体；
随机选用遮蔽符号遮蔽所述目标输入语句中预定比例的初始实体，并获取所述初始实体的上下文信息，根据所述上下文信息预测被遮蔽的初始实体的原始实体；
判断所述原始实体与人工标注的医疗命名实体是否一致；
当确定所述原始实体与人工标注的医疗命名实体一致时，完成所述自然语言生成模型的训练，得到医疗命名实体识别模型。

2.根据权利要求1所述的医疗命名实体识别模型的生成方法，其特征在于，所述将所述医疗命名实体嵌入所述输入语句的各个词之间的步骤，包括：
当检测到所述医疗命名实体包括多个单词时，分别计算每个单词与所述输入语句的各个词之间的相似度，根据所述相似度确定每个单词嵌入所述输入语句的每个位置对应词嵌入的平均值；其中，所述词嵌入的平均值用于评估单词嵌入所述输入语句的每个位置的合理度；
根据所述每个单词对应词嵌入的平均值确定每个单词对应嵌入的嵌入位置；
按照所述嵌入位置将各个单词嵌入所述输入语句的各个词之间。

3.根据权利要求1所述的医疗命名实体识别模型的生成方法，其特征在于，所述根据所述上下文信息预测被遮蔽的初始实体的原始实体的步骤，包括：
根据所述上下文信息，采用softmax函数对被遮蔽的所述初始实体进行预测，得到多个预测实体及各个预测实体的概率值；
将概率值最大的预测实体作为所述原始实体。

4.根据权利要求1所述的医疗命名实体识别模型的生成方法，其特征在于，所述判断所述原始实体与人工标注的医疗命名实体是否一致的步骤之后，还包括：
当确定所述原始实体与人工标注的医疗命名实体不一致时，获取所述原始实体与人工标注的医疗命名实体的差异信息；
根据所述差异信息调整所述自然语言生成模型的参数，对调整参数后的所述自然语言生成模型进行再次训练，直至预测的原始实体与人工标注的医疗命名实体一致。

5.根据权利要求1所述的医疗命名实体识别模型的生成方法，其特征在于，所述将所述目标输入语句输入基于Transformer架构的自然语言生成模型中进行训练，确定所述目标输入语句的初始实体的步骤，包括：

【专利技术属性】
技术研发人员：于凤英，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人