一种医学文本命名实体识别方法技术

技术编号：32786782 阅读：19 留言：0更新日期：2022-03-23 19:46

一种医学文本命名实体识别方法，采用了loss函数里面对预训练语言模型进行L1回归的方式去学习，平衡了预训练部分与配合命名实体识别增加部分的参数学习，提升了模型训练效果的同时，也提升了命名实体识别的效果。在训练过程中创新性采用了反向修改条件随机场中转移矩阵的方法，形成了对不合法标签的惩罚，使得医学文本命名实体识别模型能够被动的掌握避免出现不合法标签的方法，所以在解码过程中仅仅使用argmax运算就可以进行解码，摆脱了对维特比算法的依赖，提高了医学命名实体识别的推理速度，提升了大数据量下的医学文本命名实体识别场景的实时性。体识别场景的实时性。

全部详细技术资料下载

【技术实现步骤摘要】
一种医学文本命名实体识别方法

[0001]本专利技术涉及文本智能识别
，具体涉及一种医学文本命名实体识别方法。

技术介绍

[0002]医学文本的命名实体识别，指的是将诸如医学临床诊疗指南文本、医学教科书文本、临床电子病历文本、医学研究文献文本等等医学文本中的指代特定概念的文字部分，例如疾病诊断、症状体征、异常结构、药品耗材等等给识别出来，配合后续的技术可应用在医学知识图谱构建、临床病历质控、医保病历查核、临床辅助诊断等等下游应用领域。所以医学文本命名实体识别的模型的准确度，直接决定了这些医学领域的下游应用的准确性。
[0003]现今，准确度比较高的医学文本命名实体识别模型大多都是通过预训练语言模型配合条件随机场方法，但是经过大量的文献的研究显示，传统的条件随机场方法并不能对命名实体识别的效果形成明显的准确度提升，其原因在于，条件随机场针对标签序列进行序列层级归一化的方法，极大地提升了标签空间的稀疏程度，且在推理本身就正确的样本持续训练学习的过程中，使用one
‑
hot标签不断继续降低损失函数的结果，不符合标签天然的概率分布，不利于模型的训练过程，导致采用条件随机场的命名实体识别模型的最终训练准确度的下降。另一方面，预训练的语言模型在命名实体识别的训练数据集上fine
‑
tune的过程中，模型的预训练部分存有大量的学习到的模式知识，而针对命名实体识别任务追加的部分则没有任何的知识，由于模型训练过程学习率统一，较高的学习率会导致模型的预训练部分出现模式遗忘，而较低的学习率...

【技术保护点】

【技术特征摘要】
1.一种医学文本命名实体识别方法，其特征在于，包括如下步骤：a)建立由一个神经网络构成的医学文本命名实体识别模型；b)预训练语言模型，将预训练好的语言模型的参数表示为集合P1′
；c)将医学文本命名实体识别模型的可训练参数表示为集合{P1,P2}，集合中P1子集合为预训练语言模型部分对应在医学文本命名实体识别模型中的可训练参数，P2子集合为医学文本命名实体识别模型中除P1以外的其他的所有可训练参数；d)定义条件随机场模块，将条件随机场中的转移矩阵表示为K，将矩阵K中第j类实体的Y标签转移到第n类实体的Z标签的数字表示为标签结构为BIO标签，Y的取值为BIO标签中的B标签或I标签，Z的取值为BIO标签中的B标签或I标签；e)随机初始化P1子集合与P2子集合，将矩阵K中满足j≠n且Z取值为BIO标签中的I标签的的数字赋值为ζ，其他部分数字赋值为0；f)将医学文本输入到医学文本命名实体识别模型中，得到模型输出表示为W
′
，将医学文本对应的标签序列表示为L，将W
′
与L输入条件随机场模块后输出得到loss值；g)将矩阵W
′
沿列做argmax计算，将argmax计算结果转换为BIO标签序列，将得到的BIO标签序列表示为h)通过公式计算得到最终的损失函数，利用最终的损失函数调整医学文本命名实体识别模型中的可训练参数，直到early
‑
stop，得到调整完毕的医学文本命名实体识别模型，式中λ为变量，γ为固定参数，为参数集合P1′...

【专利技术属性】
技术研发人员：张伯政，吴军，鞠海涛，樊昭磊，张述睿，邱慎谦，寇燕明，
申请(专利权)人：山东众阳健康科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人