一种面向电子病历解析的关系抽取方法技术

技术编号：39598813 阅读：12 留言：0更新日期：2023-12-03 19:57

本发明专利技术公开了一种面向电子病历解析的关系抽取方法，包括如下步骤：步骤

全部详细技术资料下载

【技术实现步骤摘要】
一种面向电子病历解析的关系抽取方法

[0001]本专利技术涉及深度学习
，具体涉及一种面向电子病历解析的关系抽取方法
。

技术介绍

[0002]随着医疗信息化
、
医疗智能化的不断发展，海量的医疗数据
、
医学知识被不断的积累和迭代，对医学数据的理解和利用越来越重要
。
电子病历档案是构建智慧医疗体系的重要基石，它记录了患者的诊断和治疗全过程信息（包括患者基本信息
、
病程记录
、
检验检查结果
、
手术记录
、
护理记录
、
医嘱等），能够显著提高医生之间的信息交换，让医生可以全面了解患者病史，而不仅是当次就诊时的快照式概述，从而做出快速准确的诊断
。
[0003]知识图谱作为人类知识信息的一种智能化
、
结构化的存储与表示方式，具有表达能力强
、
拓展性好等特点，很快被引入到海量医疗数据的管理与应用中，并形成了一套完整的基于知识图谱的医疗大数据技术体系，即通过知识图谱构建技术整合多源异构的医疗数据，将复杂的非结构化医疗数据转换为结构化的知识形式存储在知识图谱的格式化框架中
。
[0004]关系抽取作为医学知识图谱构建过程中的核心任务，需要通过实体识别和关系抽取两个子任务，将结构化或非结构化的医学知识转化为结构化的三元组形式，以方便计算机对知识进行理解和处理
。
然而，医疗文本往往呈现出实体描述性...

【技术保护点】

【技术特征摘要】
1.
一种面向电子病历解析的关系抽取方法，其特征在于，包括如下步骤：步骤
S1
，训练教师模型：分别将句子袋级数据和句子级数据输入教师模型，基于自适应温度和注意力组合机制得到袋级教师模型预测和句级教师模型预测，以多层级知识蒸馏监督计算教师知识；以袋级教师模型预测和远程监督标签计算教师模型总损失，基于教师模型总损失和反向传播方法训练教师模型，更新教师模型参数，完成教师模型的训练；步骤
S2
，训练学生模型：将句子级数据输入学生模型，基于自适应温度和教师知识得到句级学生模型预测，基于句级学生模型预测以及袋级教师模型预测中的教师知识计算知识蒸馏损失，以知识蒸馏损失和学生模型交叉熵损失计算得到学生模型总损失，基于学生模型总损失和反向传播方法训练学生模型，更新学生模型参数，完成学生模型的训练；步骤
S3
，进行关系抽取：基于步骤
S1
中的教师模型和步骤
S2
中的学生模型构建多级知识蒸馏关系抽取模型，利用所述多级知识蒸馏关系抽取模型对输入的数据进行关系抽取；教师模型总损失的表达式如下：；其中，表示教师模型总损失，是数据集中包含的句子袋数量；表示袋级的远程监督标签，；表示关系的个数，表示袋级教师模型预测；采用库勒贝克
‑
莱布勒散度作为学生模型的知识蒸馏损失，知识蒸馏损失的表达式如下：；其中，表示学生模型和教师模型的库勒贝克
‑
莱布勒散度；为数据集中的句子数量；表示学生模型的预测，...

【专利技术属性】
技术研发人员：黄文体，何雨，陈嘉懿，尹卓英，
申请(专利权)人：湖南科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人