一种语义标签确定模型的构建方法、病历解析方法技术

技术编号:31797148 阅读:28 留言:0更新日期:2022-01-08 10:57
本申请公开了一种语义标签确定模型的构建方法、病历解析方法,先利用样本病历文本和该样本病历文本的实际语义标签信息,构建语义标签确定模型,以使构建好的语义标签确定模型具有较好的语义标签确定性能,从而使得该语义标签确定模型能够针对一个病历文本数据进行比较准确地语义标签确定处理,进而使得利用该语义标签确定模型确定的预测语义标签信息,能够比较准确地描述出该病历文本数据中至少一个字符串的字段信息,如此使得基于该预测语义标签信息确定的该病历文本数据的语义解析结果,能够比较准确地描述出该病历文本数据中所携带的语义信息,如此有利于提高语义解析效果。果。果。

【技术实现步骤摘要】
一种语义标签确定模型的构建方法、病历解析方法


[0001]本申请涉及智慧医疗
,尤其涉及一种语义标签确定模型的构建方法、病历解析方法。

技术介绍

[0002]电子病历是指一个患者从入院到出院过程中各种医疗文字和图像的载体,以使该电子病历用于记录医务人员对患者疾病发生、发展及转归进行检查、诊断、治疗等医疗活动过程;而且该电子病历通常包括门(急)诊电子病历、住院电子病历及其它电子医疗记录等。
[0003]然而,因大量电子病历存在书写不规范的缺陷,导致针对这些电子病历的语义解析过程比较困难,从而导致这些电子病历的语义解析结果比较差。

技术实现思路

[0004]本申请实施例的主要目的在于提供一种语义标签确定模型的构建方法、病历解析方法,能够提高针对病历数据的语义解析效果。
[0005]本申请实施例提供了一种语义标签确定模型的构建方法,所述方法包括:
[0006]获取样本病历文本和所述样本病历文本的实际语义标签信息;
[0007]根据所述样本病历文本和待训练模型,确定所述样本病历文本的预测语义标签信息本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语义标签确定模型的构建方法,其特征在于,所述方法包括:获取样本病历文本和所述样本病历文本的实际语义标签信息;根据所述样本病历文本和待训练模型,确定所述样本病历文本的预测语义标签信息;根据所述预测语义标签信息和所述实际语义标签信息,更新所述待训练模型,并继续执行所述根据所述样本病历文本和待训练模型,得到所述样本病历文本的预测语义标签信息的步骤,直至在达到预设停止条件时,根据所述待训练模型,确定语义标签确定模型。2.根据权利要求1所述的方法,其特征在于,所述待训练模型包括文本编码层、专家编码层、专家权重确定层和决策层;其中,所述专家编码层包括M个专家编码网络;M为正整数;所述预测语义标签信息的确定过程,包括:根据所述样本病历文本和所述文本编码层,确定待使用文本编码结果;将所述待使用文本编码结果输入第m个专家编码网络,得到所述第m个专家编码网络输出的第m个专家编码结果;其中,m为正整数,m≤M;将所述待使用文本编码结果输入所述专家权重确定层,得到所述专家权重确定层输出的所述M个专家编码网络对应的预测专家权重值;将所述M个专家编码结果和所述M个专家编码网络对应的预测专家权重值输入决策层,得到所述决策层输出的所述样本病历文本的预测语义标签信息。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取所述M个专家编码网络对应的先验专家权重值;所述根据所述预测语义标签信息和所述实际语义标签信息,更新所述待训练模型,包括:根据所述预测语义标签信息、所述实际语义标签信息、所述M个专家编码网络对应的先验专家权重值、和所述M个专家编码网络对应的预测专家权重值,更新所述待训练模型。4.根据权利要求3所述的方法,其特征在于,所述获取所述M个专家编码网络对应的先验专家权重值,包括:确定所述样本病历文本的样本类型信息;根据所述样本类型信息和预设映射关系,确定所述M个专家编码网络对应的先验专家权重值;其中,所述预设映射关系包括所述样本类型信息与所述M个专家编码网络对应的先验专家权重值之间的对应关系。5.根据权利要求4所述的方法,其特征在于,所述样本类型信息包括标签确定难度表征数据和/或标签频次表征数据;所述标签确定难度表征数据的确定过程,包括:对所述样本病历文本进行预设划分处理,得到至少一个样本片段;将各个所述样本片段输入预先构建的语义解析模型,得到所述语义解析模型输出的各个所述样本片段的语义标签解析信息;根据各个所述样本片段的语义标签解析信息和所述实际语义标签信息,确定所述样本病历文本的模型解析损失值;根据所述模型解析损失值,确定所述样本病历文本的标签确定难度表征数据;所述标签频次表征数据的确定过程,包括:依据至少一个参考病历文本的实际语义标签信息,对所述实际语义标签信息进行出现频次统计处理,得到所述样本病历文本的标签频次表征数据。
6.根据权利要求3所述的方法,其特征在于,所述根据所述预测语义标签信息、所述实际语义标签信息、所述M个专家编码网络对应的先验专家权重值、和所述M个专家编码网络对应的预测专家权重值,更新所述待训练模型,包括:根据所述预测语义标签信息和所述实际语义标签信息,确定所述样本病历文本的语义预测损失值;根据所述M个专家编码网络对应的先验专家权重值和所述M个专家编码网络对应的预测专家权重值,确定所述样本病历文本的权重预测损失值;根据所述样本病历文本的语义预测损失值和所述样本病历文本的权重预测损失值,确定所述待训练模型的模型预测损失值;根据所述模型预测损失值,更新所述待训练模型。7.根据权利要求2所述的方法,其特征在于,所述决策层包括专家决策网络和决策融合网络;所述预测语义标签信息的确定过程,包括:将所述第m个专家编码结果输入所述专家决策网络,得到所述专家决策网络输出的第m个专家决策结果;其中,m为正整数,m≤M;将M个专家决策结果和所述M个专家编码网络对应的预测专家权重值输入决策融合网络,得到所述决策融合网络输出的所述样本病历文本的预测语义标签信息。8.根据权利要求7所述的方法,其特征在于,所述根据所述预测语义标签信息和所述实际语义标签信息,更新所述待训练模型,包括:根据所述M个专家决策结果、所述M个专家编码网络对应的预测专家权重值、和所述实际语义标签信息,更新所述待训练模型。9.根据权利要求8所述的方法,其特征在于,所述根据所述M个专家决策结果、所述M个专家编码网络对应的预测专家权重值、和所述实际语义标签信息,更新所述待训练模型,包括:根据所述第m个专家决策结果和所述实际语义标签信息,确定第m个专家决策损失值;其中,m为正整数,m≤M;根据M个专家决策损失值和所述M个专家编码网络对应的预测专家权重值,确定所述样本病历文本的语义预测损失值;根据所述样本病历文本的语义预测损失值,更新所述待训练模型。10.根据权利要求9所述的方法,其特征在于,所述第m个专家决策损失值的确定过程,包括:根据所述第m个专家决策结果、所述实际语义标签信息、以及所述第m个专家编码网络对应的网络损失函数,确定所述第m个专家决策损失值;其中,所述第m个专家编码网络对应的网络损失函数中惩罚因子不同于所述M个专家编码网络中除了所述第m个专家编码网络以外的其他任意一个专家编码网络对应的网络损失函数中惩罚因子。11.根据权利要求7...

【专利技术属性】
技术研发人员:周开银吴及刘喜恩尤心心刘少辉
申请(专利权)人:北京惠及智医科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1