一种电子病历数值推理的方法、装置、设备及介质制造方法及图纸

技术编号:39402162 阅读:19 留言:0更新日期:2023-11-19 15:54
本发明专利技术涉及数字医疗领域,尤其涉及一种电子病历数值推理的方法、装置、设备及介质,通过获取电子病历的初始文本数据,利用可插拔的预训练语言模型对初始文本数据进行处理,得到目标文本数据,基于预设的指示,对其进行结构化处理,以抽取实体关系,进而确定上下文特征,基于深度学习对上下文特征进行位置标记处理,得到目标文本数据的位置坐标,以此进行数值推理。本申请利用可插拔的预训练语言模型,在复杂且标注困难的医疗场景下,极大降低了模型引入成本,更好的提取电子病历文本数据,基于预设的指示和深度学习,充分发掘了电子病历数据的位置坐标,进行数值推理,以得到准确的推理结果,提高了对电子病历进行信息抽取和数值推理的准确性。理的准确性。理的准确性。

【技术实现步骤摘要】
一种电子病历数值推理的方法、装置、设备及介质


[0001]本专利技术涉及人工智能领域及数字医疗领域,尤其涉及一种电子病历数值推理的方法、装置、设备及介质。

技术介绍

[0002]随着医院信息化建设的不断完善,医院的各个业务系统都会产生大量的电子病历数据。这些数据是病人在医院就诊及治疗过程中所产生的重要记录,包含病历文本、医学图表、医学影像等多种类型数据。其中,非结构化形式的电子病历文本数据是最主要的部分,如主诉、诊断结果、入院/出院记录和治疗过程等,这些数据蕴含大量有价值的医疗知识及健康信息。从大量不规则的文本中,抽取出数值信息,并进行一定的推理计算。
[0003]然而针对医疗场景的数值推理,传统的做法是实体抽取+关系抽取+数值逻辑计算。但是由于医学文本的来源图片大多拍摄不工整,使得识别后的文本数据位置坐标错位,实体抽取错乱,以此直接导致后续的关系抽取失败,数值计算错误。并且在不同的医学场景下,由于电子病历文本数据复杂性,不能精准确定其位置坐标,需要人工编写不同的数值推理逻辑,非常耗时耗力。

技术实现思路
r/>[0004]基本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电子病历数值推理的方法,其特征在于,包括:获取电子病历的初始文本数据,利用可插拔的预训练语言模型对初始文本数据进行处理,得到目标文本数据;基于预设的指示,对所述目标文本数据进行结构化处理,以抽取实体关系;根据所述实体关系,确定所述目标文本数据对应的上下文特征;基于深度学习对所述目标文本数据对应的上下文特征进行位置标记处理,得到所述目标文本数据的位置坐标;根据所述目标文本数据的位置坐标,对所述目标文本数据进行确定性数值推理。2.如权利要求1所述的电子病历数值推理的方法,其特征在于,所述利用可插拔的预训练语言模型对初始文本数据进行处理,得到目标文本数据,包括:预先建立可插拔的预训练语言模型;基于所述预训练语言模型的可插拔旁路,获取由模型的训练样本的初始文本数据所组成的矩阵;对所述初始文本数据所组成的矩阵进行降维与升维,得到所述降维与升维的矩阵;从所述预训练语言模型和所述降维与升维的矩阵中,提取数据并作为目标文本数据。3.如权利要求2所述的电子病历数值推理的方法,其特征在于,所述对所述初始文本数据所组成的矩阵进行降维与升维,得到所述降维与升维的矩阵,包括:利用随机高斯分布对所述初始文本数据所组成的矩阵进行初始化处理,得到降维矩阵;利用0矩阵对所述初始文本数据所组成的矩阵进行初始化处理,得到升维矩阵;将所述降维矩阵与所述升维矩阵进行融合,得到降维与升维的矩阵。4.如权利要求2所述的电子病历数值推理的方法,其特征在于,所述从所述预训练语言模型和所述降维与升维的矩阵中,提取数据并作为目标文本数据,包括:将从所述预训练语言模型和所述可插拔旁路中的降维与升维的矩阵输出的数据进行叠加,提取叠加后的文本数据;将所述叠加后的文本数据作为目标文本数据。5.如权利要求1所述的电子病历数值推理的方法,其特征在于,所述根据所述实体关系,确定所述目标文本数据对应的上下文特征,包括:判断所述实体关系是否存在先验事实;根据所述先验事实的判定结果,确定...

【专利技术属性】
技术研发人员:张兆
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1