基于多任务学习的病例信息抽取方法、装置、设备及介质制造方法及图纸

技术编号:39423430 阅读:25 留言:0更新日期:2023-11-19 16:11
本申请适用于数字医疗技术领域,尤其涉及一种基于多任务学习的病例信息抽取方法、装置、设备及介质。上述方法中基于多任务学习机制,在进行文本信息关系抽取的过程中,利用两个任务的相似度,使用相同的编码器进行特征处理,根据处理后的特征分别执行识别任务与关系抽取任务,得到最终的信息抽取结果,在信息抽取的过程中只使用了一个编码器进行特征提取,降低了编码器的存储资源占用率,从而提高了资源利用率。源利用率。源利用率。

【技术实现步骤摘要】
基于多任务学习的病例信息抽取方法、装置、设备及介质


[0001]本申请适用于数字医疗
,尤其涉及一种基于多任务学习的病例信息抽取方法、装置、设备及介质。

技术介绍

[0002]数字医疗是把现代计算机技术、信息技术应用于整个医疗过程的一种新型的现代化医疗方式,是公共医疗的发展方向和管理目标。在数字医疗研究过程中,通常将病历、病理、CT、MR、手术等各种文书数据作为数据源,分别从这些数据源中进行信息抽取,获取对应信息,随着深度学习及人工智能技术的飞速发展,基于光学字符识别的文档自动化信息抽取已成为信息抽取的重要环节,有效地提高人工录入信息的效率,但在信息抽取过程中,现有技术,一般使用两个阶段方案进行信息抽取,两个阶段方案是单任务模型,使用两个编码器分别进行实体抽取与关系抽取,得到最终的信息抽取结果,其中,两个编码器占据了大量的存储资源,使资源利用率较低,造成了资源浪费,因此,在信息抽取过程中,如何提高资源利用率成为亟需解决的问题。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种基于多任务学习的病例信息抽取方法、装置本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多任务学习的病例信息抽取方法,其特征在于,所述病例信息抽取方法包括:获取待抽取病例图像,将所述待抽取病例图像中表征文字的图像区域转换为文本表达,提取每个文本表达在所述待抽取病例图像中的像素位置;使用基于多任务学习训练出的抽取模型中的编码器对所述文本表达和所述像素位置分别进行编码,得到对应文本表达的关键文本特征以及位置标签特征;针对任一个文本表达,使用所述抽取模型中的第一解码器对所述文本表达对应的关键文本特征进行解码,得到对应所述文本表达的识别结果;使用所述抽取模型中的第二解码器对所述文本表达对应的位置标签特征进行解码,得到对应所述文本表达的依存关系信息;根据所述依存关系信息,确定对应所述文本表达的依存类别,遍历所有的文本表达,得到每个文本表达对应的依存类别;在检测到某一依存关系信息的依存类别为一对多时,将所述依存关系信息中的其他文本表达合并,得到合并结果,确定所述合并结果和所述依存关系信息对应的文本表达为对应的抽取结果,在检测到某一依存关系信息的依存类别为一对一时,确定所述依存关系信息中的其他文本表达和所述依存关系信息对应的文本表达为对应的抽取结果。2.如权利要求1所述的病例信息抽取方法,其特征在于,所述将所述待抽取病例图像中表征文字的图像区域转换为文本表达,提取每个文本表达在所述待抽取病例图像中的像素位置,包括:对所述待抽取病例图像进行文字检测,得到所述待抽取病例图像中表征文字的图像区域;对所述图像区域进行文字识别,得到所述图像区域中文字的文本表达,根据所述图像区域,提取每个文本表达在所述待抽取病例图像中的像素位置。3.如权利要求1所述的病例信息抽取方法,其特征在于,所述使用基于多任务学习训练出的抽取模型中的编码器对所述文本表达和所述像素位置分别进行编码,得到对应文本表达的关键文本特征以及位置标签特征,包括:根据所述文本表达和所述像素位置,使用基于多任务学习训练出的抽取模型中的编码器提取对应文本表达中的关键文本特征;将所述待抽取病例图像划分为大小相等的图像块,对所述图像块进行线性投影,得到所述图像块中的线性投影特征,根据所述线性投影特征与像素位置,确定所述图像块的图像嵌入特征;将所述关键文本特征与所述图像嵌入特征进行对齐处理,得到每个关键文本对应的位置标签特征。4.如权利要求1所述的病例信息抽取方法,其特征在于,所述使用所述抽取模型中的第二解码器对所述文本表达对应的位置标签特征进行解码,得到对应所述文本表达的依存关系信息,包括:根据预设位置标签,使用双向长短期记忆网络对每个文本表达属于所述预设位置标签进行评分操作,通过随机场网络,对所述评分操作进行约束处理,得到对应评分结果;根据所述评分结果确定每个文本表达的目标位置标签,根据所述...

【专利技术属性】
技术研发人员:董永飞周坤胜
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1