当前位置: 首页 > 专利查询>复旦大学专利>正文

解剖学区域引导的医学视觉-语言预训练系统技术方案

技术编号:43886330 阅读:23 留言:0更新日期:2025-01-03 13:03
本发明专利技术属于医学影像处理技术领域,具体为解剖学区域引导的医学视觉‑语言预训练系统。本发明专利技术系统包括:解剖学区域与报告分句对齐模块、内部表征学习强化模块、外部表征学习强化模块;对齐模块由目标检测器、文本解析器以及二者间的自动化对齐范式构成,通过对比学习赋予模型细粒度对齐能力;内部表征学习强化模块利用图像编码器和图像标签识别解码器,将图像特征与其对应标签相关联,并提供开放疾病类别检测的功能;外部表征学习强化模块利用软标签和硬标签的对比学习,提升不同图像‑报告对之间的关联性。本发明专利技术以解剖学区域为中心,同时强化图像‑报告对内部与外部的细粒度语义关联,可显著提升基于当前预训练系统的下游任务准确率。

【技术实现步骤摘要】

本专利技术属于医学影像处理,具体涉及解剖学区域引导的医学视觉-语言预训练系统


技术介绍

1、近年来,视觉-语言预训练模型已取得令人瞩目的成功。这些模型使用数百万的网络图像-文本对进行训练,通过匹配图像与其相应的标题进行表征学习,而不需要费时费力的手动标签。在医学领域,这种模式也越来越受到关注。通过医学图文联合学习方法,从配对的放射学报告中直接学习医学影像和报告的表征,并将所学习到的表征转移到下游任务。

2、针对医学视觉语言预训练模型,一方面,考虑病理通常占据整个图像的一小部分,一些研究人员尝试引入不同的对比学习策略来学习局部表征,捕获医学图像中的细粒度语义,为后续下游任务的局部化提供便利,如医学目标检测、医学语义分割、细粒度医学问答等。在进行局部对齐时,大多研究人员采用图像块-单词的对齐方式,然而医学影像中直接切分提取的图像块既不能代表病变区域,也不能代表解剖器官;此外,单个独立的单词会拆散病灶以及与病灶相关的位置描述,这样的对齐方式缺少临床可解释性。另一方面,考虑到医学报告相对于自然图像的描述语句而言,更加专业和抽象,部分研究人员探索如何解本文档来自技高网...

【技术保护点】

1.一种解剖学区域引导的医学视觉-语言预训练系统,其特征在于,通过医学图文联合学习,从配对的放射学报告中学习医学多模态表征;包括:解剖学区域与报告分句对齐模块、内部表征学习强化模块、外部表征学习强化模块;其中:

2.根据权利要求1所述的医学视觉-语言预训练系统,其特征在于,所述解剖学区域与报告分句对齐模块,包含目标检测器、文本解析器、以及二者间的自动化对齐范式,具体流程为:

3.根据权利要求2所述的医学视觉-语言预训练系统,其特征在于,所述内部表征学习强化模块,利用“影像学观察”和“是否存在”信息为每张图像构造标签其中MQ为预定义的疾病类别,如果当前图像存在疾病类...

【技术特征摘要】

1.一种解剖学区域引导的医学视觉-语言预训练系统,其特征在于,通过医学图文联合学习,从配对的放射学报告中学习医学多模态表征;包括:解剖学区域与报告分句对齐模块、内部表征学习强化模块、外部表征学习强化模块;其中:

2.根据权利要求1所述的医学视觉-语言预训练系统,其特征在于,所述解剖学区域与报告分句对齐模块,包含目标检测器、文本解析器、以及二者间的自动化对齐范式,具体流程为:

3.根据权利要求2所述的医学视觉-语言预训练系统,其特征在于,所述内部表征学习强化模块,利用“影像学观察”和“是否存在”信息为每张图像构造标签其中mq为预定义的疾病类别,如果当前图像存在疾病类别j...

【专利技术属性】
技术研发人员:李清秋冯瑞张玥杰张晓波沈全力
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1