基于多模态检索增强和指南引导的医疗诊断方法和系统技术方案

技术编号：46626828 阅读：1 留言：0更新日期：2025-10-14 21:24

本发明专利技术涉及一种基于多模态检索增强和指南引导的医疗诊断方法和系统，方法包括：获取包括报告和/或电子健康记录的文本信息，以及医学影像信息；分别利用图像编码器、文本编码器对医学影像信息、文本信息进行编码，得到视觉特征、文本特征；分别利用指南分支解码器、标签分支解码器，将训练阶段中样本的诊断指南特征、疾病类型标签作为Transformer结构的查询，将文本特征和视觉特征拼接后的拼接特征作为键和值，解码得到疾病类型的第一预测概率分布、第二预测概率分布，得到最终的疾病预测结果。本发明专利技术基于多源医学知识库，动态检索疾病特异性知识，并通过大语言模型去除冗余与噪声，生成标准化、结构化诊断指南，实现知识的显式引导。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多模态数据处理、计算机，尤其是涉及一种基于多模态检索增强和指南引导的医疗诊断方法和系统。

技术介绍

1、近年来，多模态学习技术(如图像-文本联合分析)在医学诊断领域取得显著进展，其通过整合放射影像、病理报告、电子健康记录(ehr)等多源数据提升诊断精度。然而，现有技术往往无法高效地利用医学知识引导模型进行诊断。主流方法多依赖预训练文本编码器来对其注入宽泛的医学知识(如基于纯文本训练或利用医学知识图谱训练)，难以在具体下游任务中动态引入细粒度疾病指南知识，导致模型难以适应不同临床场景的差异化需求。此外，现有模型在特征提取和融合过程中缺乏显式约束，未能结合相应的指南中的知识。

2、这也导致了模型可解释性较差。目前的黑盒模型，难以验证其决策是否遵循医学指南，尤其在文本中的关键指标关注度与视觉病灶定位准确性方面缺乏定量的评价机制，限制了临床可信度。部分已有方案有：

3、论文“knowledge-enhanced visual-language pre-training on chestradiology images”(kad本文档来自技高网...

【技术保护点】

1.一种基于多模态检索增强和指南引导的医疗诊断方法，其特征在于，应用于电子设备，所述方法包括如下步骤：

2.根据权利要求1所述的一种基于多模态检索增强和指南引导的医疗诊断方法，其特征在于，所述的图像编码器、文本编码器、指南分支解码器和标签分支解码器的训练过程包括如下步骤：

3.根据权利要求2所述的一种基于多模态检索增强和指南引导的医疗诊断方法，其特征在于，所述的指南增强对比损失采用下式计算：

4.根据权利要求2所述的一种基于多模态检索增强和指南引导的医疗诊断方法，其特征在于，所述的指南分支和标签分支的交叉熵损失采用下式计算：