基于多模态深度学习的胸片特征提取和疾病分类方法技术

技术编号：36563025 阅读：14 留言：0更新日期：2023-02-04 17:18

本发明专利技术提供了基于多模态深度学习的胸片特征提取和疾病分类方法，主要包括：S1数据源采集；S2数据预处理；S3图文特征融合和匹配；S4模型构建；S5模型训练和优化；本发明专利技术通过采用图文结合的自监督模型训练方法，使网络模型能在训练数据有限或小样本的情况下进行稳定快速的训练和推理；优化改进设计Transformer网络结构，使其既能捕获胸部X光片的全局特征，又能应用于具有病灶小，病灶形状不规则等特点的胸部X光片分析场景。胸部X光片分析场景。胸部X光片分析场景。

全部详细技术资料下载

【技术实现步骤摘要】
基于多模态深度学习的胸片特征提取和疾病分类方法

[0001]本专利技术属于智慧医疗
，具体涉及基于多模态深度学习的胸片特征提取和疾病分类方法。

技术介绍

[0002]医学影像的解释需要广泛的医学专业知识，但容易出现人为判别误差。在中国这样人口众多的国家，专科医生需要短时间内解释大量的医学影像，这一工作过程既繁琐又耗时。因此，如果能在短时间内自动准确判别影像中的疾病类型，对大批量医学影像完成快速初筛，可以极大的减轻临床工作者的劳动强度。近年来，随着深度学习技术在计算机视觉，自然语言处理等领域的快速发展，基于人工智能的计算机辅助诊断技术吸引了业界越来越多的关注。这些领域的快速成功发展，为患者提供更高效、更经济的医疗保健带来了希望。在众多的影像学检查中，X射线相对于CT、MRI等影像学检查，在中国应用更广泛，即便乡镇一级的卫生院都能开展X射线检查。因此，根据X光片自动准确地判别疾病类型有广阔的应用前景，这一研究对我国智慧医疗的发展有巨大的推进作用。
[0003]目前，基于深度学习的胸部X光片自动诊断技术主要采用基于卷积神经网络(Convolutional Neural Networks,CNN)的监督模型，使用的CNN如AlexNet、ResNet、VGG、DenseNet、FasterR
‑
CNN、InceptionV3、GoogleNet、MobileNetV2、SR、U
‑
NET及其变种等通用CNN架构或CheXNet、TieNET等专门针对X光片设计的CNN架构，在...

【技术保护点】

【技术特征摘要】
1.基于多模态深度学习的胸片特征提取和疾病分类方法，其特征在于，包括以下步骤：S1：数据源采集：收集开源的胸部X光片数据集以及开源的医学图像问答数据集；S2：数据预处理：对采集的数据进行数据清理和格式统一，将数据集分割为图文对和仅含图数据集；构建项目的训练集和测试集；S3：图文特征融合和匹配：采用AutoEncoder方式的对比学习进行图文特征匹配和融合；采用基于Transformer的方式，以交叉注意力的方式进行图文特征融合；S4：模型构建：利用S3提取的图文特征采用Pytorch深度学习框架搭建；S5：模型训练和优化：对构建的数据训练集进行深度学习模型的反复训练，对模型结构和参数迭代优化，创建可用于临床的项目模型。2.根据权利要求1所述基于多模态深度学习的胸片特征提取和疾病分类方法，其特征在于，所述数据预处理具体步骤为：1)对采集的数据进行数据清理和格式统一，原始胸片从多个数据集中得到，胸片格式为.dicom、.jpg和.png等多种，且分辨率差异较大，因此统一将数据转换为255x255的jpg灰度图片，同时对病理诊断不明确的影像进行清除；2)将数据集分割为图文对数据集和仅含图数据集；其中图文对数据集占数据总量的40％，仅含图数据集占数据总量的40％；3)按照80％:20％的比例切分项目的训练集和测试集。3.根据权利要求1所述基于多模态深度学习的胸片特征提取和疾病分类方法，其特征在于，所述AutoEncoder方式进行图文特征匹配和融合的具体方法为：采用对比学习进行图文特征匹配和融合，将胸片输入基于ResNet深度卷积神经网络或基于Vision Transformer的图像编码器进行特征抽取得到h
v
，然后经过MLP映射得到特征v，文本部分采用预训练的ClientBERT进行医学报告的向量化和文字特征提取得到h
u
，同样经过MLP进行非线性映射得到u，最后通过最大化既有双向损失的真实图像
‑
文本表示对之间的一致性得到融合对齐的图文特征，具备丰富的临床语义信息向量，用于...

【专利技术属性】
技术研发人员：寸天睿，徐爱迪，韩健，杨段生，沙政，赵治红，
申请(专利权)人：楚雄师范学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人