基于深度混合学习框架的肺结节CT图像识别方法技术

技术编号：37398309 阅读：9 留言：0更新日期：2023-04-30 09:26

本发明专利技术提出了一种基于深度混合学习框架的肺结节CT图像识别方法，该方案利用CNN模型和ViT模型分别对肺结节CT图像的局部结构特征和长距离上下文关系进行学习并输出相应的表示信息和第二特征映射，然后设计基于注意力机制的特征聚合模块，以自适应分配融合权重的方式对所述表示信息和第二特征映射进行聚合，从而避免过渡的参数设置以及增强识别过程的自动化水平；本发明专利技术的有益技术效果是：提出了一种基于深度混合学习框架的肺结节CT图像识别方法，该方案能利用CNN和视觉Transformer（Vision transformer,ViT）联合驱动的深度混合学习框架对胸部CT肺结节的良恶性进行识别，识别准确性较好。识别准确性较好。识别准确性较好。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度混合学习框架的肺结节CT图像识别方法

[0001]本专利技术涉及一种医学图像识别技术，尤其涉及一种基于深度混合学习框架的肺结节CT图像识别方法。

技术介绍

[0002]肺癌在全世界范围内具有高的发病率和死亡率，基于CT(Computed tomography,CT)的肺癌早期无创筛查已被证实能显著降低高风险人群的死亡率，肺结节的良、恶性鉴别诊断是该筛查任务中的一个关键环节。
[0003]在临床诊断中，放射科医生通常需要为一个结节患者逐层阅读数张甚至数十张CT切片以达到准确的判别，显然，该诊断过程费时费力，且易发生操作者偏见，因此，为了帮助放射科医生提升诊断效率和诊断准确度，开发肺结节计算机辅助诊断系统(Computer
‑
aided diagnosis,CAD)成为了医学图像分析领域中一个活跃的研究课题。肺结节形状大小变化不一，并且通常被复杂的背景组织包围，这导致结节样本之间高的类内多样性和类间相似性的特性，因此，同时提取局部特征和全局特征对准确的肺结节鉴别诊断至关重要。
[0004]近年来，大量CAD方法被开发用于肺结节良恶性鉴别诊断任务，它们大致可以被归纳为两大类：基于手工特征的方法和基于深度学习的方法。先前的方法主要倾向于利用领域知识开发各种各样的手工特征(例如，外观，强度，球形度，毛刺和纹理等)，然后这些特征被一些传统的机器学习技术(例如，随机森林，支持向量机和多层感知器等)进一步处理以获取肺结节诊断结果。通常，会同时从结节体和结节瘤周组织提取手工特征以生成对结节的全...

【技术保护点】

【技术特征摘要】
1.一种基于深度混合学习框架的肺结节CT图像识别方法，其特征在于：所述肺结节CT图像识别方法包括：1)获取肺部CT图像；采用三次样条插值算法对肺部CT图像进行重采样处理，将肺部CT图像标准化到统一的尺度；然后对重采样处理后的肺部CT图像进行归一化处理，得到归一化图像；2)从归一化图像中提取出肺结节图像；所述肺结节图像是以肺结节组织为中心的立方体区域的图像；从肺结节图像中提取出9个单视野图像；9个单视野图像分别对应立方体区域的冠状面、矢状面、横截面和6个对称面；单个对称面在立方体区域的对角线上切割立方体区域的两个相对面，并包含立方体区域的四个顶点和两个相对边；3)对9个单视野图像进行拼接处理，得到二维的第一拼接图像，对第一拼接图像进行尺度调节和通道扩展处理，得到与预训练的ViT模型的输入尺度匹配的第一3通道图像；将第一3通道图像输入ViT模型，由ViT模型对第一3通道图像所包含的长距离的上下文信息进行学习，并输出相应的第一特征映射；将第一特征映射中的第一个序列作为表示信息，所述表示信息用于预测临床语义类别；同步地，对9个单视野图像进行拼接处理，得到二维的第二拼接图像，对第二拼接图像进行尺度调节和通道扩展处理，得到与预训练的CNN模型的输入尺度匹配的第二3通道图像；将第二3通道图像输入CNN模型，由CNN模型对第二3通道图像所包含的局部结构特征进行学习，并输出相应的第二特征映射；所述ViT模型为K层具有相同网络结构的视觉Transformer，ViT模型已在自然图像集上完成预训练；所述CNN模型采用...

【专利技术属性】
技术研发人员：黄鸿，吴若愚，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人