【技术实现步骤摘要】
基于生成式对抗网络的医学信息跨模态哈希编码学习方法
本专利技术涉及基于生成式对抗网络的医学信息跨模态哈希编码学习方法,属于医疗信息处理与信息检索
技术介绍
通过深度学习的方法进行计算机辅助诊断的研究,去解决一些医疗领域中的问题,已经被越来越多的研究者和医生所关注,而肺癌是目前研究最为广泛的疾病之一。放射科医生通过胸部CT图像检筛查结节的形式对早期肺癌进行检测,并将检测结果以文本形式进行保存,作为临床医生的诊断依据。早期,对肺结节恶性程度的诊断主要通过设置阈值,并观察结节不同时间结节体积的变化,最后通过一种标准公式来评估出结节增长率的方式进行诊断。目前,针对医学领域内较为常用的医学图像、文本这两种最基本的模态数据,学者开展了多模态检索研究和跨模态研究,主流方法有以下几种。利用CCA学习图像模态、文本模态的相关性匹配,并结合语义匹配提高跨模态检索的性能。应用KCCA提出了一种跨模态相关学习框架,使用超链接信息来提高相关学习模型的性能。提出一种深度典型相关性分析模型DCCA,通过深度神经网络学习了两组媒体数据基于最大相关的非线性映射,使得具有相关性的不同媒体在同构空间中的特征表示具有较强的一致性。提出一种三视角的核CCA方法,通过引入第三种高层语义的视角信息,使得具有相同语义的文本和图像在同构空间中具有良好的聚集性。基于文本、基于内容的医学图像检索均为单模态检索,仅能依靠单一模态的语义信息、甚至是标注信息进行模态数据间的检索,不能充分利用不同模态间隐藏的语义信息,而上述现有的基于深度学习的跨模态检索方法,在模态间 ...
【技术保护点】
1.基于生成式对抗网络的医学信息跨模态哈希编码学习方法,其特征在于:所述方法的具体步骤如下:/nStep1、对胸部CT图像-文本数据进行特征提取;首先进行胸部CT图像预处理,切割出ROI图像块,然后分别从ROI图像块和胸部CT图像-文本数据通过CMSFF模型和词袋模型提取出图像特征和文本特征;/nStep2、构建判别器的约束条件;学习哈希码的判别器子模块同时接收两个输入,分别是前一个子模块的图像特征向量和文本特征向量,此处分别将图像特征和文本特征作为真实数据和生成数据,并且以相似矩阵对判别器进行约束,用来监督后续步骤得到的哈希编码的准确性;/nStep3、判别器中进行对抗性学习;生成式对抗网络中,判别器通过不断的判断输入样本是真实数据还是生成器产生的生成数据,将得到的判别结果反馈给生成器,促使生成器不断的调整参数,学习真实数据的概率分布;其中利用对抗性学习调整网络参数;/nStep4、哈希编码学习;首先将提取到的连续的样本特征通过sign操作得到一组离散的值,得到图像和文本对应的特征矩阵;再通过相似矩阵进行约束,使得同一对象的不同模态的哈希编码尽可能的相近,而不同对象的哈希编码尽量不同 ...
【技术特征摘要】
1.基于生成式对抗网络的医学信息跨模态哈希编码学习方法,其特征在于:所述方法的具体步骤如下:
Step1、对胸部CT图像-文本数据进行特征提取;首先进行胸部CT图像预处理,切割出ROI图像块,然后分别从ROI图像块和胸部CT图像-文本数据通过CMSFF模型和词袋模型提取出图像特征和文本特征;
Step2、构建判别器的约束条件;学习哈希码的判别器子模块同时接收两个输入,分别是前一个子模块的图像特征向量和文本特征向量,此处分别将图像特征和文本特征作为真实数据和生成数据,并且以相似矩阵对判别器进行约束,用来监督后续步骤得到的哈希编码的准确性;
Step3、判别器中进行对抗性学习;生成式对抗网络中,判别器通过不断的判断输入样本是真实数据还是生成器产生的生成数据,将得到的判别结果反馈给生成器,促使生成器不断的调整参数,学习真实数据的概率分布;其中利用对抗性学习调整网络参数;
Step4、哈希编码学习;首先将提取到的连续的样本特征通过sign操作得到一组离散的值,得到图像和文本对应的特征矩阵;再通过相似矩阵进行约束,使得同一对象的不同模态的哈希编码尽可能的相近,而不同对象的哈希编码尽量不同;
Step5、进行训练,优化网络参数;在哈希编码的学习过程中,分别对特征生成器和判别器进行迭代优化;优化模型中的生成器参数θp,t、判别器参数θD和模型训练过程中的二值编码参数B;通过GANHL模型学习出不同模态的哈希编码存储于哈希编码数据库,同时得到一个训练好的模型用于跨模态检索系统;
Step6、根据病理文本或ROI图像信息检索出对应的胸部CT图像-文本信息,实现跨膜态检索。
2.根据权利要求1所述的基于生成式对抗网络的医学信息跨模态哈希编码学习方法,其特征在于:所述Step1的具体步骤如下:
Step1.1、首先进行数据预处理;对于图像数据集,为了避免直接从512*512的尺寸压缩到224*224造成像素的损失,采用对原始CT图像进行切割的方法;根据切片上肺结节的直径不同,切割出尺寸为R={16*16,32*32,64*64,128*128}的感兴趣区域RegionOfInterest,ROI图像块;对于文本数据集,放射科医生对肺结节的病理信息描述通常采用固定的词语,这些词语分别对应了不同的病理级别;由于这样的词语不需要考虑词与词之间的先后顺序,所以不需要进行文本预处理,直接使用词袋模型提取文本特征;
Step1.2、胸部CT图像特征提取;采用基于卷积神经网络多层面二阶特征融合模型CMSFF提取图像特征;对3个层面的ROI图像块分别进行特征提取,将同一结节的不同层面提取到的特征信息进行融合,以弥补单个层面的切片特征信息表达不完整的不足,最终提高局部肺结节的特征表达能力;模型的输入是同一个肺结节的连续三张不同ROI图像块,输出是肺结节的特征向量;
Step1.3、肺结节病理信息文本特征提取;将肺结节的病理描述特征词语yj用词袋模型表示其向量fj,该词袋向量输入一个由两层全连接层构成的多层感知机网络中,两层全连接层fc1和fc2,其中fc1具有4096层,fc2的层数为所要生成的哈希编码的长度h;将文本特征提取网络作为文本特征生成器,输出文本的特征向量。
3.根据权利要求1所述的基于生成式对抗网络的医学信息跨模态哈希编码学习方法,其特征在于:所述Step2的具体步骤如下:
Step2.1、相似矩阵在跨模态哈希检索中...
【专利技术属性】
技术研发人员:黄青松,贺周雨,赵晓乐,刘利军,冯旭鹏,
申请(专利权)人:昆明理工大学,
类型:发明
国别省市:云南;53
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。