一种基于capsule理论和PLSA路由的医学影像分类方法技术

技术编号:19746345 阅读:17 留言:0更新日期:2018-12-12 04:55
本发明专利技术公开了一种基于capsule理论和PLSA路由的医学影像分类方法,本发明专利技术通过引入PLSA概率模型,设计新的capsule路由方法,相比一致性路由,该方法采用更合理的软聚类方法度量capsule之间的一致性,在此基础上设计一种融合capsule理论和PLSA路由的医学影像分类模型,更好地处理医学影像分类任务。该模型框架由基于capsule的卷积神经网络和图像重构全连接网络构成。基于capsule的卷积神经网络采用PLSA路由传递capsule之间的信息,不仅能够自动学习医学影像特征,还能更好地发现特征之间的大小、位置与方向等信息,提升分类准确率。图像重构全连接网络使用类别capsule恢复原始医学影像,旨在提高基于capsule的卷积神经网络的泛化能力。

【技术实现步骤摘要】
一种基于capsule理论和PLSA路由的医学影像分类方法
本专利技术涉及医学影像分析领域,更具体地,涉及一种基于capsule理论和PLSA路由的医学影像分类方法。
技术介绍
医学影像是医疗数据的重要组成部分,已成为临床医生诊断的重要依据。临床医生需要对医学影像进行各种定量分析以完成诊断。医生查看医学影像既耗时又依赖个人经验,分析效率和准确率均被限制。利用计算机技术辅助医学影像分析可有效缓解临床医生的工作压力,同时为患者提供更好的医疗服务。医学影像分析包括影像分类、目标检测、图像分割和检索等,分类任务最为基础,能为疾病筛查提供有价值的判断依据。计算机技术在医学影像分类任务上得到广泛应用。早期方法主要是运用计算机视觉技术,提取图像的纹理特征和灰度特征等,作为传统机器学习模型的输入,完成分类任务。由于特征选择依赖人工经验,无法自动发现抽象语义特征信息,且模型需要设置过多的阈值以控制训练过程,导致模型难以泛化,实际应用价值不高。相比传统的机器学习,深度学习是一种完备的端对端模型,无需人工参与,可自动学习语义特征。深度学习,特别是卷积神经网络(ConvolutionalNeuralNetworks,CNN),已在图像分类任务中取得巨大成功。深度学习特别适合处理医学影像大数据场景。近年来,基于深度学习的医学影像分类成为研究。以CNN为代表的医学影像分类方法首先选择感兴趣区域,然后进行对图像进行预处理,作为网络输入,再经过一系列卷积、池化和激活操作后,自动学习高维特征,其中浅层网络将学习检测诸如边缘和颜色渐变之类的简单特征,而深层网络元则将简单特征组合成复杂的高维特征,后续的全连接网络对特征进一步组合并输出分类预测。尽管CNN能够自动学习特征,但它无法识别特征之间的空间关系。原因在于,CNN的深层高维特征只是浅层简单特征的加权组合,导致深层特征与浅层特征之间并不存在位姿(平移和旋转)关系。CNN试图采用池化或卷积层来增加深层网络神经元的视野,以检测输入图像较大区域的高维特征,但未能从本质上解决不同网络层特征之间的空间关系。为了更好地建模网络中内部知识表示的分层关系(包括大小、位置和方向等),Hinton提出了capsule理论,并在此基础上设计了CapsNet模型,在公开实验数据集取得了优于CNN的图像分类效果。本质上,capsule为一组神经元,学习辨识一个有限的观察条件和变形范围内隐式定义的视觉实体(可能是整体也可能是部分),并输出实体在有限范围内存在的概率及一组实例参数(包括实体位姿、照明条件和变形信息等)。当capsule激活时,视觉实体存在的概率具有局部不变性,即概率不会改变;而实例参数随观察条件变化,反映实体位姿、照明条件和变形信息等。目前,利用capsule理论处理医学影像分类问题的相关研究几乎没有。另外,CapsNet模型采用一致性路由来更新高层级capsule,即低层级的激活capsule通过矩阵变换对实体做出预测,预测结果为高层级的capsule提供实例参数。当多个预测值达成一致时,一个高层级的capsule就会被激活。一致性路由简单地利用capsule向量之间内积(即余弦相似度)作为低层级capsule的预测结果对高层级capsule的贡献权重,迭代次数设置依赖经验,过多的迭代容易导致过拟合,而过少的迭代会导致欠拟合。综上,如何设计有效的capsule路由方法,在此基础上构建基于capsule理论的医学影像分类网络,进一步提升分类准确率,是目前亟待解决的问题。
技术实现思路
本专利技术的目的是解决上述一个或多个缺陷,提出一种基于capsule理论和PLSA路由的医学影像分类方法。为实现以上专利技术目的,采用的技术方案是:一种基于capsule理论和PLSA路由的医学影像分类方法,包括以下步骤:S1:输入原始的医学影像;S2:构建基于capsule的卷积神经网络并进行分类预测,其中网络capsule层之间的路由利用概率潜在语义分析模型PLSA进行信息传递;S3:构建图像重构全连接网络;S4:输出生成的医学影像。优选的是,步骤S2所述的基于capsule的卷积神经网络包括第一层卷积层ReLUConv1、第二层PrimaryCaps层和第三层ClassCaps层;其中第一层是卷积层ReLUConv1,为普通的卷积层,输入图像尺寸为4×28×28,即合并原始图像的3个RGB通道信息,以及视盘和视杯分割图的单通道标注信息,该层共有256个9×9的卷积核,步长取1,激活函数为ReLU,实现局部特征提取,融合原始图像信息,以及视盘和视杯标注信息,并作为下一层的输入;第二层PrimaryCaps层,为capsule层;输入图像尺寸为256×20×20,该层capsule向量维度设为8,共有32个9×9的卷积核,步长取2,激活函数为ReLU,输出为32个通道,每个通道数据尺寸为6×6;第三层是ClassCaps层,为capsule层;输入数据为256×6×6×8,该层capsule向量维度设为16,输出为2个类别capsule,分别对应青光眼识别结果,即正常和青光眼。优选的是,步骤S2中所述概率潜在语义分析模型PLSA联合分布P(di,wj)如下:P(di,wj)=P(di)P(wj|di),其中d代表文档,z代表隐含主题,w为词项,M是文档数量,N是文档d的词项数量,P(di)是文档di出现概率,P(zk|di)表示文档di属于主题zk的概率,P(wj|zk)为给定主题zk出现词项wj的概率;PrimaryCaps层的capsule对应PLSA中的文档,而ClassCaps层的capsule即是隐含主题,capsule向量的每个维度为词项出现的概率;本模型共有NK+MK个未知参数,考虑EM算法求解,在E步骤,随机给定参数条件P(zk|di)和P(wj|zk),计算隐含变量的后验概率:在M步骤中,利用E步骤得到的隐含变量的后验概率,最大化对数似然函数的期望,更新参数估计:其中,n(di,wj)为文档di出现词项wj的频率,通过不断迭代,直到收敛,得到capsule之间的路由权重P(zk|di)。优选的是,所述基于capsule的卷积神经网络采用后向传播技术,通过参数更新使得损失函数L最小化;其中整个网络的损失函数L:L=αLc+βLrLc为边际损失函数,利用向量的长度来表示capsule实体存在的概率;Lr为重构损失;α和β分别表示边际损失和重构损失的权重;其中Lc=Tc·max(0,m+-||Vc||)2+λ·(1-Tc)·max(0,||Vc||-m-)2;Vc是青光眼图像类别c的capsule向量,||Vc||表示该向量的长度,Tc=1当且仅当青光眼图像类别c存在,m+=0.9,m-=0.1,λ表示已存在类别的权重衰减系数;Lr=‖x-x′‖2;x为原始图像(包括视盘和视杯分割图的标注信息),x′为重构图像;‖x-x′‖2表示两幅图像之间的差距,具体计算方法如下:首先将两幅图像相同位置的像素点对求灰度值的差,再对差值取平方,最后求和得到结果。优选的是,步骤S3所述的图像重构全连接网络使用类别capsule恢复原始图像;其中第一层为ClassCaps,Representationofthereconstr本文档来自技高网
...

【技术保护点】
1.一种基于capsule理论和PLSA路由的医学影像分类方法,其特征在于,包括以下步骤:S1:输入原始的医学影像;S2:构建基于capsule的卷积神经网络并进行分类预测,其中网络capsule层之间的路由利用概率潜在语义分析模型PLSA进行信息传递;S3:构建图像重构全连接网络;S4:输出生成的医学影像。

【技术特征摘要】
1.一种基于capsule理论和PLSA路由的医学影像分类方法,其特征在于,包括以下步骤:S1:输入原始的医学影像;S2:构建基于capsule的卷积神经网络并进行分类预测,其中网络capsule层之间的路由利用概率潜在语义分析模型PLSA进行信息传递;S3:构建图像重构全连接网络;S4:输出生成的医学影像。2.根据权利要求1所述的一种基于capsule理论和PLSA路由的医学影像分类方法,其特征在于,步骤S2所述的基于capsule的卷积神经网络包括第一层卷积层ReLUConv1、第二层PrimaryCaps层和第三层ClassCaps层;其中第一层是卷积层ReLUConv1,为普通的卷积层,输入图像尺寸为4×28×28,即合并原始图像的3个RGB通道信息,以及视盘和视杯分割图的单通道标注信息,该层共有256个9×9的卷积核,步长取1,激活函数为ReLU,实现局部特征提取,融合原始图像信息,以及视盘和视杯标注信息,并作为下一层的输入;第二层PrimaryCaps层,为capsule层;输入图像尺寸为256×20×20,该层capsule向量维度设为8,共有32个9×9的卷积核,步长取2,激活函数为ReLU,输出为32个通道,每个通道数据尺寸为6×6;第三层是ClassCaps层,为capsule层;输入数据为256×6×6×8,该层capsule向量维度设为16,输出为2个类别capsule,分别对应青光眼识别结果,即正常和青光眼。3.根据权利要求1-2所述的一种基于capsule理论和PLSA路由的医学影像分类方法,其特征在于,步骤S2中所述概率潜在语义分析模型PLSA联合分布P(di,wj)如下:P(di,wj)=P(di)P(wj|di),其中d代表文档,z代表隐含主题,w为词项,M是文档数量,N是文档d的词项数量,P(di)是文档di出现概率,P(zk|di)表示文档di属于主题zk的概率,P(wj|zk)为给定主题zk出现词项wj的概率;PrimaryCaps层的capsule对应PLSA中的文档,而ClassCaps层的capsule即是隐含主题,capsule向量的每个维度为词项出现的概率;本模型共有NK+MK个未知参数,考虑EM算法求解,在E步骤,随机给定参数条件P(...

【专利技术属性】
技术研发人员:刘少鹏贾西平洪佳明林智勇马震远丘永发关立南廖秀秀高维奇
申请(专利权)人:广东技术师范学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1