一种基于capsule理论和PLSA路由的医学影像分类方法技术

技术编号：19746345 阅读：17 留言：0更新日期：2018-12-12 04:55

本发明专利技术公开了一种基于capsule理论和PLSA路由的医学影像分类方法，本发明专利技术通过引入PLSA概率模型，设计新的capsule路由方法，相比一致性路由，该方法采用更合理的软聚类方法度量capsule之间的一致性，在此基础上设计一种融合capsule理论和PLSA路由的医学影像分类模型，更好地处理医学影像分类任务。该模型框架由基于capsule的卷积神经网络和图像重构全连接网络构成。基于capsule的卷积神经网络采用PLSA路由传递capsule之间的信息，不仅能够自动学习医学影像特征，还能更好地发现特征之间的大小、位置与方向等信息，提升分类准确率。图像重构全连接网络使用类别capsule恢复原始医学影像，旨在提高基于capsule的卷积神经网络的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于capsule理论和PLSA路由的医学影像分类方法
本专利技术涉及医学影像分析领域，更具体地，涉及一种基于capsule理论和PLSA路由的医学影像分类方法。
技术介绍
医学影像是医疗数据的重要组成部分，已成为临床医生诊断的重要依据。临床医生需要对医学影像进行各种定量分析以完成诊断。医生查看医学影像既耗时又依赖个人经验，分析效率和准确率均被限制。利用计算机技术辅助医学影像分析可有效缓解临床医生的工作压力，同时为患者提供更好的医疗服务。医学影像分析包括影像分类、目标检测、图像分割和检索等，分类任务最为基础，能为疾病筛查提供有价值的判断依据。计算机技术在医学影像分类任务上得到广泛应用。早期方法主要是运用计算机视觉技术，提取图像的纹理特征和灰度特征等，作为传统机器学习模型的输入，完成分类任务。由于特征选择依赖人工经验，无法自动发现抽象语义特征信息，且模型需要设置过多的阈值以控制训练过程，导致模型难以泛化，实际应用价值不高。相比传统的机器学习，深度学习是一种完备的端对端模型，无需人工参与，可自动学习语义特征。深度学习，特别是卷积神经网络(ConvolutionalNeuralNetworks,CNN)，已在图像分类任务中取得巨大成功。深度学习特别适合处理医学影像大数据场景。近年来，基于深度学习的医学影像分类成为研究。以CNN为代表的医学影像分类方法首先选择感兴趣区域，然后进行对图像进行预处理，作为网络输入，再经过一系列卷积、池化和激活操作后，自动学习高维特征，其中浅层网络将学习检测诸如边缘和颜色渐变之类的简单特征，而深层网络元则将简单特征组合成复杂的高维特...

【技术保护点】
1.一种基于capsule理论和PLSA路由的医学影像分类方法，其特征在于，包括以下步骤：S1：输入原始的医学影像；S2：构建基于capsule的卷积神经网络并进行分类预测，其中网络capsule层之间的路由利用概率潜在语义分析模型PLSA进行信息传递；S3：构建图像重构全连接网络；S4：输出生成的医学影像。

【技术特征摘要】
1.一种基于capsule理论和PLSA路由的医学影像分类方法，其特征在于，包括以下步骤：S1：输入原始的医学影像；S2：构建基于capsule的卷积神经网络并进行分类预测，其中网络capsule层之间的路由利用概率潜在语义分析模型PLSA进行信息传递；S3：构建图像重构全连接网络；S4：输出生成的医学影像。2.根据权利要求1所述的一种基于capsule理论和PLSA路由的医学影像分类方法，其特征在于，步骤S2所述的基于capsule的卷积神经网络包括第一层卷积层ReLUConv1、第二层PrimaryCaps层和第三层ClassCaps层；其中第一层是卷积层ReLUConv1，为普通的卷积层，输入图像尺寸为4×28×28，即合并原始图像的3个RGB通道信息，以及视盘和视杯分割图的单通道标注信息，该层共有256个9×9的卷积核，步长取1，激活函数为ReLU，实现局部特征提取，融合原始图像信息，以及视盘和视杯标注信息，并作为下一层的输入；第二层PrimaryCaps层，为capsule层；输入图像尺寸为256×20×20，该层capsule向量维度设为8，共有32个9×9的卷积核，步长取2，激活函数为ReLU，输出为32个通道，每个通道数据尺寸为6×6；第三层是ClassCaps层，为capsule层；输入数据为256×6×6×8，该层capsule向量维度设为16，输出为2个类别capsule，分别对应青光眼识别结果，即正常和青光眼。3.根据权利要求1-2所述的一种基于capsule理论和PLSA路由的医学影像分类方法，其特征在于，步骤S2中所述概率潜在语义分析模型PLSA联合分布P(di,wj)如下：P(di,wj)＝P(di)P(wj|di),其中d代表文档，z代表隐含主题，w为词项，M是文档数量，N是文档d的词项数量，P(di)是文档di出现概率，P(zk|di)表示文档di属于主题zk的概率，P(wj|zk)为给定主题zk出现词项wj的概率；PrimaryCaps层的capsule对应PLSA中的文档，而ClassCaps层的capsule即是隐含主题，capsule向量的每个维度为词项出现的概率；本模型共有NK+MK个未知参数，考虑EM算法求解，在E步骤，随机给定参数条件P(...

【专利技术属性】
技术研发人员：刘少鹏，贾西平，洪佳明，林智勇，马震远，丘永发，关立南，廖秀秀，高维奇，
申请(专利权)人：广东技术师范学院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人