当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于模糊逻辑的医学图像深度分割方法技术

技术编号:37709704 阅读:73 留言:0更新日期:2023-06-02 00:01
本发明专利技术提供了一种基于模糊逻辑的医学图像深度分割方法,属于医学图像智能处理技术领域。解决了医学图像数据集数据不足导致医学图像分割准确率低的问题。其技术方案为:包括如下步骤:S1、对眼底医学图像数据集进行扩充,将彩色眼底图像以中心点随机旋转生成新的图片;S2、使用CNN和Transformer模型分别提取眼底图像特征;S3、设计模糊融合模块将两个分支提取的特征进行结合;S4、构造模糊注意力融合模块逐步上采样与融合不同尺度特征图;S5、搭建基于模糊逻辑的深度学习网络FTransCNN。本发明专利技术有益效果为:使用模糊逻辑将两种深度学习模型特征进行融合,更自然、合理的表示眼底血管区域边缘的不准确信息。域边缘的不准确信息。域边缘的不准确信息。

【技术实现步骤摘要】
一种基于模糊逻辑的医学图像深度分割方法


[0001]本专利技术涉及医学图像智能处理
,尤其涉及基于模糊逻辑的医学图像深度分割方法。

技术介绍

[0002]眼底图像中保存着和眼科致盲疾病有重要联系的血管信息,眼底血管的健康状况对于医生及早诊断糖尿病心脑血管疾病及多种眼科疾病具有重要意义。但是由于眼底血管自身结构复杂,同时易受采集环境中光照因素的影响,使得临床上手动分割眼底血管不仅工作量巨大而且对医疗人员的经验和技能要求颇高。另外,不同的医疗人员对同一幅眼底图像的分割结果可能存在差异,手动分割已不能满足临床的需要。
[0003]随着计算机技术的不断发展,利用人工智能技术对眼底血管图像进行自动分割,以对眼科疾病进行辅助诊断和决策,成为了国内外学者关注的研究热点。深度学习凭借其在识别应用中超高的预测准确率,在图像处理领域获得了极大关注,深度学习中的卷积神经网络和Transformer模型在图像处理方面有着独特的优越性。经典的卷积神经网络U

Net,能够融合图像的低层和高层信息,在很少的图像上进行端到端的训练,用于解决具本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于模糊逻辑的医学图像深度分割方法,其特征在于,包括以下步骤:S1:对眼底医学图像数据集进行扩充,数据集中包含N对彩色原图和眼底血管分割图,将每张图片以中心点顺时针旋转,每10
°
保存新的图片,扩充到36*N对原图和对应分割掩码;S2:使用CNN和Transformer模型分别提取眼底图像特征,CNN模型逐渐增加感受野并将特征从局部编码到全局,Transformer模型从全局自注意力开始,最后恢复局部细节,利用不同深度学习模型,将两个模型在三个不同尺度的特征图保存下来,进行后续融合;S3:设计模糊融合模块将两个分支提取的相同尺度特征进行结合,模糊融合模块中结合注意力机制和模糊测度与模糊积分,对CNN特征和Transformer特征分别使用空间注意力和通道注意力来增强特征表示,对最低尺度特征计算模糊测度并使用Choquet模糊积分消除特征中的异质性和不确定性;S4:构造模糊注意力融合模块逐步上采样与融合不同尺度特征图,处理分割边界的不确定性,将融合的特征图恢复到输入大小,生成最终分割图像;S5:搭建基于模糊逻辑的深度学习网络FTransCNN,用扩充后的图像数据对模型进行训练,准确分割出眼底血管以及末梢图像。2.根据权利要求1所述的基于模糊逻辑的医学图像深度分割方法,其特征在于,所述步骤S2的具体步骤如下:步骤S2.1:针对CNN模型,将大小为x∈R
H
×
W
×
C
的图像输入到由ResNet50组成的CNN特征提取网络中,其中H、W、C分别表示输入图像的高度、宽度和通道数,实现图像数据从高分辨率图像到低分辨率图像的转化,构建有五个模块的ResNet模型,每个模块将特征图下采样两倍,将第4个块输出第3个块输出和第2个块输出的特征图保存下来,与Transformer模型相应大小的特征图进行后续融合;步骤S2.2:针对Transformer模型,首先将图像划分为块,其中,S设置为16,其次将这些Patch块展平并拼接,用全连接层对拼接的向量降维,接着对输入图像特征加入位置编码得到输入特征x,然后将预处理特征x输入到Transformer的编码器进行特征提取,最后将提取的特征进行上采样,得到与CNN模型提取特征尺度相同的特征,Transformer特征提取过程如下:head
i
=Attention(X
i
W
iQ
,X
i
W
iK
,X
i
W
iV
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)MSA(Q,K,V)=Concat(head1,

,head
i
)W0ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)MLP(X)=max(0,XW1+b1)W2+b2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,Q,K,V为将输入X经过线性变换后得到的矩阵,Q表示要查询的信息,K表示被查询的向量,V表示查询得到的值,d
k
表示查询矩阵或者键值矩阵的维度,softmax是激活函数,W
iQ
、W
iK
、W
iV
分别表示第i个自注意力的线性变换矩阵,经过学习得到,Concat表示拼接操作,W0表示线性变换矩阵,max为求最大值操作,W1、W2为权重,b1、b2是常数。3.根据权利要求1所述的基于模糊逻辑的医学图像深度分割方法,其特征在于,所述步
骤S3的具体步骤如下:步骤S3.1:对Transformer模型保存的特征使用通道注意力,首先利用全局平均池化操作对每个特征图进行压缩,使得多个特征图最终成为一维实数序列,计算过程如下所示:其中,squeeze代表压缩操作,t
i
(x,y)表示步骤S2中保存的Transformer模型第i个尺度的特征,H、W为特征的尺度大小,然后使用扩张操作来利用压缩操作中聚合的信息,使用了一个带有sigmoid激活的门控机制,计算方式如下:s=σ(W2·
ReLU(W1·
z))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,σ表示sigmoid激活函数,ReLU为激活函数,步骤S3.2:针对CNN模型提取的特征,使用空间注意力作为空间滤波器,增强局部细节,抑制无关区域,第一步使用平均池化和最大池化来生成通道注意力图:m=σ(MLP(AvgPool(r
i
)+MaxPool(r
i
)))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)其中,σ表示sigmoid激活函数,r
i
表示步...

【专利技术属性】
技术研发人员:丁卫平王海鹏刘传升陈悦鹏尹涛耿宇鞠恒荣黄嘉爽高自强薛皓文
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1