一种基于扫频光学相干层析成像的扫频OCT人眼图像分割方法技术

技术编号:27938999 阅读:55 留言:0更新日期:2021-04-02 14:20
本发明专利技术公开了一种基于扫频光学相干层析成像的扫频OCT人眼图像分割方法,属于医学图像分割领域。首先,在Mask R‑CNN网络采用调制可变形卷积替代规则卷积产生非规则感受野,提升网络对人眼OCT图像目标变化的适应能力;其次,结合关系模型(relation model,RM)模块,学习人眼OCT图像结构间的位置关系特征图,利用位置关系特征图增强网络特征;然后在此基础上构建multi‑stage mask结构,通过mask多步迭代修正人眼结构的分割误差。本发明专利技术考虑了人眼OCT图像特点,能够有效利用人眼结构特征和迭代分割网络等结构提高人眼OCT图像分割准确度。

【技术实现步骤摘要】
一种基于扫频光学相干层析成像的扫频OCT人眼图像分割方法
本专利技术涉及一种扫频OCT人眼图像分割方法,属于医学图像分割领域,尤其涉及一种基于RMMulti-stageMaskR-CNN网络的扫频OCT人眼图像分割方法。
技术介绍
基于扫频光学相干层析成像(opticalcoherencetomography,OCT)技术的人眼图像具有高分辨率、非侵入和实时成像的优点,已广泛应用于眼科视网膜和眼前节疾病诊断。人眼OCT图像结构与眼科疾病表征、人眼相关参数测量有着密切的联系,因此,对人眼OCT图像结构的准确分割,能够提高眼科疾病诊断、角膜曲率和眼轴长等人眼参数测量的准确度。基于机器学习的OCT图像分割方法将图像分割问题转化为分类问题,实现不同类别像素的分割,对同一类目标的形变和不同目标间的形状差异都具有较强的适应能力。然而人工特征对目标信息的表达能力有限,无法准确分割目标和识别分辨外界干扰,制约了OCT图像分割的准确度。近年来,深度学习利用深层卷积神经网络(ConvolutionalNeuralNetworks,CNN)自主提取和本文档来自技高网...

【技术保护点】
1.一种基于扫频光学相干层析成像的扫频OCT人眼图像分割方法,其特征在于:该方法包括以下步骤:/n步骤一:通过图像翻转的数据增强方式对扫频OCT人眼图像训练样本进行预处理并构建训练数据集;/n步骤二:构建RM Multi-stage MaskR-CNN目标分割网络模型,在主干网络中采用调制可变形卷积,产生非规则的感受野,提高感受野与人眼OCT图像非规则结构的拟合度;在特征图提取阶段结合关系模型RM,充分学习角膜、晶状体和视网膜固定的位置关系;利用迭代修正误差的思想,在mask分割阶段构建Multi-stage mask,将前一迭代阶段的mask特征融合至下一阶段,以提高mask特征的提取能力,...

【技术特征摘要】
1.一种基于扫频光学相干层析成像的扫频OCT人眼图像分割方法,其特征在于:该方法包括以下步骤:
步骤一:通过图像翻转的数据增强方式对扫频OCT人眼图像训练样本进行预处理并构建训练数据集;
步骤二:构建RMMulti-stageMaskR-CNN目标分割网络模型,在主干网络中采用调制可变形卷积,产生非规则的感受野,提高感受野与人眼OCT图像非规则结构的拟合度;在特征图提取阶段结合关系模型RM,充分学习角膜、晶状体和视网膜固定的位置关系;利用迭代修正误差的思想,在mask分割阶段构建Multi-stagemask,将前一迭代阶段的mask特征融合至下一阶段,以提高mask特征的提取能力,修正分割误差;构建基于RMMulti-stageMaskR-CNN网络的扫频OCT人眼图像分割方法,提高人眼OCT图像目标检测及分割准确度;
步骤三:为训练Multi-stageMaskR-CNN网络构建损失函数,网络损失函数为每阶段多任务损失函数以及RPN损失函数的加和,根据步骤一获得的训练数据集,训练步骤二所构建的RMMulti-stageMaskR-CNN目标分割网络模型直至损失函数收敛;
步骤四:输入扫频OCT人眼图像,利用所训练的RMMulti-stageMaskR-CNN目标分割网络模型分割扫频OCT人眼图像中的角膜、晶状体和视网膜,输出图像中每个目标的边界框位置、尺寸、分割结果以及目标类别。


2.根据权利要求1所述的一种基于扫频光学相干层析成像的扫频OCT人眼图像分割方法,其特征在于:步骤二包括如下步骤,
网络结构包括四部分:主干网络、RPN、relationFC以及multi-work分支;网络以ResNet50-FPN作为主干网络提取目标特征,其中ResNet50的stage3至stage5中所有3×3卷积均采用3×3的调制可变形卷积,使得网络能够产生不规则的感受野,提升网络适应人眼OCT图像目标形变的能力,利用FPN融合高维和低维的特征图,增强特征提取能力;调制可变形卷积写为如式所示;



式中,yd为卷积后的输出,x为该点的像素值,p0为采样网格中心点,pi为采样网格点,Δpi为偏置,常为分数,采用双线性插值获得采样值,如式所示,R为正方形采样位置的集合,当卷积核大小为3×3,膨胀率为1时,R={(-1,-1),(-1,0),...,(1,1)},调制权重Δmi∈[0,1],Δmi同样由额外卷积层获得,输入与Δpi相同,但由不同卷积核实现,通道数为N;



式中,p=p0+pi+Δpi,q枚举了特征图上所有整数位置,Gbil(·,·)为二维双线性插值核,可表示为如式所示;
Gbil(q,p)=g(qx,px)·g(qy,py)
式中,g(a,b)=max(0,1-|a-b|);
将主干网络提取的特征图传入RPN产生ROIs,将ROIs传入multi-work分支,multi-work分支包括检测及分割分支,检测分支输出目标类别及回归框坐标,分割分支输出分割目标,每次迭代首先经过RoIAlign对ROIs进行池化和对齐,首级迭代结构采用relationFC结构,在cls和loc共享...

【专利技术属性】
技术研发人员:王建林郭永奇付雪松邱科鹏
申请(专利权)人:北京化工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1