一种基于深度学习的泪河高度检测方法技术

技术编号:26532322 阅读:85 留言:0更新日期:2020-12-01 14:15
本发明专利技术涉及一种基于深度学习的泪河高度检测方法,属于医学影像技术领域。本发明专利技术针对获取的人眼图像,依次经过基于深度卷积网络的分类网络、粗定位网络、快速分割网络、边缘修正模块和泪河高度计算模块进行图像数据处理获得泪河高度。本发明专利技术提供的一种基于深度学习的泪河高度检测方法,相比较传统数字图象处理方法,本方案对光照,噪声,变形,眨眼等情况鲁棒性更强,检测更准。可以替代人工手动测量,降低人力和时间成本,提高了工作效率。

【技术实现步骤摘要】
一种基于深度学习的泪河高度检测方法
本专利技术涉及一种基于深度学习的泪河高度检测方法,属于医学影像

技术介绍
泪河高度是泪液与上下眼睑和结(角)膜形成的平面高度,它能够反映泪腺分泌的量。泪河高度与患者主观感受(眼表疾病评价指数量表)、泪膜破裂时间、泪液分泌试验等具有良好的相关性,是评估干眼的一个可靠指标。常见的泪河高度检测是获取照射在人眼上的泪河图像,然后进行数字图像处理技术分析,检测过程包括应用自适应平滑滤波增强图像,然后提取泪河边缘,并计算上下边缘的高度。但是这种方法容易受其他眼睛组织的干扰,和受到拍摄角度、光源、眨眼等因素影响。另外一种就是对泪河图像纯人工手动测量,这种方法增加人力和时间成本,影响工作效率。
技术实现思路
本专利技术的目的是为解决如何进行泪河高度检测的技术问题。为达到解决上述问题的目的,本专利技术所采取的技术方案是提供一种基于深度学习的泪河高度检测方法,包括以下步骤:步骤1:获取人眼图像;步骤2:基于深度卷积网络的分类网络,对步骤1获取的图像做睁眼闭眼识别;如果识别为睁眼,则认为是有效图像,继续步骤3处理;如果识别为闭眼,则认为是无效图像,跳回到步骤1重新开始;步骤3:基于深度卷积网络的粗定位网络,对步骤2的有效图像进行泪河区域粗定位,并对泪河区域进行图像裁剪;步骤4:基于深度卷积网络的快速分割网络,对步骤3获取泪河区域图像分割出泪河,得到二值化图;步骤5:采用边缘修正模块,对步骤4输出的泪河二值化图进行边缘提取,然后在上边缘和下边缘的每个位置竖直方向10个像素内寻找最大梯度的位置并更新原来的边缘位置;步骤6:采用泪河高度计算模块,对步骤5输出的下边缘每个位置计算径向方向,并在径向方向找到与上边缘的交点,则下边缘位置点到上边缘交点的距离为该位置的泪河高度。优选地,上述步骤2中基于深度卷积网络的分类网络,采用MobileNetV3分类网络对人眼图像进行二分类,识别睁眼闭眼;搭建MobileNetV3分类网络模型进行分类模型训练,骨干网络保持不变,只修改最后的输出全连接层,将输出个数改成2;输入图像做了灰度化处理,并保留了3通道;数据扩增采用了旋转、平移、缩放、灰度拉伸、随机模糊预处理;损失函数采用二分类的交叉熵函数;用MobileNetV3在IMAGENET数据集上的训练权值作为初始权值,然后做微调训练;将数据集分成训练集和验证集,进行迭代训练;最终选取训练集和验证集loss值相差最小的训练权值作为训练结果。优选地,上述步骤3中基于深度卷积网络的粗定位网络,对泪河区域进行回归定位,共2个点,分别是泪河左端和右端;采用以MobileNetV3为骨干网络,回归输出两个点的x,y坐标值,然后根据这两点裁剪出泪河区域图像,水平方向是以这两个点位为起始位置和终止位置,竖直方向以上面的点向上扩30个像素,下面的点向下扩70个像素,最终裁剪成图;搭建MobileNetV3定位网络模型,骨干网络保持不变,只修改最后的输出层,将输出个数改成4;输入图像做了灰度化处理,并保留了3通道;数据扩增采用了平移、缩放、灰度拉伸、随机模糊预处理;回归损失函数采用均值平方差MSE函数;采用MobileNetV3在IMAGENET数据集上的训练权值作为初始权值,然后做微调训练;将数据集分成训练集和验证集,进行迭代训练;最终选取训练集和验证集loss值相差最小的训练权值作为训练结果。优选地,上述步骤4中基于深度卷积网络的快速分割网络,采用DFANet分割网络对泪河区域图像进行分割检测,对每个像素二分类进而输出概率图,大于概率阈值的为泪河,否则认为背景,最终得到二值化分割结果;搭建DFANet分割网络模型,骨干网络保持不变,只修改最后的输出层,将输出通道改成2;输入图像做了灰度化处理,并保留了3通道;数据扩增采用了旋转、平移、缩放、灰度拉伸、随机模糊预处理;损失函数采用二分类的交叉熵函数;采用DFANet在Cityscapes数据集上的训练权值作为初始权值,然后做微调训练;将数据集分成训练集和验证集,进行迭代训练;最终选取训练集和验证集loss值相差最小的训练权值作为训练结果;更优选地,所述DFANet的结构如,输入为所述步骤3的泪河区域图像,对应的输出为分割概率图,通过一系列特征提取通道融合上采样操作,最后通过概率阈值输出二值化图像。优选地,上述步骤5中后处理边缘修正模块,对上述步骤4输出的泪河二值化图进行Canny边缘提取,获取到泪河上下边缘,然后对原彩色图进行灰度化;上边缘和下边缘的每个位置竖直方向10个像素内寻找最大梯度的位置,则用最大梯度位置设为新的泪河边缘。相比现有技术,本专利技术具有如下有益效果:本专利技术提供了基于深度学习的泪河高度检测方法,相比较传统数字图象处理方法,本方案对光照,噪声,变形,眨眼等情况鲁棒性更强,检测更准。替代人工手动测量,降低人力和时间成本,提高了工作效率。附图说明图1是本专利技术步骤1中获取的人眼图像;图2是本专利技术步骤3中对泪河区域进行回归定位,共2个点,分别是泪河左端和右端,图中箭头标识。图3是本专利技术步骤3中根据步骤2回归定位的两点裁剪出的泪河区域图像。图4是本专利技术步骤4中通过采用DFANet分割网络对泪河区域图像进行分割检测得到的分割结果。图5是本专利技术步骤4中通过采用DFANet分割网络对泪河区域图像进行分割检测过程图。图6是本专利技术步骤5中对步骤4输出的泪河二值化图进行Canny边缘提取,获取到泪河上下边缘,然后对原图进行灰度化处理得到的图像。图7是本专利技术步骤5中上边缘和下边缘的每个位置竖直方向10个像素内寻找最大梯度的位置时的图像。图8是显示本专利技术步骤6中得到的径向泪河高度图像。图中箭头标识所示泪河中上下边缘之间的径向线段代表径向泪河高度。具体实施方式为使本专利技术更明显易懂,兹以优选实施例,并配合附图作详细说明如下:本专利技术的一种基于深度学习的泪河高度检测方法,其具体步骤如下:步骤1:获取人眼图像;步骤2:基于深度卷积网络的分类网络,对步骤1获取的图像做睁眼闭眼识别。如果识别为睁眼,则认为是有效图像,继续步骤3处理。如果识别为闭眼,则认为是无效图像,跳回到步骤1重新开始;步骤3:基于深度卷积网络的粗定位网络,对步骤2的有效图像进行泪河区域粗定位,并对泪河区域进行图像裁剪。此步骤用来提高分割网络输入图像的有效区域占比,减少分割网络的输入分辨率,可以让分割网络的样本空间更小,需求的训练样本更少,分割网络学习更充分高效,可达到快速推理目的;步骤4:基于深度卷积网络的快速分割网络,对步骤3获取泪河区域图像分割出泪河,得到二值化图,0属于背景,255属于泪河;步骤5:边缘修正模块,对步骤4输出的泪河二值化图进行边缘提取,然后在上边缘和下边缘的每个位置竖直方向10个像素内寻找最大梯度的位置并更新原来的边缘位置;步骤6:泪河高度计算模块,对步骤5输出的下边缘每个位置计算径向本文档来自技高网...

【技术保护点】
1.一种基于深度学习的泪河高度检测方法,其特征在于:包括以下步骤:/n步骤1:获取人眼图像;/n步骤2:基于深度卷积网络的分类网络,对步骤1获取的图像做睁眼闭眼识别;如果识别为睁眼,则认为是有效图像,继续步骤3处理;如果识别为闭眼,则认为是无效图像,跳回到步骤1重新开始;/n步骤3:基于深度卷积网络的粗定位网络,对步骤2的有效图像进行泪河区域粗定位,并对泪河区域进行图像裁剪;/n步骤4:基于深度卷积网络的快速分割网络,对步骤3获取泪河区域图像分割出泪河,得到二值化图;/n步骤5:采用边缘修正模块,对步骤4输出的泪河二值化图进行边缘提取,然后在上边缘和下边缘的每个位置竖直方向10个像素内寻找最大梯度的位置并更新原来的边缘位置;/n步骤6:采用泪河高度计算模块,对步骤5输出的下边缘每个位置计算径向方向,并在径向方向找到与上边缘的交点,则下边缘位置点到上边缘交点的距离为该位置的泪河高度。/n

【技术特征摘要】
1.一种基于深度学习的泪河高度检测方法,其特征在于:包括以下步骤:
步骤1:获取人眼图像;
步骤2:基于深度卷积网络的分类网络,对步骤1获取的图像做睁眼闭眼识别;如果识别为睁眼,则认为是有效图像,继续步骤3处理;如果识别为闭眼,则认为是无效图像,跳回到步骤1重新开始;
步骤3:基于深度卷积网络的粗定位网络,对步骤2的有效图像进行泪河区域粗定位,并对泪河区域进行图像裁剪;
步骤4:基于深度卷积网络的快速分割网络,对步骤3获取泪河区域图像分割出泪河,得到二值化图;
步骤5:采用边缘修正模块,对步骤4输出的泪河二值化图进行边缘提取,然后在上边缘和下边缘的每个位置竖直方向10个像素内寻找最大梯度的位置并更新原来的边缘位置;
步骤6:采用泪河高度计算模块,对步骤5输出的下边缘每个位置计算径向方向,并在径向方向找到与上边缘的交点,则下边缘位置点到上边缘交点的距离为该位置的泪河高度。


2.如权利要求1所述的一种基于深度学习的泪河高度检测方法,其特征在于:所述步骤2中基于深度卷积网络的分类网络,采用MobileNetV3分类网络对人眼图像进行二分类,识别睁眼闭眼;搭建MobileNetV3分类网络模型进行分类模型训练,骨干网络保持不变,只修改最后的输出全连接层,将输出个数改成2;输入图像做了灰度化处理,并保留了3通道;数据扩增采用了旋转、平移、缩放、灰度拉伸、随机模糊预处理;损失函数采用二分类的交叉熵函数;用MobileNetV3在IMAGENET数据集上的训练权值作为初始权值,然后做微调训练;将数据集分成训练集和验证集,进行迭代训练;最终选取训练集和验证集loss值相差最小的训练权值作为训练结果。


3.如权利要求1所述的一种基于深度学习的泪河高度检测方法,其特征在于:所述步骤3中基于深度卷积网络的粗定位网络,对泪河区域进行回归定位,共2个点,分别是泪河左端和右端;采用以MobileNetV3为骨干网络,回归输出两个点的x,y坐标值,然后根据这两点裁剪出泪河区域图像,水平方向是以这两个点...

【专利技术属性】
技术研发人员:王崇阳陈文光
申请(专利权)人:上海美沃精密仪器股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1