【技术实现步骤摘要】
一种基于自建数据对的胃镜图像去模糊算法
[0001]本专利技术属于医疗图像处理
,具体涉及胃镜图像去模糊算法。
技术介绍
[0002]随着计算机科学的发展,智能医疗成为了一项提高现代医疗水平的重大科技革新。作为人工智能与新型医疗的结合点,它在各个方面所具有的优势正在得到越来越多的认可与关注。
[0003]在内镜图像分析的应用场景中,医生在进行胃镜检查的时候,往往容易因为镜头推拉、移动过快,遇见胃镜图像质量模糊的情况。当回溯、查看、评估病情的时候,如果此时关键部位的胃镜图像是模糊的,为了诊断准确,就需要重新对病人进行胃镜检查。这不仅仅挤占了宝贵的医疗资源,而且还为病人带来额外的痛苦。因此,对模糊的胃镜图片进行去模糊增强,对医生诊断的可靠性、医疗资源的节省以及病人的关怀都十分关键。
技术实现思路
[0004]本专利技术的目的在于提供一种操作方便、去模糊效果好的胃镜图像去模糊的算法。
[0005]本专利技术将医生对于胃镜图像去模糊与深度学习相结合,提出基于深度学习的胃镜图像去模糊算法。本专利技 ...
【技术保护点】
【技术特征摘要】
1.一种基于自建数据对的胃镜图像去模糊算法,是食管内镜视频帧序列质量分类算法,利用医生对于清晰模糊判断经验,指导去模糊网络的优化,而且利用插帧与时间域融合的方法,构建胃镜清晰
‑
模糊图像对加以训练;具体步骤如下:(1)数据收集与清洗:收集一定量的胃镜视频,对其中的数据进行清洗,即剔除视频中含有气泡、没有内容、失去焦距、内容混乱的胃镜无效视频帧;(2)标注与训练D
‑
Net:由专业医生对经过清洗的、所有有效视频帧进行分类,医生认为清晰的图片标记为0,医生认为不清晰的图片标记为1;然后,使用分类网络ResNet
‑
34,利用标注的数据,训练该分类网络,对单张输入胃镜视频帧是否清晰,进行分类,该网络记作D
‑
Net,符号记作ψ;(3)模糊
‑
清晰图像对的生成:从所有的有效视频帧内,抽取医生标注为清晰的视频帧,然后保留时间域连续帧超过阈值THRESH帧的片段,获得总数为P个全清晰视频片段;设第i段视频记作其中1≤i≤P,M
i
为第i个视频片段总帧数;使用DAIN算法,在原来两帧之间插9帧,即10倍插帧,此时生成的第i段插帧后视频表示为:其中,F
j
=F
′
j
×
10
为原始清晰帧;第i段视频中选择清晰图片集合为:即对原视频V
i
首尾3帧抛弃;其对应的模糊图图片集合记作:其生成方式是,对于原视频V
i
中某帧F
j+3
,在其插帧后视频V
i
′
中对应的时刻上,对空间域相邻的视频帧相加取平均,其计算式如下:其中,k为哑变量,L为空间域的长度;同时,求得S
i,j
帧所对应的运动先验信息GT_Diff
i,j
:GT_Diff
i,j
=S
i,j
‑
S
i,j
‑1,即视频的第j帧与第j
‑
1帧直接相减;最终,获得训练数据三元组为:即每个训练样本包括模糊胃镜图、清晰胃镜图及其运动先验信息;(4)构建卷积神经网络:采用改进的SimpleNet算法模块,即对其中的残差模块、感受野多样性模块做出改进,得到轻量残差块与简单多感受模块,以获得更好的速度提升;并且,在第二个降采样层之后独立出两层卷积层预测的三通道运动先验信息PRED_Dif,然后将其送入第一个上采样层级联;该胃镜去模糊卷积神经网络简记作DTM
‑
Net;(5)训练:利...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。