【技术实现步骤摘要】
一种基于卷积神经网络的消化内镜视频场景分类方法
本专利技术属于消化内镜视频的图像处理
,尤其涉及一种基于卷积神经网络的消化内镜视频场景分类方法。
技术介绍
近年来,随着深度学习算法的出现,人工智能(AI)领域在研究呈现出革命性的发展和进步,在海量数据的支撑下,基于深度学习算法AI系统在越来越多的应用领域开始具有和人类专家相近的识别判断能力,在某些特殊领域甚至超过人类;特别是在医疗领域,深度学习算法也显现出巨大的潜力,例如在应对皮肤病变和糖尿病视网膜病变图像的诊断方面,基于深度学习的AI系统在闭包测试过程中已经具备与医学专家相同甚至更佳的识别能力。基于深度学习的计算机辅助诊断(CAD)在消化内镜领域也得到越来越多的关注,包括结肠镜、上消化道内镜等消化内镜影像领域中卷积神经网络(CNN)具备很高的应用价值;结肠镜和上消化道内镜CAD是AI在消化内镜领域最受关注和深入的研究方向,目前研究和应用主要集中在息肉的自动检出,盲区检测,早癌识别,质量控制的实时鉴别。目前大量临床前沿探索研究表明,基于CNN的CAD系统 ...
【技术保护点】
1.一种基于卷积神经网络的消化内镜视频场景分类方法,其特征在于,包括如下步骤:/n(1):通过消化内镜设备获取实时的场景图像;/n(2):将获取的场景图像用CNN场景分类器进行初步场景分类;/n(3):将CNN场景分类器的初步分类结果纳入到K滑窗时序信号队列中,其中,K为时序信号队列的长度;/n(4):统计K滑窗队列中各种状态的比例;/n(5):根据当前场景和K滑窗队列状态比例,确定场景状态。/n
【技术特征摘要】
1.一种基于卷积神经网络的消化内镜视频场景分类方法,其特征在于,包括如下步骤:
(1):通过消化内镜设备获取实时的场景图像;
(2):将获取的场景图像用CNN场景分类器进行初步场景分类;
(3):将CNN场景分类器的初步分类结果纳入到K滑窗时序信号队列中,其中,K为时序信号队列的长度;
(4):统计K滑窗队列中各种状态的比例;
(5):根据当前场景和K滑窗队列状态比例,确定场景状态。
2.根据权利要求1所述的基于卷积神经网络的消化内镜视频场景分类方法,其特征在于,所述CNN场景分类器的分类过程如下:
将消化内镜视频中的单帧内镜图像作为输入;
通过通用卷积神经网络后形成维度为4096的特征向量;
该特征向量经过四分类线性分类器之后,最终获得单帧内镜图像分类结果。
3.根据权利要求2所述的基于卷积神经网络的消化内镜视频场景分类方法,其特征在于,所述通用卷积神经网络包括但不限于:
Alexnet、VGGnet、Shufflenet、Densenet、Squeezenet。
4.根据权利要求2所述的基于卷积神经网络的消化内镜视频场景分类方法,其特征在于:所述通用卷积神经网络是由ImageNet进行预训练,再由内镜四分类场景训练图像数据集训练所得;
其中,内镜四分类场景包括体外场景、结肠镜标识场景、上消化道内镜标识场景和体内场景。
5.根据权利要求2所述的基于卷积神经网络的消化内镜视频场景分类方法,其特征在于,所...
【专利技术属性】
技术研发人员:曹鱼,陈齐磊,刘本渊,
申请(专利权)人:苏州慧维智能医疗科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。