一种基于电子内窥镜的自动去除无效视频剪辑方法技术

技术编号：21778080 阅读：18 留言：0更新日期：2019-08-03 23:28

本发明专利技术属于人工智能和计算机视觉技术领域，具体涉及一种基于内窥镜的自动去除无效视频剪辑方法。本发明专利技术将待剪辑内窥镜手术视频进行拆帧，在视频帧中提取关键帧；将所述关键帧输入本发明专利技术改进的密集连接卷积神经网络中；通过所述网络对所述手术视频关键帧进行预判，再通过自修复模块，进一步获得精准结果；根据上述结果和原视频时间点的对比，剪辑并合成视频，得到医生期待的有效内窥镜手术视频段。与其他剪辑方法相比，密集连接卷积神经网络加入自修复模块在准确度上进一步提升，将达到60％分类变化的视频帧进行自修复，更精确手术视频的剪辑时间，使得有效视频与无效视频分割更精确。

An Automatic Removal of Invalid Video Clipping Method Based on Electronic Endoscope

全部详细技术资料下载

【技术实现步骤摘要】
一种基于电子内窥镜的自动去除无效视频剪辑方法
本专利技术属于人工智能和计算机视觉
，涉及一种基于内窥镜的自动去除无效视频剪辑方法。
技术介绍
现今内窥镜的功能性微创手术技术已经得到医生和患者的广泛接受，内窥镜下录制的手术视频也作为医生教学、研讨的重要素材，但是目前电子内窥镜手术视频生成量大，导致存储不完整，而且存在很多冗余信息，比如清洗镜头，镜头闲置等情况，导致医生重新查看手术视频时关键信息获取不连贯，此外，现有的医学视频剪辑采用人工手动方式进行剪辑，对视频进行预览，手动截取内窥镜拍摄的有效视频片段，将每段视频片段进行拼接，以得到医生期望的内窥镜手术视频；这种方法剪辑过程复杂，剪辑效率低，耗时长，对医生在手术后的研讨以及教学造成影响。为了解决目前技术存在的问题，现有视频剪辑技术还提供了以下方法：1、人工对手术视频进行预览，手动插入开始时间点与结束时间点，将手术视频进行拆分成若干小的视频段，将小视频段按照时间顺序进行输入，输出合成视频。该方法存在的问题是：耗费时间、精力，靠人工进行手术视频预览，剪辑顺序依靠人工进行判断，剪辑精度较差；2、利用颜色直方图、背景差分法等传统方法对视频进行视频帧的提取，合成视频帧，生成视频预览。该方法存在的问题是：由于是通过颜色直方图等传统方法进行视频帧抽取，因此不适用于所有类型视频，并且利用该方法生成视频的预览，信息不连贯；3、将待剪辑视频全部拆分为视频帧；将视频帧输入到预先训练的卷积神经网络进行训练；用户手动输入剪辑对象，根据用户输入的剪辑对象对视频进行检索，对存在剪辑对象的图片进行合成，生成剪辑视频。这是目前被普遍使用...

【技术保护点】
1.一种基于内窥镜的自动去除无效视频智能剪辑方法，其特征在于，包括以下步骤：步骤1：将收集到的手术视频进行拆分，提取关键帧，经过提取后得到图像序列{Ii，i＝1,2,3,…,n}；步骤2：构建训练集和测试集；将收集到的内窥镜手术视频的关键帧随机分组生成训练集和测试集，并进行分类，分别得到1(有效)、0(无效)两种类别关键帧；步骤3：构建密集连接卷积神经网络；步骤3.1：对输入密集连接卷积神经网络的关键帧图片序列I1进行预处理；步骤3.2：网络结构搭建：密集连接卷积神经网络包括输入层，两个Dense Block层，两个过渡层(Transition Layer)和输出层；输入层由卷积层和Pre‑Activation Batch Norm(BN层)组成，并由BN层对每次训练输入到网络中的数据做标准化处理；输出层由全局平均池化层和全连接层构成，最后附加一个Softmax分类器，计算像素点的均值，组成向量并映射得到图像分类的预测值；步骤4：将训练集输入已构建的网络模型中训练、生成网络模型；调整网络参数进行训练，设置earlystoper，当网络训练达到预设程度时停止训练，得到网络模型并保存；步骤...

【技术特征摘要】
1.一种基于内窥镜的自动去除无效视频智能剪辑方法，其特征在于，包括以下步骤：步骤1：将收集到的手术视频进行拆分，提取关键帧，经过提取后得到图像序列{Ii，i＝1,2,3,…,n}；步骤2：构建训练集和测试集；将收集到的内窥镜手术视频的关键帧随机分组生成训练集和测试集，并进行分类，分别得到1(有效)、0(无效)两种类别关键帧；步骤3：构建密集连接卷积神经网络；步骤3.1：对输入密集连接卷积神经网络的关键帧图片序列I1进行预处理；步骤3.2：网络结构搭建：密集连接卷积神经网络包括输入层，两个DenseBlock层，两个过渡层(TransitionLayer)和输出层；输入层由卷积层和Pre-ActivationBatchNorm(BN层)组成，并由BN层对每次训练输入到网络中的数据做标准化处理；输出层由全局平均池化层和全连接层构成，最后附加一个Softmax分类器，计算像素点的均值，组成向量并映射得到图像分类的预测值；步骤4：将训练集输入已构建的网络模型中训练、生成网络模型；调整网络参数进行训练，设置earlystoper，当网络训练达到预设程度时停止训练，得到网络模型并保存；步骤5：将测试集输入已生成模型后得到预判结果；步骤5.1：对输入的测试集图像序列I0进行预处理；步骤5.2：将经过预处理的图像输入现已生成的模型中进行预测，生成预判结果，预判结果分为两类：...

【专利技术属性】
技术研发人员：潘晓英，王红玉，刘妮，赵浩，王昊，许成，
申请(专利权)人：西安邮电大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人