一种基于卷积神经网络的视频实例分割方法及设备技术

技术编号：23401478 阅读：54 留言：0更新日期：2020-02-22 13:36

本申请的目的是提供一种基于卷积神经网络的视频实例分割方法及设备，本申请通过获取视频序列并确定待检测目标对象；通过跟踪器对视频序列进行目标对象的跟踪，得到视频序列中的目标对象的跟踪结果；判断跟踪结果是否大于跟踪阈值，若是，则将跟踪结果确定为目标对象的分类结果，若否，则对视频序列重新进行分类检测，以得到目标对象的重分类结果，通过对视频序列中的目标对象进行跟踪得到跟踪结果，并对跟踪结果进行分类结果准确度判定，若不符合准确度要求则对视频序列重新进行分类检测，以得到更为精确的视频序列的目标对象的分类结果，实现了对整个视频序列的目标对象的分类，提高了视频实例分割处理的性能和视频分割的准确度。

A method and equipment of video instance segmentation based on convolutional neural network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的视频实例分割方法及设备
本申请涉及计算机领域，尤其涉及一种基于卷积神经网络的视频实例分割方法及设备。
技术介绍
现有技术中，目前大多数的检测算法主要适用于图像场景，而现实中存在丰富的视频输入场景。对于这种场景，直接将图像检测算法迁移过来会带来较大的精度损失。一般来说，将图像检测算法直接应用于视频场景中将会使召回率(recall)大幅度降低，视频场景中的运动模糊等特殊属性使得检测目标的模态和静止图像的样本分布非常不一致。同时，如果在视频中进行像素级的跟踪分割也是非常具有挑战性的。对于视频跟踪，需要大量的视频集的标注样本，而大规模的视频标注成本非常昂贵。即如何通过数据增强的方式，生成具有多样性的训练样本，以及如何在视频序列中进行数据增强研究有很重要的价值。因此，提高整个视频实例分割处理性能和视频分割的精确度，同时减少投入成本，得到一个优化的视频实例分割方法是本领域技术人员需要继续研究的方向。
技术实现思路
本申请的一个目的是提供一种基于卷积神经网络的视频实例分割方法及设备，以解决现有技术中如何克服视频实例分割的缺陷，提高整个视频实例分割处理性能和视频分割的准确度的问题。根据本申请的一个方面，提供了一种基于卷积神经网络的视频实例分割方法包括：获取视频序列并确定待检测目标对象；通过跟踪器对所述视频序列进行所述目标对象的跟踪，得到所述视频序列中的目标对象的跟踪结果；判断所述跟踪结果是否大于跟踪阈值，若是，则将所述跟踪结果确定为所述...

【技术保护点】
1.一种基于卷积神经网络的视频实例分割方法，其特征在于，所述方法包括：/n获取视频序列并确定待检测目标对象；/n通过跟踪器对所述视频序列进行所述目标对象的跟踪，得到所述视频序列中的目标对象的跟踪结果；/n判断所述跟踪结果是否大于跟踪阈值，/n若是，则将所述跟踪结果确定为所述目标对象的分类结果，/n若否，则对所述视频序列重新进行分类检测，以得到所述目标对象的重分类结果。/n

【技术特征摘要】
1.一种基于卷积神经网络的视频实例分割方法，其特征在于，所述方法包括：
获取视频序列并确定待检测目标对象；
通过跟踪器对所述视频序列进行所述目标对象的跟踪，得到所述视频序列中的目标对象的跟踪结果；
判断所述跟踪结果是否大于跟踪阈值，
若是，则将所述跟踪结果确定为所述目标对象的分类结果，
若否，则对所述视频序列重新进行分类检测，以得到所述目标对象的重分类结果。

2.根据权利要求1所述的方法，其特征在于，所述对所述视频序列重新进行分类检测，以得到所述目标对象的重分类结果，包括：
对所述视频序列中的每一帧视频图像依序进行目标对象的检测、分割和裁剪，得到所述视频序列对应的轨迹片段图像，其中，所述轨迹片段图像包括每一帧所述视频图像对应的目标对象片段图像；
将所述视频序列对应的轨迹片段图像输入至卷积神经网络CNN中进行所述CNN前向传递，得到每一帧所述目标对象片段图像中的目标对象的预测分类结果，所述预测分类结果包括至少一个预测分类及各所述预测分类的预测值；
基于所有目标对象片段图像中的目标对象的预测分类结果，分别计算各所述预测分类的预测平均值；
基于所述视频序列中的目标对象对应的各所述预测分类的预测平均值，得到所述目标对象的重分类结果。

3.根据权利要求2所述的方法，其中，所述基于所述视频序列中的目标对象对应的各所述预测分类的预测平均值，得到所述目标对象的重分类结果，包括：
将所述视频序列中的目标对象对应的各所述预测分类的预测平均值中的、最高预测平均值对应的预测分类确定为所述目标对象的重分类结果。

4.根据权利要求1所述的方法，其中，所述方法还包括：
通过检测器对所述视频序列的每一帧视频图像依序进行所述目标对象的检测、分割，得到所述视频序列中的目标对象的检测结果；
对检测分割得到的目标对象所在区域进行预设比例的扩展后，进行预设范围的图像裁剪，得到所述视频序列中包含所述目标对象的每一帧所述视频图像对应的对齐图像。

5.根据权利要求4所述的方法，其中，所述方法还包括：
获取网络图像的训练集、检测集及具有至少两个对象类别的检测分割图像集；
基于分类的损失函数对所述训练集进行图像分类训练，得到初始卷积神经网络CNN...

【专利技术属性】
技术研发人员：何毅，杨晓云，
申请(专利权)人：中科智云科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人