视频处理方法、装置、设备及存储介质制造方法及图纸

技术编号：25638046 阅读：26 留言：0更新日期：2020-09-15 21:30

本发明专利技术实施例公开了视频处理方法、装置、设备及存储介质。该方法包括获取当前视频帧，并确定当前视频帧与上一视频帧的视频帧相似度；根据视频帧相似度及设定个数的判定阈值，确定深度全卷积神经网络中各卷积层相对当前视频帧的卷积处理权限，深度全卷积神经网络预先训练获得，卷积处理权限包括允许处理和拒绝处理；根据各卷积处理权限，通过深度全卷积神经网络处理当前视频帧，获得当前视频帧对应的目标视频帧。该方法在保证已有深度全卷积神经网络拓扑结构不变的前提下，通过确定卷积层的卷积处理权限来限制了参与视频处理的卷积层的数量以此来降低深度全卷积神经网络处理时的运算量，进而在保证语义分割处理精度的前提下有效降低了处理时延。

全部详细技术资料下载

【技术实现步骤摘要】
视频处理方法、装置、设备及存储介质
本专利技术实施例涉及计算机视觉
，尤其涉及视频处理方法、装置、设备及存储介质。
技术介绍
视频语义分割处理是计算机视觉
中一种常见的视频处理方式，具体来说，视频语义分割相当于对视频中各视频帧内的目标元素和背景元素进行抠分的操作，该技术在长/短视频特效、自动驾驶、视频监控以及虚拟现实等场景中有较广泛的应用前景。一般的，不同应用场景下进行视频语义分割处理的时延要求不同，比如在直播应用场景下，需要能够实时的对各视频帧进行视频语义分割处理。目前，常见的视频语义分割处理主要基于深度全卷积网络的方式来实现，该种方式因所采用深度神经网络本身具备的特征表达能力、所提供待分割图像中有标签的数据越来越多、所依赖计算机设备中图像处理器的大规模应用，使得其在视频语义分割精准度方面有了较大提升。然而，深度全卷积神经网络实现视频语义分割具备的运算量很大，由此会产生较高的时延，不适合直播等对视频语义分割处理速度有要求的应用场景，且高运算量需要耗费较多的计算资源，当计算机设备(如低配移动手机)本身计算资源不足时，将会影响视频语义分割的正常实现。
技术实现思路
有鉴于此，本专利技术实施例提供了视频处理方法、装置、设备及存储介质，以降低进行视频语义分割处理的处理时延。第一方面，本专利技术实施例提供了一种视频处理方法，包括：获取当前视频帧，并确定所述当前视频帧与上一视频帧的视频帧相似度；根据所述视频帧相似度及设定个数的判定阈值，确定深度全卷积神经网...

【技术保护点】
1.一种视频处理方法，其特征在于，包括：/n获取当前视频帧，并确定所述当前视频帧与上一视频帧的视频帧相似度；/n根据所述视频帧相似度及设定个数的判定阈值，确定深度全卷积神经网络中各卷积层相对所述当前视频帧的卷积处理权限，所述深度全卷积神经网络预先训练获得，所述卷积处理权限包括允许处理和拒绝处理；/n根据各所述卷积处理权限，通过所述深度全卷积神经网络处理所述当前视频帧，获得所述当前视频帧对应的目标视频帧。/n

【技术特征摘要】
1.一种视频处理方法，其特征在于，包括：
获取当前视频帧，并确定所述当前视频帧与上一视频帧的视频帧相似度；
根据所述视频帧相似度及设定个数的判定阈值，确定深度全卷积神经网络中各卷积层相对所述当前视频帧的卷积处理权限，所述深度全卷积神经网络预先训练获得，所述卷积处理权限包括允许处理和拒绝处理；
根据各所述卷积处理权限，通过所述深度全卷积神经网络处理所述当前视频帧，获得所述当前视频帧对应的目标视频帧。

2.根据权利要求1所述的方法，其特征在于，所述深度全卷积神经网络包括：用于视频帧特征下采样的编码器和用于视频帧特征上采样的解码器；
所述编码器及所述解码器中分别包括所述设定个数的下采样卷积层和上采样卷积层，且一个下采样卷积层对应一个上采样卷积层并建立有跳连接；
各所述判定阈值分别对应所述编码器中的一个下采样卷积层，且各所述判定阈值按照各下采样卷积层的连接顺序依次降低。

3.根据权利要求2所述的方法，其特征在于，所述根据所述视频帧相似度及设定个数的判定阈值，确定深度全卷积神经网络中各卷积层相对所述当前视频帧的卷积处理权限，包括：
按照所述编码器中各下采样卷积层的连接顺序，从各所述判定阈值中选取一个作为当前判定阈值；
如果所述视频帧相似度小于或等于所述当前判定阈值，则确定所述当前判定阈值所对应目标下采样卷积层的卷积处理权限为允许处理，并返回执行新的当前判定阈值的选取操作直至当前判定阈值为末个判定阈值。

4.根据权利要求3所述的方法，其特征在于，还包括：
如果所述视频帧相似度大于所述当前判定阈值，则确定所述当前判定阈值所对应当前下采样卷积层及所述目标下采样卷积层之后各下采样卷积层的卷积处理权限均为拒绝处理。

5.根据权利要求4所述的方法，其特征在于，根据各所述卷积处理权限，通过所述深度全卷积神经网络处理所述当前视频帧，获得所述当前视频帧对应的目标视频帧，包括：
通过所述编码器接收作为输入数据的所述当前视频帧，并记为首个待下采样的待下采样特征图；
通过所述编码器中各下采样卷积层的连接顺序，选定一个下采样卷积层作为当前下采样卷积层；
通过在所述当前下采样卷积层上对所述待下采样特征图的下采样处理，获得对应的当前下采样特征图；
通过所述当前下采样卷积层与所述解码器上所对应目标上采样卷积层的跳连接，处理所述当前下采样特征图，获得所述目标上采样卷积层对应的跳连接特征图；
如果所述当前下采样卷积层的卷积处理权限为拒绝处理，则从所述目标上采样卷积层开始，按照预设的第一上采样策略对所述跳连接特征图进行上采样处理，将输出的灰度特征图作为所述当前视频帧的目标视频帧。

6.根据权利要求5所述的方法，其特征在于，还包括：
如果所述当前下采样卷积层的卷积处理权限为允许处理，则当所述当前下采样卷积层为非末尾下采样卷积层时，将所述当前下采样特征图作为新的待下采样特征图，返回执行当前下采样卷积层的选取操作。

7.根据权利要求6所述的方法，还包括：
当所述当前下采样卷积层为末尾下采样卷积层时，从所述目标上采样卷积层开始，按照预设的第二上采样策略对所述当前下采样特征图进行上采样处理，将输出的灰度特征图作为所述当前视频帧的目标视频帧；
其中，所述第一上采样策略与所述第二上采样策略为预先设定的不同策略。<...

【专利技术属性】
技术研发人员：张树业，项伟，
申请(专利权)人：广州市百果园信息技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人