基于深度神经网络的多功能视频快速编码方法技术

技术编号：24467186 阅读：30 留言：0更新日期：2020-06-10 19:03

本发明专利技术涉及一种基于深度神经网络的多功能视频快速编码方法。首先，通过研究视频内容的时空域相关性，使用反向传播（BP）神经网络对CU的划分深度进行预测；然后，使用统计概率对CU的划分模式进行选择；最后，在编码时跳过不必要的划分模式以节省编码时间，从而达到保证编码器编码性能不变的情况下降低时间复杂度的目的。

A fast multi-function video coding method based on deep neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于深度神经网络的多功能视频快速编码方法
本专利技术属于视频编码
，具体涉及一种基于深度神经网络的多功能视频快速编码方法，以达到在不影响编码器编码性能的前提下，实现大幅度节省编码时间的目的。
技术介绍
新一代多功能视频编码标准(VVC)采用了更多的技术来提升压缩率，以解决急剧增长的视频数据与有限带宽的网络传输环境的冲突问题。但是在提升编码效率的同时也增加了编码的计算复杂度。在VVC编码过程中，视频图像编码时会根据内容特征划分为不同大小的块(编码单元(CU))以提升压缩效率，而确定视频图像最佳分块方式会耗费大量的编码时间。因此,如果能优化编码单元的划分过程将极大提高编码器的编码效率。但目前适用于VVC的帧内快速编码算法还不够完善。针对这种现象,本专利技术提出了基于深度神经网络的多功能视频编码快速算法，并通过实验结果表明，在不影响编码器编码性能的情况下，与原始编码器相比，该算法可以节省平均59.82％的编码时间。
技术实现思路
本专利技术的目的在于提供一种基于深度神经网络的多功能视频快速编码方法，该方法较传统编码方法节省了编码时间。为实现上述目的，本专利技术的技术方案是：一种基于深度神经网络的多功能视频快速编码方法，包括如下步骤：步骤S1、判断参考深度单元个数是否达到预设值，若是执行步骤S2；步骤S2、基于BP神经网络对当前编码单元CU进行深度图预测，再根据深度图信息确定CU的划分深度；步骤S3、基于概率模型，统计已编码CU最佳划分模式次数占比，依照概率从...

【技术保护点】
1.一种基于深度神经网络的多功能视频快速编码方法，其特征在于，包括如下步骤：/n步骤S1、判断参考深度单元个数是否达到预设值，若是执行步骤S2；/n步骤S2、基于BP神经网络对当前编码单元CU进行深度图预测，再根据深度图信息确定CU的划分深度；/n步骤S3、基于概率模型，统计已编码CU最佳划分模式次数占比，依照概率从大到小确定当前CU划分模式预测顺序；/n步骤S4、计算率失真RD代价值并根据相应代价判断规律，基于前提决策条件跳过不必要预测模式，提前终止划分过程，并确定当前CU的最佳预测模式。/n

【技术特征摘要】
1.一种基于深度神经网络的多功能视频快速编码方法，其特征在于，包括如下步骤：
步骤S1、判断参考深度单元个数是否达到预设值，若是执行步骤S2；
步骤S2、基于BP神经网络对当前编码单元CU进行深度图预测，再根据深度图信息确定CU的划分深度；
步骤S3、基于概率模型，统计已编码CU最佳划分模式次数占比，依照概率从大到小确定当前CU划分模式预测顺序；
步骤S4、计算率失真RD代价值并根据相应代价判断规律，基于前提决策条件跳过不必要预测模式，提前终止划分过程，并确定当前CU的最佳预测模式。

2.根据权利要求1所述的基于深度神经网络的多功能视频快速编码方法，其特征在于，所述步骤S1具体实现为：预设值个数为25，若参考深度单元个数小于25则采用原始编码流程对当前编码单元CU进行编码，否则执行步骤S2。

3.根据权利要求1所述的基于深度神经网络的多功能视频快速编码方法，其特征在于，所述步骤S2具体实现为：
步骤S21、用C(x,y,t)表示视频第t帧中左上角像素值坐标为(x,y)的参考深度图单元，C(x,y,t)可表示如下：

其中，Δx和Δy表示-2到2的整数；上式表示，如果当前帧的参考深度图单元存在，就使用其为参考深度图单元；否则使用前一帧的相邻深度图单元作为参考深度图单元；
步骤S22、利用BP神经网络预测，BP神经网络模型的定义如下：
Zl＝Act(WlXl+Bl)
其中，Zl、Wl、Xl、Bl分别表示BP...

【专利技术属性】
技术研发人员：赵铁松，王楷，徐艺文，吴陆狄，郑权斐，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人