一种混合视频编解码系统中基于深度神经网络的帧间预测方法技术方案

技术编号：19487795 阅读：15 留言：0更新日期：2018-11-17 11:43

本发明专利技术提出了一种混合视频编解码系统中基于深度神经网络的帧间预测方法，属于帧间预测技术领域。所述方法通过借助当前块和参考块的周围相邻像素，利用深度神经网络获得一个更准确的预测块，从而使帧间预测性能得到提升。本发明专利技术的有益特点为，区别于基于传统帧间预测方法，本发明专利技术是基于深度神经网络的方法；区别于现有的仅针对于混合视频编解码系统中图像块本身作为输入的深度神经网络方法，本发明专利技术的深度神经网络输入是多个输入，包含非方形区域，这是区别于普通卷积神经网络的贡献所在。

全部详细技术资料下载

【技术实现步骤摘要】
一种混合视频编解码系统中基于深度神经网络的帧间预测方法
本专利技术涉及一种混合视频编解码系统中基于深度神经网络的帧间预测方法，属于帧间预测

技术介绍
随着便携设备以及自媒体的快速发展，视频编码相关的应用正在快速发展并逐渐走向成熟，比如短视频分享、视频通话、互联网直播、电视广播、等等。帧间预测能够有效地去除视频的相邻帧之间的冗余信息，因此提高帧间预测的准确性能够提高视频编码的压缩性能。一般情况下，传统的帧间预测算法中，当前块的预测值是直接从参考帧直接拷贝或者插值得到的。视频的相邻帧存在许多变化，包括亮度变化、渐进渐出、模糊等。传统的一些帧间预测算法提出利用编码块周围像素来处理亮度变化以及利用当前块的相邻像素和参考块的相邻像素来补偿当前块的亮度变化。这些方法都是基于传统的线性模型来补偿当前的编码块。传统帧间预测的方法存在准确性不足的问题。
技术实现思路
本专利技术的目的是为了提高混合视频编解码系统中帧间预测的准确性，利用深度神经网络强大的学习能力，而提出的一种基于深度神经网络的帧间预测方法。本专利技术的有益特点为，区别于基于传统帧间预测方法，本专利技术是基于深度神经网络的方法；区别于现有的仅针对于混合视频编解码系统中图像块本身作为输入的深度神经网络方法，本专利技术的深度神经网络输入是多个输入，包含非方形区域，这是区别于普通卷积神经网络的贡献所在。所采取的技术方案如下：一种混合视频编解码系统中基于深度神经网络的帧间预测方法，所述方法的过程为：步骤一：获取当前块的周围相邻像素、参考块以及参考块的周围相邻像素，所述当前块和参考块是矩形区域或非矩形区域；当所述当...

【技术保护点】
1.一种混合视频编解码系统中基于深度神经网络的帧间预测方法，其特征在于，所述方法的过程为：步骤一：获取当前块的周围相邻像素、参考块以及参考块的周围相邻像素；步骤二：将步骤一获取的当前块的周围相邻像素、参考块以及参考块的周围相邻像素输入到深度神经网络中，获得当前块的一个更准确的预测块。

【技术特征摘要】
1.一种混合视频编解码系统中基于深度神经网络的帧间预测方法，其特征在于，所述方法的过程为：步骤一：获取当前块的周围相邻像素、参考块以及参考块的周围相邻像素；步骤二：将步骤一获取的当前块的周围相邻像素、参考块以及参考块的周围相邻像素输入到深度神经网络中，获得当前块的一个更准确的预测块。2.根据权利要求1所述帧间预测算法，其特征在于，所述当前块的周围相邻像素和参考块的周围相邻像素从当前块和参考块的左下、左边、左上、上边和右上区域获取。3.根据权利要求1所述帧间预测算法，其特征在于，所述步骤二获得更准确的预测块的过程为：第一步：将步骤一获取的当前块的周围相邻像素和参考块的周围相邻像素输入到关系估计网络，获得一个关系块；第二步：用特征组合网络对步骤一得到的参考块和第一步得到的关系块进行特征图的提取，并将所述提取到的特征图组合到一起；第三步：将第二步得到的组合后的特征图输入到深度提纯网络，得到当前块的一个更准确的预测块。4.根据权利要求1所述帧间预测算法，其特征在于，所述步骤二获得更准确的预测块的过程为：第一步：将步骤一获取的参考块和参考块的周围相邻像素输入到一个神经网络中，学习得到参考块和参考块的周围相邻像素之间的关系，所述神经网络由全连接层、卷积层或者二者的组合来实现；第二步：将步骤一获取的当前块的参考像素和第一步获得的关系输入到一个神经网络中，学习得到当前块的更准确的预测块，所述神经网络由全连接层、卷积层或者二者的组合来实现。5.根据权利要求3所述帧间预测算法，其特征在于，第一步所述使用当前块的周围相邻像素和参考块的周围相邻像素获取关系块的过程为：将当前块的周围相邻像素和参考块的周围相邻像素输入到一个K层的全连接网络，得到关系块；或者将预处理后的当前块的周围相邻像素和参考块的周围相...

【专利技术属性】
技术研发人员：范晓鹏，王洋，赵德斌，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人