一种应用于视频压缩技术的运动补偿方法技术

技术编号：24504349 阅读：136 留言：0更新日期：2020-06-13 06:43

本发明专利技术提供一种应用于视频压缩技术的运动补偿方法，属于涉及视频压缩，人工智能，深度学习技术领域，本发明专利技术将传统视频压缩技术中的中间结果光流图与参考帧与光流图和参考帧的合成图像三者进行串联作为运动补偿神经网络的输入。利用深度学习技术在处理图像视频方面的优势帮助视频压缩技术提升压缩效果。

A motion compensation method applied to video compression technology

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于视频压缩技术的运动补偿方法
本专利技术涉及视频压缩，人工智能，深度学习技术，尤其涉及一种应用于视频压缩技术的运动补偿方法。
技术介绍
通常，视频压缩编码器基于输入的当前帧生成比特流。解码器根据接收到的比特流重建视频帧。传统视频压缩技术大致包含六个步骤，包括：运动估计，运动补偿，变换和量化，逆转换，熵编码，视频帧重构六部分。运动估计：通过获得每个事先划分好的的像素块的对应运动矢量，来估计当前帧xt和先前的重建帧xt-1之间的运动。运动补偿：通过在运动估计中得到的运动矢量vt，将先前重建帧中的相应像素复制到当前帧中，从而获得预测帧xt。原始帧xt和预测帧x-t之间的残差rt。rt＝xt-x^t。变换和量化：将运动补偿得来的残差进行量化为yt。在量化之前使用变换(例如，DCT)以获得更好的压缩性能。逆变换：通过逆变换将上一步中的量化结果yt用于获得重构残差rt。熵编码：通过将运动估计中的运动矢量vt和量化的结果yt都编码为比特，并发动给解码器。视频帧重建：通过将运动补偿获得的当前帧的预测帧与逆变换回的残差相加生成重构帧x^t。传统基于规则式的运动补偿方法无法学习到视频帧与视频帧之间的非线性映射规则，因此补偿后的结果较为粗糙导致后续残差结果较大难以有效提高压缩效率。
技术实现思路
为了解决以上技术问题，本专利技术提出了一种应用于视频压缩技术的运动补偿方法，通过利用深度学习技术在处理图像视频方面的优势帮助视频压缩技术提升压缩效果。本专...

【技术保护点】
1.一种应用于视频压缩技术的运动补偿方法，其特征在于，/n将传统视频压缩技术中的中间结果光流图与参考帧与光流图和参考帧的合成图像三者进行串联作为运动补偿神经网络的输入。/n

【技术特征摘要】
1.一种应用于视频压缩技术的运动补偿方法，其特征在于，
将传统视频压缩技术中的中间结果光流图与参考帧与光流图和参考帧的合成图像三者进行串联作为运动补偿神经网络的输入。

2.根据权利要求1所述的方法，其特征在于，
运动补偿神经网络的输入是运动估计得来的像素的运动矢量vt，上一帧重构图像x^t-1，和vt与x^t-1重构图w(x^t-1,vt)。

3.根据权利要求2所述的方法，其特征在于，
vt的储存形式为光流图通道数为2，x^t-1储存形式为图像通道数为3，w(x^t-1,vt)储存形式为图像通道数为3，因此神经网络的输入为三者串联的通道数为8，宽高为输入图像大小的张量。

4.根据权利要求3所述的方法，其特征在于，
步骤如下：
步骤一：将运动估计得来的像素的运动矢量vt，上一帧重构图像x^t-1，和vt与x^t-1重构图w(x^t-1,vt)串联成为8通道的张量作为神经网络的输入；
步骤二：利用第一层卷积层conv_1对步骤一的输入做卷积操作，输出设为conv_1_out；
步骤三：将conv_1_out作为输入传进第一层残差层res_1。将该层的输出设为res_1_out；
步骤四：利用第一个下采样层pool_1对步骤三的输出res_1_out进行下采样，该层输出设为pool_1_out；
步骤五：将pool_1_out作为输入传进第二层残差层中res_2，输出结果设为res_2_out；
步骤六：将res_2_out作为输入传进第二层下采样层中pool_2，该层操作与步骤四相同，输出设为pool_2_out；
步骤七：pool_2_out作为输入传进第三个残差块res_3，并得倒输出res_3_ou...

【专利技术属性】
技术研发人员：安程治，李锐，金长新，
申请(专利权)人：济南浪潮高新科技投资发展有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人