视频压缩方法、装置及系统制造方法及图纸

技术编号:39135539 阅读:7 留言:0更新日期:2023-10-23 14:52
本申请涉及电子技术领域,提供一种视频压缩方法、装置及系统。所述方法包括:对待压缩的初始视频进行解码,得到所述初始视频中每个视频帧对应的第一初始视频数据;针对每个视频帧,对视频帧的第一初始视频数据进行下采样,得到第一目标视频数据,并对第一目标视频数据进行感兴趣区域分析,得到视频帧中各感兴趣区域的坐标;针对每个视频帧,根据视频帧中各感兴趣区域的坐标和预设的宏块设置参数,对视频帧进行区域码率调整;对区域码率调整后的各视频帧进行编码和封装,得到压缩后的目标视。本申请实施例提供的视频压缩方法不仅可应用于实时视频流的压缩中,还能应用于离线视频的压缩中,可以有效地提高视频的压缩率。可以有效地提高视频的压缩率。可以有效地提高视频的压缩率。

【技术实现步骤摘要】
视频压缩方法、装置及系统


[0001]本申请涉及电子
中存储领域、互联网应用领域和通信领域,具体涉及一种视频压缩方法、装置及系统。

技术介绍

[0002]随着多媒体时代的到来,视频大量地出现在人们的日常生活中。经过数字化后的视频具有海量数据性,这给视频的存储和传输带来了很多的困难;调听视频时,由于视频的数据量过大,也会出现调听加载过慢的情况。为解决视频数据量大的问题,视频压缩技术运用而生。
[0003]现有技术,常用的视频压缩技术主要为基于显著性图的自编码网络进行视频压缩,其编码时将待压缩的视频图像帧输入网络,通过卷积层逐步减少图像的特征图数目和空间尺度,将图像从像素空间映射到新的特征空间;然后通过量化、CABAC(Context

Based Adaptive Binary Arithmetic Coding)熵编码去除特征空间内的统计冗余,通过显著性图指导像素分配,最后输出码流得到编码结果,实现去除视频图像中的空间冗余。
[0004]然而,上述方法未考虑到对静态视频文件压缩的场景,直接将上述方法应用到静态视频文件上,其压缩比不足以解决海量视频所引起的存储问题。由于压缩率比较低,在视频调听中需要加载大量的音视频,影响了系统的响应速度,从而使视频的调用过程体验感较差。因此,亟需一种有效的方案以解决上述问题。

技术实现思路

[0005]本申请实施例提供一种视频压缩方法、装置及系统,用以解决压缩率低的技术问题。
[0006]第一方面,本申请实施例提供一种视频压缩方法,包括:
[0007]对待压缩的初始视频进行解码,得到所述初始视频中每个视频帧对应的第一初始视频数据;
[0008]针对每个视频帧,对所述视频帧的所述第一初始视频数据进行下采样,得到第一目标视频数据,并对所述第一目标视频数据进行感兴趣区域分析,得到所述视频帧中各感兴趣区域的坐标;
[0009]针对每个视频帧,根据所述视频帧中各感兴趣区域的坐标和预设的宏块设置参数,对所述视频帧进行区域码率调整;
[0010]对区域码率调整后的各所述视频帧进行编码和封装,得到压缩后的目标视频。
[0011]在一个实施例中,所述感兴趣区域为人脸感兴趣区域;
[0012]相应地,所述对所述第一目标视频数据进行感兴趣区域分析,得到所述视频帧中各感兴趣区域的坐标,包括:
[0013]基于滑动窗口人脸检测算法,对所述第一目标视频数据进行人脸感兴趣区域分析,得到各人脸感兴趣区域的坐标。
[0014]在一个实施例中,所述基于滑动窗口人脸检测算法,对所述第一目标视频数据进行人脸感兴趣区域分析,得到各人脸感兴趣区域的坐标,包括:
[0015]基于滑动窗口人脸检测算法的滑动窗口,将所述视频帧分割为多个子图;
[0016]针对每个子图,根据所述子图对应的第一目标视频数据提取所述子图的图像特征,并将所述图像特征输入至分类器进行人脸感兴趣区域分析,得到分析结果;
[0017]在所述分析结果为所述子图为人脸感兴趣区域的情况下,将所述子图在所述视频帧中的位置,作为所述人脸感兴趣区域的坐标。
[0018]在一个实施例中,所述宏块设置参数包括量化参数偏移值;
[0019]相应地,所述根据所述视频帧中各感兴趣区域的坐标和预设的宏块设置参数,对所述视频帧进行区域码率调整,包括:
[0020]针对所述视频帧中每个宏块,根据所述视频帧中各感兴趣区域的坐标,判断所述宏块是否在感兴趣区域内;
[0021]若是,设置所述宏块的量化参数偏移值为预设负数;
[0022]若否,设置所述宏块的量化参数偏移值为预设正数;
[0023]根据所述视频帧中各所述宏块的量化参数偏移值,对所述视频帧进行区域码率调整。
[0024]在一个实施例中,所述对区域码率调整后的各所述视频帧进行编码和封装,得到压缩后的目标视频,包括:
[0025]基于帧间差异化,对各指定视频帧进行编码,得到编码后的各所述指定视频帧,所述指定视频帧为区域码率调整后的所述视频帧;
[0026]对编码后的各所述指定视频帧进行封装,得到压缩后的目标视频。
[0027]在一个实施例中,所述基于帧间差异化,对各指定视频帧进行编码,得到编码后的各所述指定视频帧,包括:
[0028]确定各所述指定视频帧中的关键帧和参考帧,并将各所述指定视频帧划分为多个画面组,其中,每个画面组中包括一个关键帧和至少一个参考帧;
[0029]对各所述关键帧进行编码,得到编码后的各所述关键帧;
[0030]针对每个参考帧,计算所述参考帧与目标帧的残差值,所述目标帧为所述参考帧所属的画面组中的关键帧或上一个参考帧;对所述残差值进行离散余弦变换和基于帧间差异化的归一化计算,得到归一化后的残差值;对所述归一化后的残差值进行量化,得到量化后的所述残差值;对量化后的所述残差值进行熵编码,得到编码后的各所述参考帧。
[0031]在一个实施例中,所述计算所述参考帧与目标帧的残差值,包括:
[0032]针对所述参考帧中每个宏块,根据所述宏块的色彩信息和时间冗余,以及参考宏块的色彩信息和时间冗余,计算所述宏块与所述参考宏块的子残差值,所述参考宏块为所述宏块映射在所述目标帧中的宏块;
[0033]根据各所述子残差值,确定所述参考帧与目标帧的残差值。
[0034]在一个实施例中,所述对所述残差值进行离散余弦变换和基于帧间差异化的归一化计算,得到归一化后的残差值,包括:
[0035]按照所述参考帧中宏块的划分,将所述残差值进行离散余弦变换,得到频域空间的所述残差值;
[0036]基于帧间差异化,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值。
[0037]在一个实施例中,所述基于帧间差异化,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值,包括:
[0038]构建帧级的量化矩阵;
[0039]将所述量化矩阵和帧间差异化结合,得到失真模型;
[0040]利用所述失真模型,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值。
[0041]在一个实施例中,所述对频域空间的所述残差值进行归一化计算,得到归一化后的残差值,包括:
[0042]对所述参考帧中各所述宏块的量化参数偏移值进行计算;
[0043]基于各所述宏块的量化参数偏移值对应的相似性指标,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值。
[0044]在一个实施例中,所述对所述归一化后的残差值进行量化,得到量化后的所述残差值之后,还包括:
[0045]对量化后的所述残差值进行反量化,得到量化前的所述残差值;
[0046]对量化前的所述残差值进行基于帧间差异化的逆归一化,得到归一化前的所述残差值;
[0047]对归一化前的所述残差值进行离散余弦逆变换,得到所述参考帧与所述目标帧的所述残差值;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频压缩方法,其特征在于,包括:对待压缩的初始视频进行解码,得到所述初始视频中每个视频帧对应的第一初始视频数据;针对每个视频帧,对所述视频帧的所述第一初始视频数据进行下采样,得到第一目标视频数据,并对所述第一目标视频数据进行感兴趣区域分析,得到所述视频帧中各感兴趣区域的坐标;针对每个视频帧,根据所述视频帧中各感兴趣区域的坐标和预设的宏块设置参数,对所述视频帧进行区域码率调整;对区域码率调整后的各所述视频帧进行编码和封装,得到压缩后的目标视频。2.根据权利要求1所述的视频压缩方法,其特征在于,所述感兴趣区域为人脸感兴趣区域;相应地,所述对所述第一目标视频数据进行感兴趣区域分析,得到所述视频帧中各感兴趣区域的坐标,包括:基于滑动窗口人脸检测算法,对所述第一目标视频数据进行人脸感兴趣区域分析,得到各人脸感兴趣区域的坐标。3.根据权利要求2所述的视频压缩方法,其特征在于,所述基于滑动窗口人脸检测算法,对所述第一目标视频数据进行人脸感兴趣区域分析,得到各人脸感兴趣区域的坐标,包括:基于滑动窗口人脸检测算法的滑动窗口,将所述视频帧分割为多个子图;针对每个子图,根据所述子图对应的第一目标视频数据提取所述子图的图像特征,并将所述图像特征输入至分类器进行人脸感兴趣区域分析,得到分析结果;在所述分析结果为所述子图为人脸感兴趣区域的情况下,将所述子图在所述视频帧中的位置,作为所述人脸感兴趣区域的坐标。4.根据权利要求1所述的视频压缩方法,其特征在于,所述宏块设置参数包括量化参数偏移值;相应地,所述根据所述视频帧中各感兴趣区域的坐标和预设的宏块设置参数,对所述视频帧进行区域码率调整,包括:针对所述视频帧中每个宏块,根据所述视频帧中各感兴趣区域的坐标,判断所述宏块是否在感兴趣区域内;若是,设置所述宏块的量化参数偏移值为预设负数;若否,设置所述宏块的量化参数偏移值为预设正数;根据所述视频帧中各所述宏块的量化参数偏移值,对所述视频帧进行区域码率调整。5.根据权利要求1所述的视频压缩方法,其特征在于,所述对区域码率调整后的各所述视频帧进行编码和封装,得到压缩后的目标视频,包括:基于帧间差异化,对各指定视频帧进行编码,得到编码后的各所述指定视频帧,所述指定视频帧为区域码率调整后的所述视频帧;对编码后的各所述指定视频帧进行封装,得到压缩后的目标视频。6.根据权利要求5所述的视频压缩方法,其特征在于,所述基于帧间差异化,对各指定视频帧进行编码,得到编码后的各所述指定视频帧,包括:
确定各所述指定视频帧中的关键帧和参考帧,并将各所述指定视频帧划分为多个画面组,其中,每个画面组中包括一个关键帧和至少一个参考帧;对各所述关键帧进行编码,得到编码后的各所述关键帧;针对每个参考帧,计算所述参考帧与目标帧的残差值,所述目标帧为所述参考帧所属的画面组中的关键帧或上一个参考帧;对所述残差值进行离散余弦变换和基于帧间差异化的归一化计算,得到归一化后的残差值;对所述归一化后的残差值进行量化,得到量化后的所述残差值;对量化后的所述残差值进行熵编码,得到编码后的各所述参考帧。7.根据权利要求6所述的视频压缩方法,其特征在于,所述计算所述参考帧与目标帧的残差值,包括:针对所述参考帧中每个宏块,根据所述宏块的色彩信息和时间冗余,以及参考宏块的色彩信息和时间冗余,计算所述宏块与所述参考宏块的子残差值,所述参考宏块为所述宏块映射在所述目标帧中的宏块;根据各所述子残差值,确定所述参考帧与目标帧的残差值。8.根据权利要求6所述的视频压缩方法,其特征在于,所述对所述残差值进行离散余弦变换和基于帧间差异化的归一化计算,得到归一化后的残差值,包括:按照所述参考帧中宏块的划分,将所述残差值进行离散余弦变换,得到频域空间的所述残差值;基于帧间差异化,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值。9.根据权利要求8所述的视频压缩方法,其特征在于,所述基于帧间差异化,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值,包括:构建帧级的量化矩阵;将所述量化矩阵和帧间差异化结合,得到失真模型;利用所述失真模型,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值。10.根据权利要求8或9所述的视频压缩方法,其特征在于,所述对频域空间的所述残差值进行归一化计算,得到归一化后的残差值,包括:对所述参考帧中各所述宏块的量化参数偏移值进行计算;基于各所述宏块的量化参数偏移值对应的相似性指标,对频域空间的所述残差值进行归一化计算,得到归一化后的残差值。11.根据权利要求6所述的视频压缩方法,其特征在于,所述对所述归一化后的残差值进行量化,得到量化后的所述残差值之后,还包括:对量化后的所述残差值进行反量化,得到量化前的所述残差值;对量化前的所述残差值进行基于帧间差异化的逆...

【专利技术属性】
技术研发人员:王文敏杨森轲李胜辉程明贵永冬
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1