一种视频压缩方法技术

技术编号:37715175 阅读:13 留言:0更新日期:2023-06-02 00:10
本发明专利技术公开了一种视频压缩方法,属于数据传输技术领域,方法包括:向视频压缩网络输入低质量图片组,低质量图片组包括1个低质量I帧、6个低质量P帧和6个P帧对应的运动向量;通过10个残差块计算低质量I帧的64维表示和低质量P帧的16维表示,并通过运动向量的扭曲特征将6个P帧表示和I帧表示对齐,反转运动向量并向后复制P帧特征以与前一帧对齐,以使6个P帧特征均与I帧特征对齐;连接I帧特征和对齐的6个P帧特征之间的通道,生成包括I帧特征和对齐的6个P帧特征的160维特征向量;通过10个以上残差块生成高质量I帧并输出;根据高质量I帧生成高质量P帧;通过视频恢复网络,对极限压缩后的低质量图片组进行恢复。的低质量图片组进行恢复。的低质量图片组进行恢复。

【技术实现步骤摘要】
一种视频压缩方法


[0001]本专利技术属于数据传输
,具体涉及一种视频压缩方法。

技术介绍

[0002]近年来,随着视频多媒体的兴起,为了传输视频,对其进行压缩是必要的,因为即使是短视频也比未经压缩的文本数据数量级更大,不能通过宽带连接及时传输。
[0003]虽然最近提出的基于块的编解码器能在有限的质量损失的情况下实现较好的压缩比,但在第三世界国家,农村地区和低级家庭等低带宽的情况下不能取得满意的效果。因为低带宽的网络连接引起的附加传输延迟是不稳定的,其有效带宽可以随时间变化且变化幅度很大。现有的解决办法是每次都创建一个较小的传输,增加传输次数,但是这随之会带来视觉保真度的相关损失,并且传输效率低下。

技术实现思路

[0004]本专利技术实施例的目的是提供一种视频压缩方法,能够解决现有方法在低带宽环境中视频传输的视觉保真度低和传输效率低的技术问题。
[0005]为了解决上述技术问题,本专利技术是这样实现的:
[0006]本专利技术实施例提供了一种视频压缩方法,包括:
[0007]S101:向视频压缩网络输入低质量图片组,所述低质量图片组包括1个低质量I帧、6个低质量P帧和6个P帧对应的运动向量;
[0008]S102:通过10个残差块计算所述低质量I帧的64维表示和所述低质量P帧的16维表示,并通过所述运动向量的扭曲特征将6个P帧表示和I帧表示对齐,反转所述运动向量并向后复制P帧特征以与前一帧对齐,以使6个P帧特征均与I帧特征对齐;
[0009]S103:连接所述I帧特征和对齐的6个所述P帧特征之间的通道,生成包括所述I帧特征和对齐的6个所述P帧特征的160维特征向量;
[0010]S104:通过10个残差块生成高质量I帧并输出;
[0011]S105:根据所述高质量I帧以及6个所述P帧对应的运动向量,生成高质量P帧,以对所述低质量图片组进行极限压缩;
[0012]S106:通过视频恢复网络,对极限压缩后的低质量图片组进行恢复。
[0013]进一步地,所述残差块包括LeakyReLU函数,所述残差块的开头设置有通道注意力块。
[0014]进一步地,在S103之后,还包括:
[0015]S103A:将所述160维特征向量投影到64维特征空间中。
[0016]进一步地,所述S105具体包括:
[0017]S1051:对所述高质量I帧使用6个所述P帧对应的运动向量进行扭曲,以产生6个I帧副本;
[0018]S1052:6个所述I帧副本与6个低质量P帧一一对齐并通过通道连接,以创建6通道
输入;
[0019]S1053:将6个所述I帧副本投影到64维特征空间;
[0020]S1054:通过10个残差块生成所述高质量P帧。
[0021]进一步地,在所述S106之前还包括:
[0022]S106A:通过复合损失函数训练所述视频恢复网络,所述复合损失函数包括回归损失和尺度

空间损失。
[0023]进一步地,所述复合损失函数L(O,T)为:
[0024]L(O,T)=α
·
L1(O,T)=β
·
L
DoG
(O,T)
[0025]其中,L1(O,T)表示所述回归损失,L
DoG
(O,T)表示所述尺度

空间损失,α表示所述回归损失的权重,β表示所述尺度

空间损失的权重。
[0026]进一步地,所述回归损失L1(O,T)为:
[0027]L1(O,T)=||T

O
[0028]其中,O表示所述视频恢复网络的输出,T表示所述视频恢复网络的目标。
[0029]进一步地,所述尺度

空间损失L
DoG
(O,T)的计算过程为:
[0030]对所述视频恢复网络的输出O在4个尺度下进行计算,得到尺度空间S:
[0031]S={O1,O2,O4,O8}
[0032]其中,O
s
是由宽度和高度的因子s向下取样O得到;
[0033]将所述尺度空间S中的每个尺度与标准差增加的高斯核σ进行卷积以计算高斯差G(σ):
[0034][0035]其中,i、j为内核偏移量;
[0036]对于所述尺度空间S中的每个尺度均计算4个滤波图像I:
[0037][0038]并计算每个尺度下所述滤波图像的差,得到每个尺度的频带B:
[0039][0040]计算所述频带之间的绝对误差的总和作为所述尺度

空间损失L
DoG
(O,T):
[0041][0042]其中,B
T,s,b
表示目标帧在每个尺度下所述滤波图像的差,B
O,s,b
表示输出帧在每个尺度下所述滤波图像的差。
[0043]本专利技术的有益之处在于:在本专利技术实施例中,在低带宽的极端环境下分配更多的性能参数来生成高质量I帧,之后再根据高质量I帧生成高质量P帧,相对的可以分配更少的
性能参数到P帧,加速体系结构,利用底层的比特流结构对视频实现极限压缩,之后对极限压缩后的视频数据进行传输,可以保证视频在传输过程中的视觉保真度和传输效率,之后可通过视频恢复网络对极限压缩后的低质量图片组进行重建恢复。
附图说明
[0044]图1是本专利技术实施例提供的一种视频压缩方法的流程示意图;
[0045]图2是本专利技术实施例提供的一种视频压缩网络的结构图。
[0046]本专利技术目的的实现、功能特点及优点将结合实施例、参照附图做进一步说明。
具体实施方式
[0047]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0048]下面结合附图,通过具体的实施例及其应用场景对本专利技术实施例提供视频压缩方法进行详细地说明。
[0049]参照图1,示出了本专利技术实施例提供的一种视频压缩方法的流程示意图。
[0050]参照图2,示出了本专利技术实施例提供的一种视频压缩网络的结构图。
[0051]视频压缩方法,包括:
[0052]S101:向视频压缩网络输入低质量图片组,所述低质量图片组包括1个低质量I帧、6个低质量P帧和6个P帧对应的运动向量。
[0053]其中,I帧(I

frames,帧内编码帧)是一个全帧压缩编码帧,解码时仅用I帧的数据就可重构完整图像,I帧描述了图像背景和运动主体的详情。P帧(P

frames,前向预测编码帧)以I帧为参考帧本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频压缩方法,其特征在于,包括:S101:向视频压缩网络输入低质量图片组,所述低质量图片组包括1个低质量I帧、6个低质量P帧和6个P帧对应的运动向量;S102:通过10个残差块计算所述低质量I帧的64维表示和所述低质量P帧的16维表示,并通过所述运动向量的扭曲特征将6个P帧表示和I帧表示对齐,反转所述运动向量并向后复制P帧特征以与前一帧对齐,以使6个P帧特征均与I帧特征对齐;S103:连接所述I帧特征和对齐的6个所述P帧特征之间的通道,生成包括所述I帧特征和对齐的6个所述P帧特征的160维特征向量;S104:通过10个残差块生成高质量I帧并输出;S105:根据所述高质量I帧以及6个所述P帧对应的运动向量,生成高质量P帧,以对所述低质量图片组进行极限压缩;S106:通过视频恢复网络,对极限压缩后的低质量图片组进行恢复。2.根据权利要求1所述的视频压缩方法,其特征在于,所述残差块包括LeakyReLU函数,所述残差块的开头设置有通道注意力块。3.根据权利要求1所述的视频压缩方法,其特征在于,在S103之后,还包括:S103A:将所述160维特征向量投影到64维特征空间中。4.根据权利要求3所述的视频压缩方法,其特征在于,所述S105具体包括:S1051:对所述高质量I帧使用6个所述P帧对应的运动向量进行扭曲,以产生6个I帧副本;S1052:6个所述I帧副本与6个低质量P帧一一对齐并通过通道连接,以创建6通道输入;S1053:将6个所述I帧副本投影到64维特征空间;S1054:通过10个残差块生成所述高质量P帧。5.根据权利要求1所述的视频压缩方法,其特征在于,在所述S106之前还包括:S106A:通过复合损失函数训练所述视频恢复网络,所述复合损失函数包括回归损失和尺度

【专利技术属性】
技术研发人员:周颜张久岩岳子丰杨维李楠
申请(专利权)人:中电信数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1