一种基于深度学习的压缩视频质量增强方法技术

技术编号：46448138 阅读：5 留言：0更新日期：2025-09-19 20:50

本申请实施例公开了一种基于深度学习的压缩视频质量增强方法，涉及计算机视觉技术领域，该方法包括：逐帧提取压缩视频中的每个视频帧为目标视频帧，基于每个目标视频帧处理得到压缩视频帧序列；将每个压缩视频帧序列输入训练好的压缩视频质量增强模型，得到压缩视频帧序列对应的残差；将残差与压缩视频帧序列中的目标视频帧相加，得到对应的增强视频帧；结合每个压缩视频帧序列对应的增强视频帧，输出压缩视频对应的增强视频。本申请可以有效地去除运动物体边界的压缩伪影同时保持其他区域的伪影去除性能，可以将压缩视频的质量显著提高，避免了压缩视频导致的图像质量变差导致的缺陷。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉，尤其涉及一种基于深度学习的压缩视频质量增强方法。

技术介绍

1、视频文件占用的存储空间较大，为了节省存储空间、提高视频文件的传输效率，可以采用有损视频压缩算法（例如，h.264/avc、h.265/hevc、av1和h.266/vvc）以在有限的带宽内减少视频存储和传输成本。然而，有损视频编码中的量化不可避免地在压缩视频中引入压缩伪像，这会导致视频质量的下降，不利于用户的观看体验。

2、此外，压缩伪像还会为下游面向视频的任务（例如，对象检测、动作识别、视频摘要和面部识别）带来困难，例如在进行对象检测时，压缩伪像可能会改变或模糊图像中的关键细节，使得物体检测和识别算法难以准确地定位和分类目标对象。

3、为了提升用户体验，可以通过图像处理和深度学习技术从压缩视频中恢复或增强其原始视觉质量。目前，基于单帧的图像处理方法是专门为jpeg质量增强而设计的，这种方法固有地忽略了视频序列中存在的时间相关性，限制了利用跨帧信息的能力。而基于多帧的图像处理方法可以使用光流或可变形卷积来将相邻帧与目标帧对齐，以...

【技术保护点】

1.一种基于深度学习的压缩视频质量增强方法，其特征在于，包括：

2.根据权利要求1所述的一种基于深度学习的压缩视频质量增强方法，其特征在于，所述基于每个目标视频帧处理得到压缩视频帧序列，包括：

3.根据权利要求1所述的一种基于深度学习的压缩视频质量增强方法，其特征在于，所述压缩视频质量增强模型包括依次连接的偏移调制预测模块、特征融合模块以及残差预测模块；

4.根据权利要求3所述的一种基于深度学习的压缩视频质量增强方法，其特征在于，所述偏移调制预测模块包括多尺度注意力网络和标准卷积网络，其中，多尺度注意力网络包括多尺度卷积模块和多类别平行注意力模块，多尺...

【技术特征摘要】

1.一种基于深度学习的压缩视频质量增强方法，其特征在于，包括：

2.根据权利要求1所述的一种基于深度学习的压缩视频质量增强方法，其特征在于，所述基于每个目标视频帧处理得到压缩视频帧序列，包括：

4.根据权利要求3所述的一种基于深度学习的压缩视频质量增强方法，其特征在于，所述偏移调制预测模块包括多尺度注意力网络和标准卷积网络，其中，多尺度注意力网络包括多尺度卷积模块和多类别平行注意力模块，多尺度卷积模块包括多个膨胀率相同、卷积核大小不同的卷积核；

5.根据权利要求3或4所述的一种基于深度学习的压缩视频质量增强方法，其特征在于，所述通过所述特征融合模块基于所述偏...

【专利技术属性】
技术研发人员：艾浩军，程驰，吕鹏飞，
申请(专利权)人：武汉大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人