【技术实现步骤摘要】
本申请涉及计算机视觉,尤其涉及一种基于深度学习的压缩视频质量增强方法。
技术介绍
1、视频文件占用的存储空间较大,为了节省存储空间、提高视频文件的传输效率,可以采用有损视频压缩算法(例如,h.264/avc、h.265/hevc、av1和h.266/vvc)以在有限的带宽内减少视频存储和传输成本。然而,有损视频编码中的量化不可避免地在压缩视频中引入压缩伪像,这会导致视频质量的下降,不利于用户的观看体验。
2、此外,压缩伪像还会为下游面向视频的任务(例如,对象检测、动作识别、视频摘要和面部识别)带来困难,例如在进行对象检测时,压缩伪像可能会改变或模糊图像中的关键细节,使得物体检测和识别算法难以准确地定位和分类目标对象。
3、为了提升用户体验,可以通过图像处理和深度学习技术从压缩视频中恢复或增强其原始视觉质量。目前,基于单帧的图像处理方法是专门为jpeg质量增强而设计的,这种方法固有地忽略了视频序列中存在的时间相关性,限制了利用跨帧信息的能力。而基于多帧的图像处理方法可以使用光流或可变形卷积来将相邻帧与目标帧对齐,以
...【技术保护点】
1.一种基于深度学习的压缩视频质量增强方法,其特征在于,包括:
2.根据权利要求1所述的一种基于深度学习的压缩视频质量增强方法,其特征在于,所述基于每个目标视频帧处理得到压缩视频帧序列,包括:
3.根据权利要求1所述的一种基于深度学习的压缩视频质量增强方法,其特征在于,所述压缩视频质量增强模型包括依次连接的偏移调制预测模块、特征融合模块以及残差预测模块;
4.根据权利要求3所述的一种基于深度学习的压缩视频质量增强方法,其特征在于,所述偏移调制预测模块包括多尺度注意力网络和标准卷积网络,其中,多尺度注意力网络包括多尺度卷积模块和多类别
...【技术特征摘要】
1.一种基于深度学习的压缩视频质量增强方法,其特征在于,包括:
2.根据权利要求1所述的一种基于深度学习的压缩视频质量增强方法,其特征在于,所述基于每个目标视频帧处理得到压缩视频帧序列,包括:
3.根据权利要求1所述的一种基于深度学习的压缩视频质量增强方法,其特征在于,所述压缩视频质量增强模型包括依次连接的偏移调制预测模块、特征融合模块以及残差预测模块;
4.根据权利要求3所述的一种基于深度学习的压缩视频质量增强方法,其特征在于,所述偏移调制预测模块包括多尺度注意力网络和标准卷积网络,其中,多尺度注意力网络包括多尺度卷积模块和多类别平行注意力模块,多尺度卷积模块包括多个膨胀率相同、卷积核大小不同的卷积核;
5.根据权利要求3或4所述的一种基于深度学习的压缩视频质量增强方法,其特征在于,所述通过所述特征融合模块基于所述偏...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。