神经图像压缩中的远程上下文模型制造技术

技术编号:42615440 阅读:38 留言:0更新日期:2024-09-03 18:21
提供了用于使用神经图像压缩网络对压缩图像进行解码的方法和装置。该方法可以包括生成与压缩图像相关联的上下文参数,该上下文参数对应于第一区域。该方法还可以包括确定压缩图像内的远程全局区域中的第一潜在变量和第二潜在变量之间存在远程全局相关性,以及使用基于变换器的远程上下文预测模型来预测多个上下文特征。该方法然后可以包括基于预测的多个上下文特征,来重建压缩图像。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、传统的混合视频编解码器难以作为整体进行优化。单个模块的改进可能不会导致整体性能的编码增益。最近,标准组和公司一直在积极地寻找未来视频编解码技术标准化的潜在需求。这些标准组和公司已经建立了专注于使用深度神经网络(dnn)进行基于ai的端到端神经图像压缩的jpeg-ai组。中国avs标准也形成了avs-ai专门组,致力于神经图像和视频压缩技术。最近方式的成功已经引起了越来越多对先进的神经图像和视频压缩方法的工业兴趣。

2、在学习的图像压缩框架中,上下文模型在捕获潜在变量和/或潜在表示(在本公开中可互换地使用)中的相关性中起关键作用。在相关技术中,自回归上下文模型用于减少由串行自回归上下文产生的解码时间。然而,由于潜在变量的连续预测,自回归模型的对应计算复杂度为o(n2)的数量级(n为潜在变量的高度或宽度)。此类高成本源于上下文模型的基础方案,其需要所有先前已解码的潜在变量来预测新的潜在变量。因此,需要更有效且可并行的上下文模型来降低上下文模型的复杂度并且提高上下文模型的效率。

3、另外,相关技术的自回归上下文模型在对当前本文档来自技高网...

【技术保护点】

1.一种使用神经图像压缩网络对压缩图像进行解码的方法,其特征在于,所述方法由至少一个处理器执行,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,预测多个上下文特征包括:

3.根据权利要求2所述的方法,其特征在于,所述第一区域中的所述第一位置是所述第一区域中的角位置,

4.根据权利要求2所述的方法,其特征在于,所述第一区域中的所述第一位置是所述第一区域中的边缘位置,

5.根据权利要求2所述的方法,其特征在于,预测所述第一上下文特征包括:

6.根据权利要求2所述的方法,其特征在于,预测所述第二上下文特征包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种使用神经图像压缩网络对压缩图像进行解码的方法,其特征在于,所述方法由至少一个处理器执行,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,预测多个上下文特征包括:

3.根据权利要求2所述的方法,其特征在于,所述第一区域中的所述第一位置是所述第一区域中的角位置,

4.根据权利要求2所述的方法,其特征在于,所述第一区域中的所述第一位置是所述第一区域中的边缘位置,

5.根据权利要求2所述的方法,其特征在于,预测所述第一上下文特征包括:

6.根据权利要求2所述的方法,其特征在于,预测所述第二上下文特征包括:

7.根据权利要求2所述的方法,其特征在于,所述第一区域是正方形区域或矩形区域中的一个。

8.一种使用神经图像压缩网络对压缩图像进行解码的装置,其特征在于,所述装置包括:

9.根据权利要求8所述的装置,其特征在于,上下文预测代码包括:

10.根据权利要求9所述的装置,其特征在于,所述第一区域中的所述第一位置是所述第一区域中的角位置,

11.根据权利要求9所述的装置,其特征在于,所述第一区域中的所述第一位置是所述第一区域中的边缘位置,

【专利技术属性】
技术研发人员:隋阳丁鼎许晓中刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1