图像编解码制造技术

技术编号:35928710 阅读:15 留言:0更新日期:2022-12-14 10:13
根据本公开的实现,提供了一种图像编解码的方案。在该编码方案中,获取目标图像的编码表示,并进一步基于该编码表示来确定与解码器相关联的目标函数。进一步地,基于目标函数随一组参数的变化程度与阈值程度的比较,来确定该组参数的一组调整量,并基于该组调整量来来调整编码表示中的该组参数,从而获得经调整的编码表示。进一步地,基于该经调整的编码表示来获得目标图像的目标码流。由此,可以获得实现更为高效的图像编码。现更为高效的图像编码。现更为高效的图像编码。

【技术实现步骤摘要】
图像编解码

技术介绍

[0001]图像压缩是信号处理与计算机视觉领域中最为重要和基础的主题。随着高质量多媒体内容越来越多地被使用,人们期望能够提高图像的压缩效率,从而降低传输的带宽或者存储的开销。
[0002]近年来,基于机器学习的图像压缩方法获得了越来越多的关注,并且获得了与传统的压缩方法接近的压缩性能。然而,与传统的编解码方案不同,对于基于机器学习的图像压缩方法而言,目前缺乏通用的优化方法来实现不同图像的高效编解码。

技术实现思路

[0003]根据本公开的实现,提供了一种图像编解码的方案。在该编码方案中,获取目标图像的编码表示,并进一步基于该编码表示来确定与解码器相关联的目标函数。进一步地,基于目标函数随一组参数的变化程度与阈值程度的比较,来确定该组参数的一组调整量,并基于该组调整量来来调整编码表示中的该组参数,从而获得经调整的编码表示。进一步地,基于该经调整的编码表示来获得目标图像的目标码流。由此,可以获得实现更为高效的图像编码。
[0004]提供
技术实现思路
部分是为了简化的形式来介绍对概念的标识,其在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识要求保护的主题的关键特征或主要特征,也无意限制要求保护的主题的范围。
附图说明
[0005]图1示出了能够在其中实施本公开的多个实现的计算环境的框图;
[0006]图2示出了根据本公开的一些实现的图像编码的过程的流程图;
[0007]图3示出了根据本公开的一些实现的图像编码的示意图;以及
[0008]图4示出了根据本公开的一些实现的熵模型的示意图;
[0009]图5示出了根据本公开的一些实现的编码方案的性能与其他方案的对比示意图;
[0010]图6示出了根据本公开的一些实现的图像解码的过程的流程图;以及
[0011]图7示出了根据本公开的一些实现的示例计算设备的框图。
[0012]这些附图中,相同或相似参考符号用于表示相同或相似元素。
具体实施方式
[0013]现在将参照若干示例实现来论述本公开。应当理解,论述了这些实现仅是为了使得本领域普通技术人员能够更好地理解且因此实现本公开,而不是暗示对本主题的范围的任何限制。
[0014]如本文所使用的,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”。术语“一个实现”和“一种实现”要被解读为“至少一个实现”。术语“另一个实现”要被解读为“至少一个其他实现”。术语“第一”、

第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0015]如以上讨论的,随着高质量多媒体内容广泛地被应用于人们生活中的各个方面,人们期望能够提高图像编解码的效率,从而降低网络传输以及存储的成本。
[0016]随着人工智能技术的发展,基于机器学习的图像编解码技术受到了越来越多的关注。人们能够通过训练编码器和解码器来实现图像的编码和解码。目前,许多的研究关注于如何设计网络的架构以实现高效的图像压缩。然而,通过这样的优化所获得的编码器通常难以针对不同的图片均执行高效的压缩,这将极大地影响模型的性能以及模型的通用性。
[0017]根据本公开的实现,提供了一种图像编解码的方案。在编码方案中,获取目标图像的编码表示,这样的编码表示可以包括与所述目标图像相对应的一组参数的值。例如,可以通过训练好的基于机器学习的编码器来处理目标图像,以获得这样的编码表示。
[0018]进一步地,可以基于该编码表示来确定与解码器相关联的目标函数,该解码器用于解码与该编码表示相对应的码流。例如,这样的解码器可以是基于机器学习的编解码器中的解码部分。
[0019]该目标函数进一步用于调整编码表示。具体地,可以基于该目标函数随该组参数的一组变化程度与阈值程度的比较,来确定该组参数的一组调整量。这样的变化程度也被称为参数的梯度。通过将不同参数的梯度与阈值梯度进行比较,本公开的实施例能够实现自适应的参数调整。
[0020]进一步地,基于该组调整量来调整该组参数,从而获得经调整的编码表示,并进一步可以获得目标图像的目标码流。
[0021]由此,本公开的实施例可以利用目标函数实现对编码表示的直接优化,从而实现针对不同图像的自适应优化。此外,通过基于阈值梯度来确定每个参数被调整的调整量,本公开的实施例还能够考虑到编码表示将被执行的量化操作的特性,从而提高压缩效率。
[0022]以下参考附图来说明本公开的基本原理和若干示例实现。
[0023]示例环境
[0024]图1示出了能够在其中实施本公开的多个实现的环境100的框图。应当理解,图1所示出的环境100仅仅是示例性的,而不应当构成对本公开所描述的实现的功能和范围的任何限制。
[0025]如图1所示,编码器110能够获取目标图像105,并将目标图像105转换对应的码流(bitstream)115。在一些实现中,目标图像105可以是包括或可以为由任意类型的用于捕获现实世界图像等的图像捕获设备所捕获的图像。或者,目标图像105也可以是由任意类型的图像生成设备所生成的图像。
[0026]应当理解,在图像编码领域,术语“图像(picture)”、“帧(frame)”或“图片(image)”可以用作同义词。图像编码(或通常称为编码)包括图像编码和图像解码两部分。图像编码在源侧执行,通常包括处理(例如,压缩)原始视频图像以减少表示该视频图像所需的数据量(从而更高效存储和/或传输)。图像解码在目的地侧执行,通常包括相对于编码器作逆处理,以重建图像。编码部分和解码部分也合称为编解码(编码和解码,CODEC)。
[0027]如图1所示,解码设备120可以接收码流115,并通过解码来获得解码图像125。在一些实现中,编码设备110与解码设备120可以是不同的设备,码流115例如可以例如通过通信传输而从编码设备110发送至解码设备120。这样的码流115例如可以被封装为报文等合适
的格式,和/或使用任意类型的传输编码或处理,以便在通信链路或通信网络上进行传输。
[0028]尽管图1示出了编码设备110和解码设备120作为独立的设备,但设备实施例也可以同时包括编码设备110和解码设备120或对应功能。在这些实施例中,编码设备110或对应功能和解码设备120或对应功能可以使用相同硬件和/或软件或通过单独的硬件和/或软件或其任意组合来实现。
[0029]关于图像编码和图像解码的过程将在下文详细描述。
[0030]编码过程
[0031]图2示出了根据本公开一些实现的图像编码的过程200的流程图。过程200例如可以由图1中的编码设备110来实现。
[0032]如图2所示,在202,编码设备110获取目标图像110的编码表示,该编码表示包括与目标图像110相对应的一组参数的值。
[0033]在一些实现中,编码表示可以是通过适当的编码技术所获得的初始编码本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像编码的方法,包括:获取目标图像的编码表示,所述编码表示包括与所述目标图像相对应的一组参数的值;基于所述编码表示,确定与解码器相关联的目标函数,所述解码器用于解码与所述编码表示相对应的码流;基于所述目标函数随所述一组参数的一组变化程度与阈值程度的比较,确定所述一组参数的一组调整量;基于所述一组调整量来调整所述一组参数,以获得经调整的编码表示;以及基于所述经调整的编码表示,获得所述目标图像的目标码流。2.根据权利要求1所述的方法,其中确定所述参数的所述调整量包括:响应于确定所述目标函数随第一参数的第一变化程度小于等于所述阈值程度,将所述第一参数的调整量确定为零。3.根据权利要求1所述的方法,其中确定所述参数的所述调整量包括:响应于确定所述目标函数随第二参数的第二变化程度大于所述阈值程度,基于所述第二变化程度来确定所述第二参数的调整量,使得所述调整量正比于所述第二变化程度。4.根据权利要求3所述的方法,其中基于所述第二变化程度来确定所述调整量包括:确定所述一组变化程度中的最大变化程度;以及基于所述第二变化程度与所述最大变化程度的比,确定所述调整量,使得所述调整量正比于所述比。5.根据权利要求1

4中任一项所述的方法,其中所述阈值程度是基于所述一组变化程度中的最大变化程度与预定系数的乘积所确定的。6.根据权利要求1所述的方法,其中所述编码表示包括第一编码表示,所述第一编码表示是通过利用编码器处理所述目标图像所生成的。7.根据权利要求6所述的方法,其中所述编码表示还包括第二编码表示,所述第二编码表示是基于所述第一编码表示所生成的,以指示所述第一编码表示的分布特性。8.根据权利要求7所述的方法,其中所述编码表示包括与所述目标图像中的多个位置对应的多个部分编码表示,并且生成所述目标码流包括:针对所述多个位置中的给定位置,基于所述第二编码表示,确定用于指示均值的第一熵编码参数,所述第一熵编码参数同上下文参数无关,所述上下文参数用于指示所述多个位置中与给定位置相关联的一组关联位置的编码表示;以及至少基于所述第一熵编码参数,生成所述目标码流中与所述给定位置对应的部分码流。9.根据权利要求8所述的方法,其中至少基于所述第一熵编码参数生成所述目标码流中与所述给定位置对应的所述部分码流包括:基于所述第二编码表示和所述上下文参数,确定用于指示方差的第二熵编码参数;以及基于所述第一熵编码参数和所述第二熵编码参数,生成所述目标码流中与所述给定位置对应的所述部分码流。
10.根据权利要求1所述的方法,其中所述目标码流中编码有以下中的至少一项:第一辅助信息,指示用于对所述编码表示进行量化的量化参数,或第二辅助信息,指示对从所述目标码流生成的解码图像进行后处理的后处理参数。11.根据权利要求1所述的方法,其中基于所述一组调整量来所述调整所述一组参数包括:迭代地调整所述编码表示,直至与所述目标函数相关联的收敛条件被满足。12.一...

【专利技术属性】
技术研发人员:李斌李嘉豪吕岩
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1