一种图像压缩方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35459390 阅读:14 留言:0更新日期:2022-11-03 12:24
本申请涉及图像处理技术领域,尤其涉及一种图像压缩方法、装置、电子设备及存储介质。本申请先将获取到的原始图像进行切割得到多个区域图像,并分别确定各个区域图像在图像压缩过程中所需的有效通道的通道数量,进而,通过将原始图像以及原始图像的各个区域图像分别对应的通道数量输入训练好的空域自适应压缩自编码器,得到所述原始图像经由神经网络变换后的目标潜在表示和目标重建图像。本申请通过空域自适应压缩自编码器对原始图像的各个区域图像分别按照各自适配的特征通道数进行图像压缩,可以在保证解压缩后的目标重建图像满足一定质量前提下,显著提升图像压缩过程中的计算效率,可以同时兼顾失真度和编码开销的联合优化。合优化。合优化。

【技术实现步骤摘要】
一种图像压缩方法、装置、电子设备及存储介质


[0001]本申请涉及图像处理
,尤其涉及一种图像压缩方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,随着数字化信息时代的到来和多媒体计算机技术的发展,使得人们所面对的各种数据量剧增,数据压缩技术的研究受到人们越来越多的重视。图像压缩就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除冗余的数据以减少标识数字图像时需要的数据量,便于图像的存储和传输。
[0003]目前,图像压缩方法主要包括传统图像压缩方法和深度学习图像压缩方法。其中,传统图像压缩方法一般采用变换编码技术、或是联合使用了预测编码技术和变换编码技术的混合编码框架来实现对图像的压缩。深度学习图像压缩方法则是对全分辨率的输入图像进行非线性变换,从而完成整个图像压缩过程。
[0004]但是,上述图像压缩方法一般只考虑对于压缩问题通用的失真率的优化,或只考虑在编码过程中对于编码开销的优化,不能同时兼顾失真度和编码开销的联合优化,造成计算资源和时间的浪费,或者压缩效果的损失。

技术实现思路

[0005]有鉴于此,本申请实施例至少提供一种图像压缩方法、装置、电子设备及存储介质,可以在保证解压缩后的目标重建图像满足一定质量前提下,显著提升图像压缩过程中的计算效率,可以同时兼顾失真度和编码开销的联合优化。
[0006]本申请主要包括以下几个方面:
[0007]第一方面,本申请实施例提供一种图像压缩方法,所述图像压缩方法包括:获取待压缩的原始图像;将所述原始图像进行切割得到多个区域图像,并分别确定各个区域图像在图像压缩过程中所需的有效通道的通道数量;将所述原始图像以及所述原始图像的各个区域图像分别对应的通道数量输入训练好的空域自适应压缩自编码器,得到所述原始图像经由神经网络变换后的目标潜在表示和目标重建图像。
[0008]在一种可能的实施方式中,针对所述原始图像的任一所述区域图像;根据以下步骤确定所述区域图像对应的通道数量:将所述区域图像输入训练好的第一神经网络模型中的第一骨干网络,确定所述区域图像对应的图像特征信息;将所述区域图像对应的图像特征信息输入所述第一神经网络模型中的第一路由决策网络,确定所述区域图像对应的通道数量;其中,所述第一神经网络模型是依赖第二神经网络模型进行训练得到的,所述第一神经网络模型的网络规模小于所述第二神经网络模型的网络规模。
[0009]第二方面,本申请实施例还提供一种图像压缩装置,所述图像压缩装置包括:获取模块,用于获取待压缩的原始图像;确定模块,用于将所述原始图像进行切割得到多个区域图像,并分别确定各个区域图像在图像压缩过程中所需的有效通道的通道数量;处理模块,
用于将所述原始图像以及所述原始图像的各个区域图像分别对应的通道数量输入训练好的空域自适应压缩自编码器,得到所述原始图像经由神经网络变换后的目标潜在表示和目标重建图像。
[0010]第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的图像压缩方法的步骤。
[0011]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的图像压缩方法的步骤。
[0012]本申请实施例提供的图像压缩方法、装置、电子设备及存储介质,采用空域自适应压缩自编码器对原始图像的各个区域图像分别按照各自适配的特征通道数进行图像压缩,与现有技术中的图像压缩方法一般只考虑对于压缩问题通用的失真率的优化,或只考虑在编码过程中对于编码开销的优化,不能同时兼顾失真度和编码开销的联合优化,造成计算资源和时间的浪费,或者压缩效果的损失相比,本申请可以在保证压缩性能的前提下,尽可能减少在压缩过程中的变换编码花费的计算时间,可以同时兼顾失真度和编码开销的联合优化。
[0013]进一步,本申请实施例提供的图像压缩方法,还可以通过将原始图像中的各个区域图像输入网络规模为轻量型的第一神经网络模型中,确定出各个区域图像分别适配的通道数量,而且第一神经网络模型是依赖于网络规模更大的第二神经网络模型进行训练得到的,这样,不仅可以保证输出的各个区域图像的通道数量的准确率,还可以提升计算各个区域图像的通道数量的计算效率,从而保证整个图像压缩过程的计算效率。
[0014]为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0015]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0016]图1示出了本申请实施例所提供的一种图像压缩方法的流程图;
[0017]图2示出了本申请实施例所提供的另一种图像压缩方法的流程图;
[0018]图3示出了本申请实施例所提供的一种图像压缩装置的功能模块图之一;
[0019]图4示出了本申请实施例所提供的一种图像压缩装置的功能模块图之二;
[0020]图5示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
[0021]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附
图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
[0022]另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
[0023]为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“图像压缩”,给出以下实施方式,对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像压缩方法,其特征在于,所述图像压缩方法包括:获取待压缩的原始图像;将所述原始图像进行切割得到多个区域图像,并分别确定各个区域图像在图像压缩过程中所需的有效通道的通道数量;将所述原始图像以及所述原始图像的各个区域图像分别对应的通道数量输入训练好的空域自适应压缩自编码器,得到所述原始图像经由神经网络变换后的目标潜在表示和目标重建图像。2.根据权利要求1所述的图像压缩方法,其特征在于,针对所述原始图像的任一所述区域图像;根据以下步骤确定所述区域图像对应的通道数量:将所述区域图像输入训练好的第一神经网络模型中的第一骨干网络,确定所述区域图像对应的图像特征信息;将所述区域图像对应的图像特征信息输入所述第一神经网络模型中的第一路由决策网络,确定所述区域图像对应的通道数量;其中,所述第一神经网络模型是依赖第二神经网络模型进行训练得到的,所述第一神经网络模型的网络规模小于所述第二神经网络模型的网络规模。3.根据权利要求2所述的图像压缩方法,其特征在于,根据以下步骤训练出所述第一神经网络模型:获取多个样本图像,并确定每个样本图像进行切割得到各个样本区域图像分别对应的真实通道数量;针对任一所述样本区域图像,将所述样本区域图像输入训练好的所述第二神经网络模型确定出所述样本区域图像的第一预测通道数量,以及将所述样本区域图像输入小型初始神经网络模型确定出所述样本区域图像的第二预测通道数量;根据所述样本区域图像的真实通道数量与第二预测通道数量之间的第一熵损,以及所述样本区域图像的第一预测通道数量与第二预测通道数量之间的第二熵损,确定所述样本区域图像对应的第一联合熵损;基于所述多个样本图像的各个样本区域图像对应的第一联合熵损,对所述小型初始神经网络模型的模型参数进行调整,直至满足第一预设训练截止条件,停止对所述小型初始神经网络模型的训练,生成所述第一神经网络模型。4.根据权利要求2所述的图像压缩方法,其特征在于,根据以下步骤训练出所述第二神经网络模型:获取多个样本图像,并确定每个样本图像进行切割得到各个样本区域图像分别对应的真实通道数量以及真实降级失真代价值;针对任一所述样本区域图像,将所述样本区域图像输入大型初始神经网络模型,确定所述样本区域图像的第三预测通道数量以及预测降级失真代价值;根据所述样本区域图像的真实通道数量与第三预测通道数量之间的第三熵损,以及所述样本区域图像的预测降级失真代价值与真实降级失真代价值之间的第四熵损,确定所述样本区域图像的第二联合熵损;基于所述多个样本图像的各个样本区域图像对应的第二联合熵损,对所述大型初始神经网络模型的模型参数进行调整,直至满足第二预设训练截止条件,停止对所述大型初始
神经网络模型的训练,生成所述第二神经网络模型。5.根据权利要求3或4所述的图像压缩方法,其特征在于,根据以下步骤确定所述样本区域图像的真实通道数量:将所述样本区域图像以及多个预设通道数...

【专利技术属性】
技术研发人员:高伟陶履方李革
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1