一种基于上下文聚类变换的端到端图像压缩方法技术

技术编号:40274490 阅读:23 留言:0更新日期:2024-02-02 23:01
本发明专利技术具体涉及一种基于上下文聚类变换的端到端图像压缩方法,将图像输入经过训练的图像压缩模型中输出重建图像;模型训练过程包括:对图像进行编码:将图像转化为含有坐标的特征点,然后根据相似性将特征点分成多个簇,最后通过对每一簇内特征点进行多次聚合和再分配的方式学习图像特征,生成潜在表示;熵模型完成对每个待编码的潜在表示的概率建模;通过熵编码器对待编码的潜在表示进行熵编码和熵解码,生成熵值特征图;通过主解码器对熵值特征图进行解码重建,生成重建图像;最终计算模型损失并优化模型参数直至模型收敛。本发明专利技术充分考虑了图像相邻像素间的相关性,改善了图像局部相似特征交互不足的问题。

【技术实现步骤摘要】

本专利技术涉及图像压缩和深度学习,具体涉及一种基于上下文聚类变换的端到端图像压缩方法


技术介绍

1、随着信息技术和大数据的快速发展,多媒体数据在众多领域呈现出急剧增长的趋势,使得图像压缩技术变得越来越重要。传统的图像压缩方法主要是基于jpeg、jpeg2000、hevc和vvc等图像/视频压缩标准。

2、随着深度学习在图像领域的蓬勃发展,研究人员提出了基于深度学习的端到端图像压缩方法。与传统图像压缩方法相比,端到端图像压缩方法具有自适应平衡图像压缩质量和传输码流的能力,更适用于多样化的图像数据,如360度全景、屏幕内容和光场等图像内容。因此,对端到端图像压缩方法的研究已成为当前图像通信领域学者们关注的焦点之一。

3、目前,端到端图像压缩方法主要包括变换网络(或称主编解码器)、量化器、超先验网络和熵编码四大模块,其中变换网络大多数都是基于卷积神经网络(convolutionalneural network,cnn)基本框架设计的。然而,现有研究工作主要集中在如何优化cnn变换网络和熵编码,却忽略了cnn变换网络自身存在的图像局部相似本文档来自技高网...

【技术保护点】

1.一种基于上下文聚类变换的端到端图像压缩方法,其特征在于,包括:

2.如权利要求1所述的基于上下文聚类变换的端到端图像压缩方法,其特征在于:步骤S202中,主编码器ga包括依次连接的一层编码嵌入层和若干个上下文聚类模块,其中相邻两个上下文聚类模块之间设置有特征点缩减模块;

3.如权利要求2所述的基于上下文聚类变换的端到端图像压缩方法,其特征在于:上下文聚类模块的处理步骤如下:

4.如权利要求3所述的基于上下文聚类变换的端到端图像压缩方法,其特征在于:步骤S2021中,对于特征图t1,在若干个特征点的线性投影空间中均匀地选择c个中心,平均其k个近邻特征...

【技术特征摘要】

1.一种基于上下文聚类变换的端到端图像压缩方法,其特征在于,包括:

2.如权利要求1所述的基于上下文聚类变换的端到端图像压缩方法,其特征在于:步骤s202中,主编码器ga包括依次连接的一层编码嵌入层和若干个上下文聚类模块,其中相邻两个上下文聚类模块之间设置有特征点缩减模块;

3.如权利要求2所述的基于上下文聚类变换的端到端图像压缩方法,其特征在于:上下文聚类模块的处理步骤如下:

4.如权利要求3所述的基于上下文聚类变换的端到端图像压缩方法,其特征在于:步骤s2021中,对于特征图t1,在若干个特征点的线性投影空间中均匀地选择c个中心,平均其k个近邻特征点的特征作为中心特征;随后通过计算每个特征点与中心特征的成对余弦相似矩阵,将每个特征点分配给最相似的中心,从而得到c个簇。

5.如权利要求3所述的基于上下文聚类变换的端到端图像压缩方法,其特征在于:步骤s2024中,多层感知机模块包括两个全连接层以及连接于两个全连接层之间的激活函数。

6.如权利要求1所述的基于上下文聚类...

【专利技术属性】
技术研发人员:陈芬罗英国彭宗举黄炼韦玮张鹏
申请(专利权)人:重庆理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1