当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法技术

技术编号:40422301 阅读:24 留言:0更新日期:2024-02-20 22:41
本发明专利技术涉及一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,包括:将屏幕内容图像预处理后输入训练后的端到端图像压缩模块中实现屏幕内容图像的编码和解码,其中,利用两阶段八度卷积残差块进行频率分解,提取特征的高频和低频信息;同时,利用级联多尺度残差块进行跨尺度学习,并结合基于窗口的注意力模块来捕获高对比度信息。与其他方法相比,在解码图像的客观评价指标PSNR相同的条件下,本发明专利技术的编码码率更低,说明本发明专利技术提出的方法具有更好的编码性能,即可以使用更低的码率获得更好的图像质量。

【技术实现步骤摘要】

本专利技术涉及一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,属于图像处理。


技术介绍

1、目前,互联网中的图像与视频内容以惊人的速度逐年递增,而云计算和远程技术的快速发展使得屏幕内容图像的占比也在逐年递增。特别是近年来,在线会议、远程控制和协作、直播共享、云游戏等逐渐成为人们日常生活中进行学习和娱乐的重要手段。如何对海量的屏幕内容(sc)进行编码与传输成为一个亟待解决的问题。传统图像压缩算法已经经历了几十年的发展,产生了许多经典的编码标准,如h.264/avc,h.265/hevc,h.266/vvc等。而近年来基于学习的图像编码算法展示出了优秀的潜力,在率失真性能方面超越了最新的编码标准vvc。但目前绝大多数基于学习的图像压缩算法都是针对自然图像的编码进行研究,而没有考虑到屏幕内容图像的特点进行设计。传统的图像编码方案更关注对自然场景内容编码而忽略了屏幕内容,后者具有明显区别于前者的特性,包括无噪声、高对比度、边缘锐利等。

2、与通过传统摄像设备捕捉的自然场景(ns)图像不同,屏幕内容是由计算机生成的,包括文本、表格、本文档来自技高网...

【技术保护点】

1.一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,其特征在于,端到端图像压缩模块包括基础编码器ga、基础解码器gs、超先验编码器ha、超先验解码器hs、量化单元、算术编码器AE、算术解码器AD、熵参数模型和上下文模型;

3.根据权利要求2所述的一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,其特征在于,基础编码器模块ga包括一个广义八度卷积块、四个两阶段八度卷积残差块、四个级联多尺度残差块和两个基于窗口的注...

【技术特征摘要】

1.一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,其特征在于,端到端图像压缩模块包括基础编码器ga、基础解码器gs、超先验编码器ha、超先验解码器hs、量化单元、算术编码器ae、算术解码器ad、熵参数模型和上下文模型;

3.根据权利要求2所述的一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,其特征在于,基础编码器模块ga包括一个广义八度卷积块、四个两阶段八度卷积残差块、四个级联多尺度残差块和两个基于窗口的注意力模块;级联多尺度残差块使用不同大小的卷积核提取多尺度信息,基于窗口的注意力模块包括窗口注意力块和残差块;

4.根据权利要求2所述的一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法,其特征在于,超先验解码器hs包括三个两阶段八度卷积残差块,与超先验解码器hs对称,其中,卷积使用转置卷积;

5.根据权利要求1所述的一种基于多尺度残差和窗口注意力的两阶段八度卷积的屏幕内容图像压缩方法...

【专利技术属性】
技术研发人员:元辉姜世奇付丛睿吕文芮
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1