一种面向机器视觉和人眼视觉的图像压缩系统技术方案

技术编号:39410903 阅读:25 留言:0更新日期:2023-11-19 16:02
本发明专利技术公开了一种面向机器视觉和人眼视觉的图像压缩系统,属于图像压缩技术领域,包括:编码器用于获取原始图像的编码特征;量化模块用于对编码特征进行量化处理;先验网络和预测器模块用于基于编码特征,生成第一选择矩阵

【技术实现步骤摘要】
一种面向机器视觉和人眼视觉的图像压缩系统


[0001]本专利技术属于图像压缩
,更具体的说是涉及一种面向机器视觉和人眼视觉的图像压缩系统


技术介绍

[0002]近年来,面向机器视觉和人眼视觉的图像压缩技术正逐步发展

一部分方法在优化机器视觉任务的同时造成了人眼视觉的损失

然而,重建图像的人眼视觉效果为图像压缩方法不可或缺的性能评价指标

因此,另一部分方法通过可扩展压缩的方法在提升机器视觉性能的同时,避免了人眼视觉的下降

但是,该方法不具有通用性,即仅仅针对单一机器视觉任务或单一压缩方法

面对如今各种各样的机器视觉任务和不断改进的图像压缩算法,非通用性的方法难以应对多种机器视觉任务,同时会因为无法适配后续更先进的压缩方法而被淘汰

[0003]与本专利申请最为接近的现有技术包括:
[0004]文献1:
Torfason R,Mentzer F,Agustsson E,et al.Towards I本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种面向机器视觉和人眼视觉的图像压缩系统,其特征在于,包括:编码器

量化模块

先验网络和预测器模块

划分模块

传输模块

重建和聚合模块,以及解码器;所述编码器,用于对原始图像进行编码处理,获得编码特征;所述量化模块,用于对所述编码特征进行量化处理,获得量化特征;所述先验网络和预测器模块,用于基于所述编码特征,生成第一选择矩阵

第二选择矩阵和先验信息;所述划分模块,用于通过所述第一选择矩阵和第二选择矩阵,对所述量化特征进行划分,得到用于机器任务的第一特征和用于人眼视觉的第二特征;所述传输模块,用于利用所述先验信息,分别将所述第一特征和所述第二特征进行无损算数编码得到比特流,将所述比特流传输到解码端,在所述解码端通过无损算数解码将所述比特流还原为第一解码特征和第二解码特征;所述重建和聚合模块,用于对所述第一解码特征和所述第二解码特征进行重建和聚合处理后,发送至所述解码器,由所述解码器分别还原为用于机器视觉的图片和用于人眼视觉的图片
。2.
根据权利要求1所述的面向机器视觉和人眼视觉的图像压缩系统,其特征在于,还包括:机器视觉任务网络;所述机器视觉任务网络,用于接收所述用于机器视觉的图片,并对所述最终用于机器视觉的图片进行分析处理,获得图片在指定机器任务上的结果
。3.
根据权利要求1所述的面向机器视觉和人眼视觉的图像压缩系统,其特征在于,所述先验网络和预测器模块,包括先验网络

预测器和数据处理层;所述先验网络,用于获取所述编码特征的先验信息;所述预测器,用于基于所述编码特征的先验信息,预测所述编码特征的第一选择矩阵和第二选择矩阵;所述数据处理层,用于将所述编码特征的先验信息与所述第一选择矩阵对应的元素相乘,获得所述第一特征的先验信息;还用于将所述编码特征的先验信息与所述第二选择矩阵对应的元素相乘,获得所述第二特征的先验信息
。4.
根据权利要求3所述的面向机器视觉和人眼视觉的图像压缩系统,其特征在于,所述预测器,用于基于所述先验信息,预测所述编码特征的第一选择矩阵和第二选择矩阵,具体包括:采用所述预测器基于所述先验信息来预测所述编码特征中每一个元素的两个可能性;若该元素的第一可能性大于或等于第二可能性,则将该元素用于机器任务,且将第一选择矩阵中对应位置的元素设置为1;若该元素的第一可能性小于第二可能性,则不将该元素用于机器任务,且将第一选择矩阵中对应位置的元素设置为0;通过1减去所述第一选择矩阵,得到所述第二选择矩阵
。5.
根据权利要求1或3任一项所述的面向机器视觉和人眼视觉的图像压缩系统,其特征在于,所述先验信息包括预测均值和预测方差
。6.
根据权利要求3所述的面向机器视觉和人眼视觉的图像压缩系统,其特征在于,所述预测器包括3个标准卷积层
、2
个激活函数层和1个最大值选取层

7.
根据权利要求6所述的面向机器视觉和人眼视觉的图像压缩系统,其特征在于,所述最大值选取层采用
Gumbel

...

【专利技术属性】
技术研发人员:刘磊胡智昊请求不公布姓名
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1