编解码方法、装置、设备及介质制造方法及图纸

技术编号:38432151 阅读:24 留言:0更新日期:2023-08-11 14:19
本公开提供了一种编解码方法、装置、设备及介质,涉及机器视觉的编解码技术领域。编码方法包括:从图像中提取得到第一特征图;根据第一特征图的通道间的重要性,对第一特征图进行加权,得到第二特征图;对第二特征图进行通道降维,得到第三特征图,第三特征图的特征通道数量小于第一特征图的通道数量;基于第三特征图进行量化及编码后,得到编码数据。根据本公开实施例,能够针对从图像中提取得到第一特征图进行特征压缩,并且可以选择降维后的通道数来灵活平衡任务性能与压缩效率。数来灵活平衡任务性能与压缩效率。数来灵活平衡任务性能与压缩效率。

【技术实现步骤摘要】
编解码方法、装置、设备及介质


[0001]本公开涉及机器视觉的编解码
,尤其涉及一种编解码方法、装置、设备及介质。

技术介绍

[0002]传统的视频编解码技术面向人类视觉,以均方差、峰值信噪比、结构相似性作为衡量保真度的评价指标来优化编解码算法。在二十余年的发展中,传统视频编解码框架算法已经趋于成熟,并被广泛应用于各种领域(直播,短视频,视频监控等)。
[0003]随着深度学习的普及,越来越多的视频图像被机器接收而非人类。然而图像视频的保真度与机器视觉的任务性能之间虽然有一定相关性,却并不完全贴合。所以传统以保真度为评价指标优化的编解码算法并不是机器视觉应用场景下的最优解。图像视频在经过数量庞大的卷积核进行卷积操作后产生的特征层数据量巨大,导致传统的特征编码算法压缩效率不高。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供一种编解码方法、装置、设备及介质,至少在一定程度上本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种编码方法,其特征在于,包括:从图像中提取得到第一特征图;根据所述第一特征图的通道间的重要性,对所述第一特征图进行加权,得到第二特征图;对所述第二特征图进行通道降维,得到第三特征图,所述第三特征图的特征通道数量小于所述第一特征图的通道数量;基于所述第三特征图进行量化及编码后,得到编码数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述第三特征图的每个位置的重要性,对所述第三特征图进行加权,得到第四特征图;对所述第四特征图进行空间降维,得到第五特征图,所述第五特征图的高小于所述第四特征图的高,且所述第五特征图的宽小于所述第四特征图的宽;所述基于所述第三特征图进行量化及编码后,发送至解码端,包括:基于所述第五特征图进行量化及编码后,发送至解码端。3.根据权利要求2所述的方法,其特征在于,所述根据所述第三特征图的每个位置的重要性,对所述第三特征图进行加权,得到第四特征图,包括:将所述第三特征图中同位置的所有通道求和,并基于Softmax逻辑回归模型来学习每个位置的重要性;根据学习到的所述每个位置的重要性,对所述第三特征图的每个位置进行加权,得到第四特征图。4.根据权利要求2所述的方法,其特征在于,所述对所述第四特征图进行空间降维,得到第五特征图,包括:通过步长大于1的卷积核来对所述第四特征图进行空间维度的降维,得到第五特征图。5.根据权利要求2所述的方法,其特征在于,所述第二特征图的特征尺度与所述第一特征图的特征尺度相同;所述第四特征图的特征尺度与所述第三特征图的特征尺度相同。6.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征图的通道间的重要性,对所述第一特征图进行加权,得到第二特征图,包括:经过全局均值池化和全连接学习所述第一特征图通道间的重要性;根据学习到的所述第一特征图的通道间的重要性,对所述第一特征图中的通道进行加权,得到第二特征图。7.根据权利要求1所述的方法,其特征在于,所述对所述第二特征图进行通道降维,得到第三特征图,包括:利用通道数比所述第二特征图的通道数小的卷积神经网络,对所述第二...

【专利技术属性】
技术研发人员:王翰铭韩韬王慧芬张园杨明川
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1