使用特征图减小来编解码机器视觉数据的方法和设备技术

技术编号：39416619 阅读：8 留言：0更新日期：2023-11-19 16:07

公开了一种用于使用特征图的减小对机器视觉数据进行编解码的设备和方法。为了减小由机器任务专用深度学习模型提取的特征图的大小，提供一种机器视频编解码(VCM)编解码设备和方法。VCM编解码设备和方法利用减小特征图的空间和通道方面的冗余的稀疏方法，并且VCM编解码设备和方法也利用基于张量分解的特征图分解方法。图分解方法。图分解方法。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用特征图减小来编解码机器视觉数据的方法和设备

[0001]本公开涉及一种用于使用特征图减小来编解码机器视觉数据的设备和方法
。

技术介绍

[0002]该部分中的陈述仅提供与本公开相关的背景信息，并且不一定构成现有技术
。
[0003]随着深度学习技术和计算能力的进步，伴随着机器视觉应用的激增，机器逐渐实现为利用大部分视频业务
。
机器对机器应用预期在未来占据互联网视频流量的最大部分
。
因此，优化机器所使用的视频数据中的信息的方式可能是视频处理技术的创新和新解决方案的商业化的关键因素
。
[0004]现有视频编解码方案针对人类视觉进行优化，因为现有视频编解码方案针对某些比特率约束下的最佳图片或视频质量
。
相对照地，对于机器视觉的编解码，重构的图像
/
视频不一定必须保持高视觉性能
。
在延时和规模上具有严格限制的

(
包括连接的车辆
、
物联网
(IoT)
装置
、
超大型视频监控网络
、
智能城市
、
质量检查等
)
的出现引领了用于机器视觉的新范例，从而严格地需要针对机器视觉的新图像
/
视频编解码方法
。
[0005]因而，运动图像专家组
(MPEG)——
标准化组织讨论了机器视觉的标准化的需要，导致提出作为下一代视频编解码...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种由机器视觉编码设备执行的用于对特征图进行编码的编码方法，所述编码方法包括：使用深度学习模型从输入图像提取所述特征图，其中，所述特征图从所述深度学习模型的中间层生成；通过减小所述特征图的大小来生成减小的特征图；通过转换所述减小的特征图的数据类型并重新布置所述减小的特征图来生成转换的特征图；以及通过使用视频编码器编码所述转换的特征图而生成比特流
。2.
根据权利要求1所述的编码方法，其中，所述特征图包括：与存在的通道同样多的具有相等高度和相等宽度的
2D
特征图
。3.
根据权利要求1所述的编码方法，其中，生成所述减小的特征图包括：基于所述特征图的空间或通道方面的特征图稀疏化来减小所述特征图
。4.
根据权利要求3所述的编码方法，其中，生成所述减小的特征图包括：用所述特征图稀疏化和组合的张量分解来减小所述特征图
。5.
根据权利要求3所述的编码方法，其中，生成所述减小的特征图包括：当构成所述特征图的
2D
特征图具有特征值小于预设阈值的区域时，将所述区域的特征值设置为零
。6.
根据权利要求3所述的编码方法，其中，生成所述减小的特征图包括：计算具有预设通道跨度的两个
2D
特征图之间的距离；选择具有小于预设阈值的距离的所有
2D
特征图对；以及对于所选的所有对中的每一者，将一个
2D
特征图的所有值稀疏化为零或删除所述一个
2D
特征图
。7.
根据权利要求6所述的编码方法，其中，生成所述比特流包括：在所述一个
2D
特征图被稀疏化时对稀疏的
2D
特征图和所述预设通道跨度进行编码；或当所述一个
2D
特征图被删除时，对所删除的
2D
特征图的索引和所述预设通道跨度进行编码
。8.
根据权利要求1所述的编码方法，其中，生成所述减小的特征图包括：基于张量分解来减小所述特征图
。9.
根据权利要求8所述的编码方法，其中，生成所述减小的特征图包括：通过使用
Tucker
分解将所述特征图分解成一个核张量和三个因子矩阵
。10.
根据权利要求8所述的编码方法，其中，生成所述减小的特征图包括：通过使用规范多元分解
(CP)
将所述特征图分解成
P
个秩1张量
(
其中，
P
是自然数
)。11.
一种机器视觉编码设备，包括：特征提取器，被配置为使用深度学习模型从输入图像中提取特征图，其中，所述特征图从所述深度学习模型的中间层生成；特征减小器，被配置为减小所述特征图的大小以生成减小的特征图；预量化器，被配置为量化所述减小的特征图以转换所述减小的特...

【专利技术属性】
技术研发人员：姜制远，兪彩花，朴胜煜，
申请(专利权)人：起亚株式会社梨花女子大学校产学协力团，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人