用于神经网络推断的高动态范围（HDR）图像的无损表示制造技术

技术编号：36610567 阅读：12 留言：0更新日期：2023-02-08 09:58

本公开提供了用于神经网络推断的方法、设备和系统。本实施方式更具体地涉及以无损方式对高动态范围（HDR）图像数据执行推断操作。在一些方面中，机器学习系统可接收与输入图像相关联的某个位数（K）的像素数据，且基于每个操作数中的位数（N）将K位细分成M个分区，由人工智能（AI）加速器对操作数进行操作，其中N<K。例如，K位可以表示与输入图像相关联的像素值。在一些实施方式中，AI加速器可以通过将M个分区并行地处理为分别与输入图像的M个通道相关联的数据来基于神经网络执行推断操作。的数据来基于神经网络执行推断操作。的数据来基于神经网络执行推断操作。

全部详细技术资料下载

【技术实现步骤摘要】
用于神经网络推断的高动态范围（HDR）图像的无损表示

[0001]本实施方式总体上涉及神经网络，并且具体地涉及用于神经网络推断的高动态范围（HDR）图像的无损表示。

技术介绍

[0002]机器学习是用于提高计算机系统或应用执行特定任务的能力的技术。机器学习可以分解成两个组成部分：训练和推断。在训练阶段期间，可以向机器学习系统提供一个或多个“答案”和要映射到每个答案的一组或多组原始数据。机器学习系统可以对原始数据执行统计分析以“学习”可以用于描述或再现答案的一组规则（诸如共同的一组特征）或对其进行建模。深度学习是机器学习的特定形式，其中正被训练的模型是多层“神经网络”。在推断阶段期间，机器学习系统可以将规则应用于新数据以生成关于数据的答案或推断。
[0003]训练阶段通常使用对浮点精度输入数据进行操作的专用硬件来执行。相比之下，推断阶段通常在具有有限硬件资源（诸如有限处理器带宽、存储器或功率）的边缘设备上执行。例如，为了提高推断操作的速度和效率，许多边缘设备实现人工智能（AI）加速器（也称为AI处理器），其被专门设计为处理高度并行化的低精度计算。这样的AI加速器可以包括可以被配置为对有限大小的操作数（operand）进行操作的算术逻辑单元（ALU）。
[0004]一些边缘设备可以被配置为对高动态范围（HDR）图像执行推断操作。与HDR图像相关联的每个像素值的长度可以是24位。然而，许多AI加速器只能对8位操作数进行操作。因此，与HDR图像相关联的原始输入数据的每个单元可以大于由AI加速器支持的操作数大小...

【技术保护点】

【技术特征摘要】
1.一种由机器学习系统进行推断的方法，包括：接收与输入图像相关联的位数为K的第一像素数据；基于每个操作数中的位数N将K位细分为M个第一分区，由人工智能AI加速器对所述操作数进行操作，其中N<K，所述AI加速器被配置为将所述M个第一分区并行地处理为分别与所述输入图像的M个通道相关联的数据；以及至少部分地基于所述AI加速器处理所述M个第一分区来执行与所述输入图像相关联的推断操作。2.根据权利要求1所述的方法，其中所述M个第一分区中的每一个第一分区包括所述第一像素数据的至多N位，其中。3.根据权利要求1所述的方法，其中所述M个第一分区中的一个第一分区包括所述第一像素数据的N个最高有效位。4.根据权利要求1所述的方法，其中所述M个第一分区中的一个第一分区包括所述第一像素数据的N个最低有效位。5.根据权利要求1所述的方法，其中所述K位表示与所述输入图像相关联的像素值。6.根据权利要求5所述的方法，其中所述像素值是高动态范围HDR值。7.根据权利要求1所述的方法，还包括：接收与所述输入图像相关联的第二像素数据的K位；以及基于N将所述第二像素数据的K位细分为M个第二分区，所述AI加速器被配置为将所述M个第二分区并行地处理为分别与所述M个通道相关联的数据，所述推断操作还至少部分地基于所述AI加速器处理所述M个第二分区来执行。8.根据权利要求1所述的方法，其中所述推断操作产生具有与所述输入图像相同位数的输出图像。9.一种机器学习系统，包括：人工智能AI加速器，其被配置为执行与输入图像相关联的推断操作；以及位划分电路，其被配置为：接收与所述输入图像相关联的位数为K的第一像素数据；以及基于每个操作数中的位数N将K位细分成M个分区，由所述AI加速器对所述操作数进行操作，其中N<K；其中所述AI加速器被配置为将所述M个第一分区并行地处理为分别与所述输入图像的M个通道相关联的数据，并且至少部分地基于对所述M个第一分区的所述处理来执行所述推断操作。10.根据权利要求9所述的机器学习系统，其中所述M个第一分区中的每一个第一分区包括所述第一像素数据的至多N位，其中。11.根据权利要求9所述的机器学习系...

【专利技术属性】
技术研发人员：K，
申请(专利权)人：辛纳普蒂克斯公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人