用于神经网络推断的高动态范围(HDR)图像的无损表示制造技术

技术编号:36610567 阅读:12 留言:0更新日期:2023-02-08 09:58
本公开提供了用于神经网络推断的方法、设备和系统。本实施方式更具体地涉及以无损方式对高动态范围(HDR)图像数据执行推断操作。在一些方面中,机器学习系统可接收与输入图像相关联的某个位数(K)的像素数据,且基于每个操作数中的位数(N)将K位细分成M个分区,由人工智能(AI)加速器对操作数进行操作,其中N<K。例如,K位可以表示与输入图像相关联的像素值。在一些实施方式中,AI加速器可以通过将M个分区并行地处理为分别与输入图像的M个通道相关联的数据来基于神经网络执行推断操作。的数据来基于神经网络执行推断操作。的数据来基于神经网络执行推断操作。

【技术实现步骤摘要】
用于神经网络推断的高动态范围(HDR)图像的无损表示


[0001]本实施方式总体上涉及神经网络,并且具体地涉及用于神经网络推断的高动态范围(HDR)图像的无损表示。

技术介绍

[0002]机器学习是用于提高计算机系统或应用执行特定任务的能力的技术。机器学习可以分解成两个组成部分:训练和推断。在训练阶段期间,可以向机器学习系统提供一个或多个“答案”和要映射到每个答案的一组或多组原始数据。机器学习系统可以对原始数据执行统计分析以“学习”可以用于描述或再现答案的一组规则(诸如共同的一组特征)或对其进行建模。深度学习是机器学习的特定形式,其中正被训练的模型是多层“神经网络”。在推断阶段期间,机器学习系统可以将规则应用于新数据以生成关于数据的答案或推断。
[0003]训练阶段通常使用对浮点精度输入数据进行操作的专用硬件来执行。相比之下,推断阶段通常在具有有限硬件资源(诸如有限处理器带宽、存储器或功率)的边缘设备上执行。例如,为了提高推断操作的速度和效率,许多边缘设备实现人工智能(AI)加速器(也称为AI处理器),其被专门设计为处理高度并行化的低精度计算。这样的AI加速器可以包括可以被配置为对有限大小的操作数(operand)进行操作的算术逻辑单元(ALU)。
[0004]一些边缘设备可以被配置为对高动态范围(HDR)图像执行推断操作。与HDR图像相关联的每个像素值的长度可以是24位。然而,许多AI加速器只能对8位操作数进行操作。因此,与HDR图像相关联的原始输入数据的每个单元可以大于由AI加速器支持的操作数大小。因此,为了对HDR图像执行推断操作,一些边缘设备可以将每个24位像素值量化成8位值,这导致输入数据中的信息或精度的损失。这种信息损失可能导致不准确的推断结果,例如,以噪声或其他误差的形式。

技术实现思路

[0005]提供本
技术实现思路
是为了以简化的形式介绍下面在具体实施方式中进一步描述的概念的选择。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在限制所要求保护的主题的范围。
[0006]本公开的主题的一个创新方面可以在由机器学习系统进行推断的方法中实现。该方法包括以下步骤:接收与输入图像相关联的某一位数(K)的像素数据;基于每个操作数中的位数(N)将K位细分为某一数目(M)的分区,由人工智能(AI)加速器对操作数进行操作,其中N<K,并且其中AI加速器被配置为将M个分区并行地处理为分别与输入图像的M个通道相关联的数据;以及至少部分地基于AI加速器处理M个分区来执行与输入图像相关联的推断操作。
[0007]本公开的主题的另一创新方面可以在包括AI加速器和位划分电路的机器学习系统中实现。AI加速器被配置为执行与输入图像相关联的推断操作。位划分电路被配置为接收与输入图像相关联的某一位数(K)的像素数据;并且基于每个操作数中的位数(N)将K位
细分为某一数目(M)的分区,由人工智能(AI)加速器对操作数进行操作,其中N<K,并且其中AI加速器被配置为将M个分区并行地处理为分别与输入图像的M个通道相关联的数据,并且至少部分地基于对M个分区的处理来执行推断操作。
[0008]本公开的主题的另一创新方面可以在训练神经网络的方法中实现。该方法包括以下步骤:接收与描绘场景的输入图像相关联的某一位数(K)的像素数据;接收场景的代表性图像;基于每个操作数中的位数(N)将K位细分为某一数目(M)的分区,由人工智能(AI)加速器对操作数进行操作,该AI加速器被配置用于基于神经网络进行推断,其中N<K;以及训练神经网络以将M个分区并行处理为分别与M个通道相关联的数据,以及至少部分地基于对M个分区的处理来再现代表性图像。
附图说明
[0009]本实施方式通过示例的方式示出,并且不旨在受附图中的图的限制。
[0010]图1示出了根据一些实施方式的示例图像捕获和显示系统的框图。
[0011]图2示出了根据一些实施方式的示例图像处理器的框图。
[0012]图3示出了根据一些实施方式的示例机器学习系统的框图。
[0013]图4A示出了由像素值阵列形成的示例输入图像。
[0014]图4B示出了由跨多个通道划分的像素值阵列形成的示例输入图像。
[0015]图5示出了根据一些实施方式的示例机器学习系统的框图。
[0016]图6示出了根据一些实施方式的描绘示例推断操作的说明性流程图。
[0017]图7示出了描绘根据一些实施方式的用于训练神经网络的示例操作的说明性流程图。
具体实施方式
[0018]在以下描述中,阐述了许多具体细节,诸如具体部件、电路和过程的示例,以提供对本公开的透彻理解。如本文所使用的术语“耦合”意指直接连接到或通过一个或多个中间部件或电路连接。术语“电子系统”和“电子设备”可以互换使用,以指代能够电子地处理信息的任何系统。此外,在以下描述中并且出于解释的目的,阐述了具体命名法以提供对本公开的各方面的透彻理解。然而,对于本领域技术人员将显而易见的是,可以不需要这些具体细节来实践示例实施例。在其他实例中,以框图形式示出了公知的电路和设备,以避免使本公开模糊不清。以下详细描述的一些部分是根据对计算机存储器内的数据位的操作的过程、逻辑块、处理和其他符号表示来呈现的。
[0019]这些描述和表示是数据处理领域的技术人员用来最有效地将他们工作的实质传达给本领域其他技术人员的手段。在本公开中,过程、逻辑块、进程等被认为是导致期望结果的步骤或指令的自洽序列。这些步骤是需要对物理量进行物理操纵的步骤。通常,尽管不一定,这些量采取能够在计算机系统中存储、传送、组合、比较和以其他方式操纵的电信号或磁信号的形式。然而,应当记住,所有这些和类似术语将与适当的物理量相关联,并且仅仅是应用于这些量的方便标签。
[0020]除非另有明确说明,否则如从以下讨论中显而易见的是,应当理解,在整个本申请中,利用诸如“访问”、“接收”、“发送”、“使用”、“选择”、“确定”、“归一化”、“相乘”、“平均”、

监视”、“比较”、“应用”、“更新”、“测量”、“导出”等术语的讨论是指计算机系统、或类似电子计算设备的动作和过程,其将表示为计算机系统的寄存器和存储器内的物理(电子)量的数据操纵和转换成类似地表示为计算机系统存储器或寄存器或其他这样的信息存储、传输或显示设备内的物理量的其他数据。
[0021]在附图中,单个框可以被描述为执行一个或多个功能;然而,在实际实践中,由该框执行的一个或多个功能可以在单个部件中或跨多个部件执行,和/或可以使用硬件、使用软件、或使用硬件和软件的组合来执行。为了清楚地说明硬件和软件的这种可互换性,下面已经在其功能性方面对各种说明性的部件、块、模块、电路和步骤进行了总体描述。这种功能性是实现为硬件还是软件取决于特定应用以及强加于整个系统的设计约束。所属领域的技术人员可针对每个特定应用以不同方式实现所描述的功能性,但不应将这样的实施方式决策解本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种由机器学习系统进行推断的方法,包括:接收与输入图像相关联的位数为K的第一像素数据;基于每个操作数中的位数N将K位细分为M个第一分区,由人工智能AI加速器对所述操作数进行操作,其中N<K,所述AI加速器被配置为将所述M个第一分区并行地处理为分别与所述输入图像的M个通道相关联的数据;以及至少部分地基于所述AI加速器处理所述M个第一分区来执行与所述输入图像相关联的推断操作。2.根据权利要求1所述的方法,其中所述M个第一分区中的每一个第一分区包括所述第一像素数据的至多N位,其中。3.根据权利要求1所述的方法,其中所述M个第一分区中的一个第一分区包括所述第一像素数据的N个最高有效位。4.根据权利要求1所述的方法,其中所述M个第一分区中的一个第一分区包括所述第一像素数据的N个最低有效位。5.根据权利要求1所述的方法,其中所述K位表示与所述输入图像相关联的像素值。6.根据权利要求5所述的方法,其中所述像素值是高动态范围HDR值。7.根据权利要求1所述的方法,还包括:接收与所述输入图像相关联的第二像素数据的K位;以及基于N将所述第二像素数据的K位细分为M个第二分区,所述AI加速器被配置为将所述M个第二分区并行地处理为分别与所述M个通道相关联的数据,所述推断操作还至少部分地基于所述AI加速器处理所述M个第二分区来执行。8.根据权利要求1所述的方法,其中所述推断操作产生具有与所述输入图像相同位数的输出图像。9.一种机器学习系统,包括:人工智能AI加速器,其被配置为执行与输入图像相关联的推断操作;以及位划分电路,其被配置为:接收与所述输入图像相关联的位数为K的第一像素数据;以及基于每个操作数中的位数N将K位细分成M个分区,由所述AI加速器对所述操作数进行操作,其中N<K;其中所述AI加速器被配置为将所述M个第一分区并行地处理为分别与所述输入图像的M个通道相关联的数据,并且至少部分地基于对所述M个第一分区的所述处理来执行所述推断操作。10.根据权利要求9所述的机器学习系统,其中所述M个第一分区中的每一个第一分区包括所述第一像素数据的至多N位,其中。11.根据权利要求9所述的机器学习系...

【专利技术属性】
技术研发人员:K
申请(专利权)人:辛纳普蒂克斯公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1