【技术实现步骤摘要】
提高计算机视觉应用的量化能力的设备、方法和装置
[0001]本公开大体涉及用于光学设备中的设备
、
方法和装置,并且更具体地,涉及用于提高计算机视觉应用的处理能力的设备
、
方法和装置
。
技术介绍
[0002]量化是将连续无限值映射到较小的离散有限值集合的过程
。
量化过程的典型示例是舍入和截断
。
输入值与其量化值之间的差
(
例如,舍入误差
)
称为量化误差
。
执行量化的设备或算法功能称为量化器
。
[0003]神经网络量化是降低神经网络中权重和张量的精度的过程,从而减少内存
、
计算和能量带宽
。
量化过程必须参考以下限制和约束:
[0004]1.
结果准确度
—
应用量化程序后的神经网络方案的结果必须接近通过应用浮点运算计算出的结果
。
[0005]2.
量化方案必须考虑神经网络执行引擎中实现 ...
【技术保护点】
【技术特征摘要】
1.
一种计算平台,用于多个通道的量化过程中,所述多个通道承载从图像捕获传感器接收的数据,其中,所述计算平台包括:至少一个处理器阵列,被配置为:从以下各项获取数据:神经网络图,与从所述图像捕获传感器接收的数据通道相关联的数据集,以及神经网络模型的参数值;对接收的并使用所述神经网络图的通道执行动态范围校准过程,以从中导出与各个通道相关联的分组约束;基于从每个给定通道的相应动态范围校准过程和分组约束为每个给定通道获得的结果来执行分组优化;对承载数据的通道进行布置,使得具有相似的分组约束的通道被一起分组到一个输出通道中;以及计算用于执行输出通道的量化过程所需的量化参数,所述输出通道承载从所述图像捕获传感器接收的数据
。2.
根据权利要求1所述的计算平台,包括处理元件的至少一个宏阵列,其中,所述至少一个宏阵列中的每一个包括处理元件的多个基本阵列,并且其中,所述多个基本阵列中的每一个包括多个处理元件,并且所述至少一个宏阵列
、
所述多个基本阵列和所述多个处理元件以分层的层级顺序布置
。3.
根据权利要求1所述的计算平台,其中,所述多个通道中的每一个是8位通道,并且其中,所述至少一个处理器阵列被配置为将多个所述8位通道分组到输出通道中
。4.
根据权利要求1所述的计算平台,其中,所述分组约束是由以下各项组成的约束组中的至少两个:
i)
每个输入通道的输入特征图分布;
ii)
每个输出通道的输出特征图分布;以及
iii)
每个输出通道的每个输入的权重分布,其中,每个输入通道与输出通道分布的向量相关联
。5.
根据权利要求1所述的计算平台,其中,所述至少一个处理器阵列被配置为通过实现以下选项中的一个来对所述多个通道进行分组:
i)
实现单一分组方法,按照所述单一分组方法,在一个层处包括在特定组中的所有通道将保持在同一组中,同时将下一层的输入通道分组到下一层输出通道中;或者
ii)
将经重新分组的层添加到至少一些输出通道,所述至少一些输出通道被转发到上层以用作所述上层处的输入通道;或者
iii)
将转发到下一层的组链划分为多个子链,并在任意两个后续的子链之间添加经重新分组的层
。6.
一种方法,用于多个通道的量化过程中,所述多个通道承载从图像捕获传感器接收的数据,其中,所述方法包括以下步骤:从以下各项获取数据:神经网络图,
与从所述图像捕获传感器接收的数据通道相关联的数据集,以及神经网络模型的参数值;对接收的并使用所述神经网络图的通道执行动态范围校准过程,以从中导出与各个通道相关联的分组约束;基于从每个给定通道的相应动态范围校准过程和分组约束为每个给定通道获得的结果来执行分组优化;对承载数据的通道进...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。