【技术实现步骤摘要】
支持机器学习推理和其他过程的矩阵和向量操纵
[0001]本公开总地涉及具有用于支持各种处理器功能的一个或更多个算术逻辑单元(ALU)的处理器。
技术介绍
[0002]典型的机器学习推理和其他处理功能涉及将矩阵与向量相乘。通常,矩阵保持固定权重,而向量内容是可变的。从计算效率、减少处理时间和/或减少能量消耗的角度来看,对实现这些类型功能的处理器架构的改进(例如,矩阵与向量的相乘)可以提高处理器的整体性能。
附图说明
[0003]图1A示出了根据至少一个实施例的推理和/或训练逻辑;
[0004]图1B示出了根据至少一个实施例的推理和/或训练逻辑;
[0005]图2示出了根据至少一个实施例的神经网络的训练和部署;
[0006]图3示出了根据至少一个实施例的示例数据中心系统;
[0007]图4A示出了根据至少一个实施例的自主车辆的示例;
[0008]图4B示出了根据至少一个实施例的图4A的自主车辆的相机位置和视野的示例;
[0009]图4C是根据至少一个实施例的示出图4 ...
【技术保护点】
【技术特征摘要】
1.一种处理单元,包括:从存储器中读取向量并将所述向量与从向量寄存器的标量字段中提取的标量值相乘的电路,其中,所述标量字段由立即字段值指定,所述立即字段值还用于标识偏移量,所述偏移量用于定义指向所述存储器中要从中读取所述向量的位置的指针。2.根据权利要求1所述的处理单元,还包括:实现逐元素求和的电路,其中,实现所述逐元素求和的所述电路被配置为:接收来自从存储器中读取所述向量并将所述向量与所述标量值相乘的所述电路的输出;通过将目标向量的先前实例与所接收的来自从存储器中读取所述向量并将所述向量与所述标量值相乘的所述电路的所述输出相加来生成所述目标向量;以及存储所述目标向量。3.根据权利要求2所述的处理单元,其中,所述目标向量被存储在所述向量寄存器中。4.根据权利要求3所述的处理单元,其中,所述立即字段值与所述向量的大小相乘,以定义所述指针。5.根据权利要求4所述的处理单元,其中,与所述向量的大小相乘的所述立即字段值被进一步添加到基值以定义所述指针,其中,所述基值是从基址寄存器中提取的。6.根据权利要求1所述的处理单元,其中,所述存储器包括本地高速缓存存储器。7.根据权利要求1所述的处理单元,其中,所述存储器包括与所述电路非常接近的存储器设备。8.根据权利要求1所述的处理单元,其中,所述向量寄存器在所述处理单元的内部。9.根据权利要求8所述的处理单元,其中,所述向量寄存器包括128位寄存器。10.根据权利要求8所述的处理单元,其中,所述向量寄存器包括128位寄存器、256位寄存器和512位寄存器中的至少一个。11.一种系统,包括:存储器,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。