当前位置: 首页 > 专利查询>卡尔雷公司专利>正文

同时使用多个处理器来处理矩阵的系统技术方案

技术编号:34005728 阅读:35 留言:0更新日期:2022-07-02 13:19
公开了一种使用多个处理元件对被存储在同一共享存储器中的两个矩阵进行块处理的方法,其中一个矩阵被按行存储,另一个矩阵被按列存储,其中,每个处理元件通过相应的N位访问被连接到共享存储器,并通过双向N位点对点链路被连接到第一相邻处理元件。该方法包括在一个处理器指令周期中执行的以下步骤:在处理元件中,通过相应的存储器访问,接收两个矩阵中的同一个矩阵的相应的不同N位段;以及借助于对应的点对点链路,与第一相邻处理元件交换两个矩阵中的第一矩阵的N位段,该N位段是在前一个指令周期中在相邻的处理元件中被接收的。个指令周期中在相邻的处理元件中被接收的。个指令周期中在相邻的处理元件中被接收的。

【技术实现步骤摘要】
同时使用多个处理器来处理矩阵的系统


[0001]本专利技术涉及数字表示的数的矩阵的乘法,尤其涉及由专用硬件加速器辅助以用于矩阵运算的处理器。

技术介绍

[0002]人工智能技术,尤其是深度学习,在大矩阵的乘法方面要求特别高,其中大矩阵可以有几百行和几百列。因此,专用于矩阵乘法的硬件加速器应运而生。
[0003]大矩阵的乘法通常是分块进行的,即,通过将矩阵分解成大小适合计算资源的子矩阵。因此,加速器被设计以有效地计算这些子矩阵的乘积。
[0004]专用于矩阵乘法的硬件加速器面临若干挑战,这些挑战与向加速器的计算单元提供被存储在共享存储器中的矩阵数据而不导致计算单元饥饿或利用不足有关。例如,存储器中的数据存储格式可能与计算单元所需的格式不匹配,以使得可能引入延迟和数据缓冲器以对数据重排序。
[0005]Kalray的专利申请US2020/0201642公开了一种处理器架构,该处理器架构包含紧密耦合的协处理器,该协处理器包括它自己的寄存器文件并实现用于在存储器与协处理器寄存器之间传递数据的特殊机制。由于专用指令集,因此,处理器本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种使用多个处理元件对被存储在同一共享存储器中的两个矩阵进行块处理的方法,其中一个矩阵被按行存储,另一个矩阵被按列存储,其中,每个处理元件通过相应的N位访问被连接到所述共享存储器,并且通过双向N位点对点链路被连接到第一相邻处理元件,所述方法包括在一个处理器指令周期中执行的以下步骤:在所述处理元件中,通过相应的存储器访问来接收所述两个矩阵中的同一个矩阵的相应的不同N位段;以及在给定处理元件与它的第一相邻处理元件之间,借助于对应的点对点链路交换所述两个矩阵中的第一矩阵的N位段,所述第一矩阵的N位段是在前一个指令周期中在所述处理元件中被接收的。2.根据权利要求1所述的方法,其中,每个处理元件通过相应的双向N位点对点链路被连接到第二相邻处理元件,所述方法包括在后续的指令周期中执行的以下步骤:在所述处理元件中,通过相应的存储器访问来接收所述两个矩阵中的同一个矩阵的相应的不同N位段;以及在给定处理元件与它的第二相邻处理元件之间,借助于对应的点对点链路交换所述两个矩阵中的第二矩阵的N位段,所述第二矩阵的N位段是在前一个指令周期中在所述处理元件中被接收的。3.根据权利要求1所述的方法,其中,每个所接收的N位段包含分别属于M个N位子矩阵的M行或列,每个子矩阵具有偶数R个行或列,其中,R可被M整除,所述方法包括以下步骤:重复所述接收或交换步骤R次,并...

【专利技术属性】
技术研发人员:B
申请(专利权)人:卡尔雷公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1