一种用于执行矩阵加/减运算的装置和方法制造方法及图纸

技术编号:26170071 阅读:27 留言:0更新日期:2020-10-31 13:36
本公开提供了一种用于执行矩阵加减运算的装置,其特征在于,包括:存储单元,用于存储矩阵运算指令相关的矩阵数据;寄存器单元,用于存储矩阵运算指令相关的标量数据;控制单元,用于对矩阵运算指令进行译码,并控制矩阵运算指令的运算过程;矩阵运算单元,用于根据译码后的矩阵运算指令,对输入矩阵进行矩阵加减运算操作;其中,所述矩阵运算单元为定制的硬件电路。本公开还提供了一种执行矩阵加减法运算的方法。

【技术实现步骤摘要】
一种用于执行矩阵加/减运算的装置和方法
本公开涉及计算机领域,尤其涉及一种用于执行矩阵加减法运算的装置和方法。
技术介绍
当前计算机领域,伴随着大数据、机器学习等新兴技术的成熟,越来越多的任务中包含了各种各样的矩阵加减法运算,尤其是大矩阵的加减法运算,这些往往成为算法速度和效果提高的瓶颈。、在现有技术中,一种进行矩阵加减法运算的已知方案是使用通用处理器,该方法通过通用寄存器堆和通用功能部件来执行通用指令,从而执行矩阵加减法运算。然而,该方法的缺点之一是单个通用处理器多用于标量计算,在进行矩阵运算时运算性能较低。而使用多个通用处理器并行执行时,处理器的个数较少提升的效果不做够显著;处理器个数较高时它们之间的相互通讯又有可能成为性能瓶颈。在另一种现有技术中,使用图形处理器(GPU)来进行一系列矩阵加减法运算,其中,通过使用通用寄存器堆和通用流处理单元执行通用SIMD指令来进行运算。但在上述方案中,GPU片上缓存太小,在进行大规模矩阵运算时需要不断进行片外数据搬运,片外带宽成为了主要性能瓶颈。在另一种现有技术中,使用专门定制的本文档来自技高网...

【技术保护点】
1.一种用于执行矩阵加减运算的装置,其特征在于,包括:/n控制单元,用于读取矩阵运算指令并进行译码,并控制矩阵运算指令的运算过程,其中,所述矩阵运算指令包括至少一个操作域和操作码,所述操作域包括第一输入矩阵地址和第二输入矩阵地址;/n矩阵运算单元,用于获取经过所述控制单元译码的矩阵运算指令,根据所述第一输入矩阵地址和所述第二输入矩阵地址获取两个指定大小的输入矩阵,接着,根据矩阵运算指令的操作码对获取的输入矩阵进行矩阵加法操作或矩阵减法操作。/n

【技术特征摘要】
1.一种用于执行矩阵加减运算的装置,其特征在于,包括:
控制单元,用于读取矩阵运算指令并进行译码,并控制矩阵运算指令的运算过程,其中,所述矩阵运算指令包括至少一个操作域和操作码,所述操作域包括第一输入矩阵地址和第二输入矩阵地址;
矩阵运算单元,用于获取经过所述控制单元译码的矩阵运算指令,根据所述第一输入矩阵地址和所述第二输入矩阵地址获取两个指定大小的输入矩阵,接着,根据矩阵运算指令的操作码对获取的输入矩阵进行矩阵加法操作或矩阵减法操作。


2.根据权利要求1所述装置,其特征在于,所述矩阵运算单元包括多个并行的标量加减运算器,所述操作域还包括输入矩阵长度,其中,
所述输入矩阵长度等于标量加减运算器的个数,用于指示输入矩阵的大小,所述矩阵运算单元还用于根据所述输入矩阵地址和所述输入矩阵长度获得指定大小的输入矩阵。


3.根据权利要求2所述装置,其特征在于,所述输入矩阵运算单元在对应的标量运算器中执行加法或减法运算,每次计算矩阵数据中的一部分,并最终完成整个矩阵的加法或减法运算。


4.根据权利要求2所述的装置,其特征在于,所述装置还包括:
寄存器单元,用于存储矩阵地址,其中,所述矩阵地址为矩阵在所述存储单元中存储的地址;
所述操作域的形式是立即数和/或寄存器号,指示矩阵运算相关的标量数据,其中寄存器号用于指向所述寄存器单元地址。


5.根据权利要求2所述的装置,其特征在于,所述装置还包括:
存储单元,用于存储矩阵数据或计算结果数据。


6.如权利要求1所述的装置,其特征在于,所述控制单元包括:
指令队列模块,用于对译码后的矩阵运算指令进行顺序存储,并获取矩阵运算指令相关的标量数据。


7.如权利要求1所述的装置,其特征在于,所述控制单元包括:
依赖关系处理单元,用于在矩阵运算单元获取当前矩阵运算指令前,判断当前矩阵运算指令与之前未执行完的矩阵运算指令是否存在依赖关系。


8.如权利要求1所述的装置,其特征在于,所述控制单元包括:
存储队列模块,用于在当前矩阵运算指令与之前未执行完的运算指令存在依赖关系时,暂时存储当前矩阵运算指令,并且在该依赖关系消除时,将暂存的矩阵运算指令送往矩阵运算单元。


9.如权利要求1-7任一项所述的装置,其特征在于,所述装置还包括:
指令缓存单元,用于存储待执行的矩阵运算指令;
输入输出单元,用于将矩阵运算指令相关的矩阵数据存储于存储单元,或者,从存储单元中获取矩阵运算指令的运算结果。


10.如权利要求4任一项所述的装置,其特征在于,所述存储单元为高速暂存存储器;和/或所述寄存器单元为标量寄存器堆。
...

【专利技术属性】
技术研发人员:张潇刘少礼陈天石陈云霁
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1