【技术实现步骤摘要】
一种用于执行矩阵乘运算的装置和方法
本专利技术涉及计算机领域,尤其涉及一种用于执行矩阵乘运算的装置和方法。
技术介绍
当前计算机领域,伴随着大数据、机器学习等新兴技术的成熟,越来越多的任务中包含了各种各样的矩阵乘运算,尤其是大矩阵的乘运算,这些往往成为算法速度和效果提高的瓶颈。以目前火热的深度学习为例,其中就包含着大量的矩阵乘运算。在深度学习的人工神经网络全连接层中,输出神经元的运算表达式为y=f(wx+b),其中w是权值矩阵,x是输入向量,b是偏置向量,计算输出矩阵y的过程为矩阵w与向量x相乘,加上向量b,然后对得到的向量进行激活函数运算(即对矩阵中的每个元素进行激活函数运算)。在这个过程中,矩阵乘向量运算的复杂度远高于之后的加偏置和做激活的操作,高效的实现前者对于整个运算过程有着最重要的影响。由此可见,高效实现矩阵乘运算是提升许多计算机算法的有效方法。在现有技术中,一种进行矩阵运算的已知方案是使用通用处理器,该方法通过通用寄存器堆和通用功能部件来执行通用指令,从而执行矩阵乘运算。然而,该方法的缺点之一是单个通用处理器多用于标量计算,在进行矩阵运算时运算性能较低。而使用多个通用处理器并行执行时,处理器的个数较少提升的效果不做够显著;处理器个数较高时它们之间的相互通讯又有可能成为性能瓶颈。在另一种现有技术中,使用图形处理器(GPU)来进行一系列矩阵乘计算,其中,通过使用通用寄存器堆和通用流处理单元执行通用SIMD指令来进行运算。但在上述方案中,GPU片上缓存太小,在进行大规模矩阵运算时需要不断进行片外数据搬运,片外带宽成为了主要性能瓶颈。在另一种现有技术中 ...
【技术保护点】
1.一种用于执行矩阵乘运算的装置,其特征在于,包括:存储单元,用于存储矩阵乘运算指令相关的矩阵数据;控制单元,用于对矩阵乘运算指令进行译码,并控制矩阵乘运算指令的运算过程;矩阵运算单元,用于根据译码后的矩阵乘运算指令,根据所述矩阵乘运算指令矩阵地址以及矩阵长度,根据该矩阵地址以及矩阵长度获取相应的矩阵,对矩阵进行矩阵乘运算操作得到运算结果。
【技术特征摘要】
1.一种用于执行矩阵乘运算的装置,其特征在于,包括:存储单元,用于存储矩阵乘运算指令相关的矩阵数据;控制单元,用于对矩阵乘运算指令进行译码,并控制矩阵乘运算指令的运算过程;矩阵运算单元,用于根据译码后的矩阵乘运算指令,根据所述矩阵乘运算指令矩阵地址以及矩阵长度,根据该矩阵地址以及矩阵长度获取相应的矩阵,对矩阵进行矩阵乘运算操作得到运算结果。2.根据权利要求1所述的装置,其特征在于,所述装置还包括:寄存器单元,用于存储矩阵乘运算指令相关的标量数据、向量地址、向量长度、矩阵地址、矩阵长度。3.如权利要求1所述的装置,其特征在于,所述控制单元包括:指令队列模块,用于对译码后的矩阵乘运算指令进行顺序存储,并获取矩阵乘运算指令相关的标量数据。4.如权利要求1所述的装置,其特征在于,所述控制单元包括:依赖关系处理单元,用于在矩阵运算单元获取当前矩阵运乘算指令前,判断当前矩阵运算乘指令与之前未执行完的矩阵乘运算指令是否存在依赖关系。5.如权利要求4所述的装置,其特征在于,所述控制单元包括:存储队列模块,用于在当前矩阵运乘算指令与之前未执行完的运算指令存在依赖关系时,暂时存储当前矩阵乘运算指令,并且在该依赖关系消除时,将暂存的矩阵乘运算指令送往矩阵运算单元执行。6.如权利要求1-5任一项所述的装置,其特征在于,所述装置还包括:指令缓存单元,用于存储待执行的矩阵乘运算指令;输入输出单元,用于将矩阵乘运算指令相关的数据存储于存储单元,或者,从存储单元中获取矩阵乘运算指令的运算结果。7.如权利要求1-4任一项所述的装置,其特征在于,所述存储单元为高速暂存存储器。8.如权利要求1-4任一项所述的装置,其特征在于,所述矩阵运算单元包括一个主运算模块和多个从运算模块,其中:所述从运算模块,用于执行矩阵乘运算中的点积运算得到点积运算结果,将点积运算结果返回给主运算模块;所述主运算模块,用于获取所有从运算模块的点积运算结果,依据该点积运算结果得到运算结果中相应各行。9.根据权利要求8所述的装置,其特征在于,所述从运算模块包括:向量对位乘模块,加法树模块以及累加模块;所述向量对位乘模块,用于执行两个向量的对位相乘得到乘积结果;所述加法树模块,用于将乘积结果相加得到结果;所述累加模块,用于将所述加法树模块的结果累加在之前的部分和得到点积结果。10.根据权利要求8所述的装置,其特征在于,所述主运算模块包括:对位乘法器;所述对位乘法器,用于执行矩阵乘标量的运算。11.一种执行矩阵乘运算的方法,其特征在于,所述方法应用于矩阵乘运算装置,所述装置包括:存储单元、控制单元和矩阵运算单元;所述方法包括如下步骤:存储单元存储矩阵乘运算指令...
【专利技术属性】
技术研发人员:张潇,刘少礼,陈天石,陈云霁,
申请(专利权)人:北京中科寒武纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。