【技术实现步骤摘要】
一种用于执行矩阵乘运算的装置和方法本公开为如下专利申请的分案申请:申请号CN201610266627.0;申请日2016年4月26日;专利技术名称“一种用于执行矩阵乘运算的装置和方法”。
本公开涉及计算机领域,尤其涉及一种用于执行矩阵乘运算的装置和方法。
技术介绍
当前计算机领域,伴随着大数据、机器学习等新兴技术的成熟,越来越多的任务中包含了各种各样的矩阵乘运算,尤其是大矩阵的乘运算,这些往往成为算法速度和效果提高的瓶颈。以目前火热的深度学习为例,其中就包含着大量的矩阵乘运算。在深度学习的人工神经网络全连接层中,输出神经元的运算表达式为y=f(wx+b),其中w是权值矩阵,x是输入向量,b是偏置向量,计算输出矩阵y的过程为矩阵w与向量x相乘,加上向量b,然后对得到的向量进行激活函数运算(即对矩阵中的每个元素进行激活函数运算)。在这个过程中,矩阵乘向量运算的复杂度远高于之后的加偏置和做激活的操作,高效的实现前者对于整个运算过程有着最重要的影响。由此可见,高效实现矩阵乘运算是提升许多计算机算法的有效方法。在现有技术中,一种进行矩阵运算的已知方案是使用通用处理器,该方法通过通用寄存器堆和通用功能部件来执行通用指令,从而执行矩阵乘运算。然而,该方法的缺点之一是单个通用处理器多用于标量计算,在进行矩阵运算时运算性能较低。而使用多个通用处理器并行执行时,处理器的个数较少提升的效果不做够显著;处理器个数较高时它们之间的相互通讯又有可能成为性能瓶颈。在另一种现有技术中,使用图形处理器(GPU)来进行一系列矩阵 ...
【技术保护点】
1.一种矩阵运算装置,其特征在于,所述装置能够根据指令序列执行矩阵运算指令,所述装置包括:/n取指模块,用以自所述指令序列中取出所述矩阵运算指令;/n译码模块,用以对取指后的矩阵运算指令进行译码;/n依赖关系处理单元,判断译码后的矩阵运算指令与之前尚未执行完成的指令的依赖关系;以及/n矩阵运算单元,基于依赖关系执行矩阵的乘运算。/n
【技术特征摘要】
1.一种矩阵运算装置,其特征在于,所述装置能够根据指令序列执行矩阵运算指令,所述装置包括:
取指模块,用以自所述指令序列中取出所述矩阵运算指令;
译码模块,用以对取指后的矩阵运算指令进行译码;
依赖关系处理单元,判断译码后的矩阵运算指令与之前尚未执行完成的指令的依赖关系;以及
矩阵运算单元,基于依赖关系执行矩阵的乘运算。
2.根据权利要求1所述的矩阵运算装置,其中所述依赖关系处理单元判断译码后的矩阵运算指令的输入数据的存储范围和所述之前尚未执行完成的指令的输出数据的存储范围是否重叠,若是,所述矩阵运算装置先执行所述之前尚未执行完成的指令。
3.根据权利要求1所述的矩阵运算装置,更包括:
存储队列模块,为一有序队列,用以存储与所述之前尚未执行完成的指令有依赖关系的指令。
4.根据权利要求1所述的矩阵运算装置,更包括:
指令队列,用于暂存译码后的矩阵运算指令。
5.根据权利要求1所述的矩阵运算装置,更包括:
存储单元,用以存储矩阵数据,供所述矩阵运算单元在执行矩阵的乘运算时存取数据用。
6.根据权利要求5所述的矩阵运算装置,其中存储单元为高速暂存存储器。
7.根据权利要求5所述的矩阵运算装置,更包括:
输入输出单元,用以读取或写入所述矩阵数据。
8.根据权利要求1至7任一项所述的矩阵运算装置,其中所述矩阵运算单元包括主运算模块及从运算模块;其中,当所述矩阵运算指令为矩阵乘矩阵、矩阵乘向量或向量乘矩阵时,所述主运算模块存储的矩阵或向量与所述从运算模块存储的向量分别进行对位相乘以完成所述乘运算;当所述矩阵运算指令为矩阵乘标量时,所述主运算模块进行对位相乘以完成所述乘运算。
9.根据权利要求8所述的矩阵运算装置,其中所述从运算模块包括第一从运算模块及第二从运算模块,所述第一从运算模块及第二从运算模块分别包括:
对位乘模块,用以执行对位相乘,产生对位相乘结果数据;以及
加法树模块,用以将所述对位相乘结果数据加成一个数;
其中所述主运算模块分别与所述第一从运算模块及第二从运算模块亦进行对位相乘。
10.根据权利要求9所述的矩阵运算装置,其中所述第一从运算模块及第二从运算模块更包括累加模块,用以将所述加法树模块的所述数进行累加。
11.根据权利要求9所述的矩阵运算装置,其中所述对位乘模块每次取出特定位宽进行计算,该特定位宽等于所述对位乘模块的计算位宽。
12.根据权利要求9所述的矩阵运算装置,其中当矩阵运算为矩阵乘矩阵时,所述主运算模块存储第一矩阵,所述第一矩阵包括第一行数据及第二行数据,所述第一从运算模块存储第二矩阵多列数据的第一列数据,所述第二从运算模块存储所述第二矩阵多列数据的第二列数据;
所述主运算模块将所述第一行数据广播给所述第一从运算模块及所述第二从运算模块,所述第一从运算模块将所述第一行数据及所述第一列数据进行点积运算,所述第二从运算模块将所述第一行数据及所述第二列数...
【专利技术属性】
技术研发人员:张潇,刘少礼,陈天石,陈云霁,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。