【技术实现步骤摘要】
运算加速器
本申请涉及数据计算
,尤其涉及一种运算加速器。
技术介绍
目前,要计算两个矩阵A和B的乘积,可以通过以下两种方式中的任意一种方式进行计算:方式一、通过向量处理器进行计算。假设C=A*B,向量处理器可同时计算的元素个数为M个,参见图1,向量处理器会将矩阵A的第i行向量(包括元素Ai1、Ai2、...、Ai(M-1)、AiM)加载到源寄存器Reg0中,再将矩阵B的第j列向量(包括元素Bj1、Bi2、...、Bj(M-1)、BjM)加载到寄存器Reg1中,可以实现Reg0与Reg1各对应元素之间的乘法,最后通过加法树来完成累加操作,计算出矩阵C的第i行第i列的数据Cij,进行多次计算则可以得到矩阵C。方式二、为了进一步提高计算速度,可以通过二维的计算阵列来完成矩阵的乘法运算。例如,二维的计算阵列可以为N*N的脉动阵列,通过这样的一个脉动阵列,在每一个时钟周期可以完成一个向量与一个矩阵相乘的运算。在方式一中,完成两个N*N的矩阵乘法运算,需要N^3次乘法操作,由于向量处理器每 ...
【技术保护点】
1.一种运算加速装置,其特征在于,包括:外部存储器和运算加速器,/n所述运算加速器,用于:/n从所述外部存储器中获取Q*R矩阵和R*T矩阵;/n将所述Q*R矩阵和所述R*T矩阵分别填充为M*N矩阵和N*K矩阵,其中,Q小于M,R小于N,T小于K,且Q、M、R、N、T和K均为正整数;/n在一个时钟周期内对所述M*N矩阵和所述N*K矩阵进行乘法运算。/n
【技术特征摘要】
1.一种运算加速装置,其特征在于,包括:外部存储器和运算加速器,
所述运算加速器,用于:
从所述外部存储器中获取Q*R矩阵和R*T矩阵;
将所述Q*R矩阵和所述R*T矩阵分别填充为M*N矩阵和N*K矩阵,其中,Q小于M,R小于N,T小于K,且Q、M、R、N、T和K均为正整数;
在一个时钟周期内对所述M*N矩阵和所述N*K矩阵进行乘法运算。
2.根据权利要求1所述的运算加速装置,其特征在于,所述运算加速器包括运算电路,所述运算电路包括M个运算组,每个运算组中包括K个运算块,每个运算块包括N个运算单元,每个运算单元设有两路输入,分别用于将两路输入的数据进行相乘。
3.根据权利要求2所述的运算加速装置,其特征在于,每个运算组获取所述M*N矩阵的M个行向量中一个行向量,且每个运算组获取的行向量不同;每个运算组中K个运算块加载的行向量相同。
4.根据权利要求3所述的运算加速装置,其特征在于,每个运算组中K个运算块分别加载所述N*K矩阵的K个列向量中一个列向量。
5.根据权利要求2-4任一所述的运算加速装置,其特征在于,所述运算加速器还包括控制器,所述控制器用于依据指令控制所述运算电路完成所述乘法运算。
6.根据权利要求5所述的运算加速装置,其特征在于,所述运算加速器还包括与所述控制器连接的取指存储器和总线接口单元,
所述取指存储器,用于存储所述控制器使用的指令,且所述存储控制器使用的指令通过所述总线接口单元从所述外部存储器中获取。
7.根据权利要求1-6任一所述的运算加速装置,其特征在于,还包括:
中央处理器CPU,用于为所述运算加速器分配计算任务。
8.根据权利要求1-7任一所述的运算加速装置,其特征在于,所述填充是指在矩阵的周围填充0元素。
9.根据权利要求1-8任一所述的运算加速装置,其特征在于,M=N=K。
10.一种运算加速装置,其特征在于,包括:外部存储器和运算加速器,
所述运算加速器用于:
从所述外部存储器中获取Q*R矩阵和R*T矩阵;
将所述Q*R矩阵和所述R*T矩阵分别切割为M*N矩阵和N*K矩阵,其中,Q大于M,R大于N,T大于K,且Q、M、R、N、T和K均为正整数;
在一个时钟周期内对所述M*N矩阵和所述N*K矩阵进行乘法运算。
11.根据权利要求10所述的运算加速装置,其特征在于,所述运算加速器包括运算电路,所述运算电路包括M个运算组,每个运算组中包括K个运算块,每个运算块包括N个运算单元,每个运算单元设有两路输入,分别用于将两路输入的数据进行相乘。
12.根据权利要求11所述的运算加速装置,其特征在于,每个运算组获取所述M*N矩阵的M个行向量中一个行向量,且每个运算组获取的行向量不同;每个运算组中K个运算块加载的行向量相同。
13.根据权利要求12所述的运算加速装置,其特征在于,每个运算组中K个运算块分别加载所述N*K矩阵的K个列向量中一个列向量。
14.根据权利要求11-13任一所述的运算加速装置,其特征在于,所述运算加速器还包括控制器,所述控制器用于依据指令控制所述运算电路完成所述乘法运算。
15.根据权利要求14所述的运算加速装置,其特征在于,所述运算加速器还包括与所述控制器连接的取指存储器和总线接口单元,
所述取指存储器,用于存储所述控制器使用的指令,且所述存储控制器使用的指令通过所述总线接口单元从所述外部存储器中获取。
16.根据权利要求10-15任一所述的运算加速装置,其特征在于,还包括:
中央处理器CPU,用于为所述运算加速器分配计算任务。
17.根...
【专利技术属性】
技术研发人员:廖恒,刘虎,汪昊,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。