【技术实现步骤摘要】
一种矩阵乘矩阵运算方法及装置
本申请涉及芯片处理
,具体涉及一种矩阵乘矩阵运算方法及装置。
技术介绍
人工神经网络(ArtificialNeuralNetwork,即ANN),是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。现有的神经网络的运算基于CPU(CentralProcessingUnit,中央处理器)或GPU(英文:GraphicsProcessingUnit,图形处理器)来实现运算,此种运算的功耗高、计算时间长。
技术实现思路
本申请实施例提供了一种矩阵乘矩阵运算方法及装置,可提升矩阵乘矩阵运算的处理速度,提高效率、节省功耗。第一方面,提供一种矩阵乘矩阵运算方法,所述方法应用于芯片装置,所述芯片装置包括:主电路和多个从电路,所述方法包括如下步骤:所述主电路接收矩阵A、矩阵B以及乘法指令A*B,将矩阵A拆分成M个基础数据块,将M个基础数据块分发 ...
【技术保护点】
1.一种矩阵乘矩阵运算方法,其特征在于,所述方法应用于芯片装置,所述芯片装置包括:主电路和多个从电路,所述方法包括如下步骤:所述主电路接收矩阵A、矩阵B以及乘法指令A*B,将矩阵A拆分成M个基础数据块,将M个基础数据块分发给所述多个从电路,将矩阵B广播给所述多个从电路;所述多个从电路并行执行基础数据块与矩阵B的内积运算得到多个处理结果,将多个处理结果发送至所述主电路;所述主电路将所述多个处理结果拼接得到所述乘法指令的计算结果。
【技术特征摘要】
1.一种矩阵乘矩阵运算方法,其特征在于,所述方法应用于芯片装置,所述芯片装置包括:主电路和多个从电路,所述方法包括如下步骤:所述主电路接收矩阵A、矩阵B以及乘法指令A*B,将矩阵A拆分成M个基础数据块,将M个基础数据块分发给所述多个从电路,将矩阵B广播给所述多个从电路;所述多个从电路并行执行基础数据块与矩阵B的内积运算得到多个处理结果,将多个处理结果发送至所述主电路;所述主电路将所述多个处理结果拼接得到所述乘法指令的计算结果。2.根据权利要求1所述的方法,其特征在于,所述将M个基础数据块分发给所述多个从电路具体包括:将所述M个基础数据块按任意不重复的方式分发给所述多个从处理电路。3.根据权利要求1所述的方法,其特征在于,所述将矩阵B广播给所述多个从电路;所述多个从电路并行执行基础数据块与矩阵B的内积运算得到多个处理结果,将多个处理结果发送至所述主电路;所述主电路将所述多个处理结果拼接得到所述乘法指令的计算结果具体包括:所述主电路将所述矩阵B的前α列广播给所述多个从电路,所述多个从电路并行执行基础数据块与前α列的内积运算得到多个前处理结果,将所述多个前处理结果发送至所述主处理电路,所述主处理电路将所述矩阵B的中β列广播给所述多个从处理电路,所述多个从电路并行执行基础数据块与中β列的内积运算得到多个中处理结果,将所述多个中处理结果发送至所述主处理电路;所述主处理电路将所述矩阵B的后γ列广播给所述多个从处理电路,所述多个从电路并行执行基础数据块与后γ列的内积运算得到多个后处理结果,将所述多个后处理结果发送至所述主处理电路,所述主处理电路将多个前处理结果、多个中处理结果以及多个后处理结果按前、中、后组合一起得到矩阵C,所述...
【专利技术属性】
技术研发人员:刘少礼,陈天石,王秉睿,张尧,
申请(专利权)人:北京中科寒武纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。