一种基于神经网络的矩阵乘运算方法及相关装置制造方法及图纸

技术编号：30164430 阅读：23 留言：0更新日期：2021-09-25 15:19

本披露公开了一种基于神经网络的矩阵乘运算方法及相关装置，该方法包括应用于芯片，芯片包括N个集群，N个集群中的每个集群包括M个处理器核，N和M属于正整数，方法包括：将输入矩阵和权值矩阵写入N个集群中，其中，输入矩阵包括N个输入数据块，权值矩阵包括N*M个权值数据块，每个输入数据块分别写入在每个集群中，每个权值数据块分别写入每个处理器核中；按照预设顺序将第一输入数据块在N个集群中依次传递并计算，得到矩阵乘结果，其中，第一输入数据块为N个输入数据块中的任意一个输入数据块，矩阵乘结果为输入矩阵和权值矩阵的相乘结果。通过本披露，在一定程度上可以充分利用集群之间的通信宽带，节省IO时间，提高运行效率。提高运行效率。提高运行效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络的矩阵乘运算方法及相关装置

[0001]本披露一般地涉及数据处理领域。更具体地，本披露涉及一种基于神经网络的矩阵乘运算方法及相关装置。

技术介绍

[0002]全连接层(Fully Connected Layers，FC)在整个神经网络中起到“分类器”的作用，作为神经网络中较为基础的运算，其数学表示为Y＝X*M+b。也即，输入矩阵X与权值矩阵M先进行矩阵乘，然后加上偏置b，得到输出Y。
[0003]一般来说，现代处理器多采用多核并行的架构，每个处理器核上的空间有限。由于神经网络FC层的权值矩阵M较大，单个核难以完成矩阵乘运算。一般需要较多次的输入/输出(Input/Output，IO)操作才可以完成矩阵乘计算，而多次IO操作可能会增加通信时间，降低处理器的运行效率。

技术实现思路

[0004]为了解决如上所提到的一个或多个技术问题，本申请实施例在多个方面提出了提供了基于神经网络的矩阵乘运算方法及相关装置，按照预设顺序将输入数据块在N个集群中依次传递并计算，在一定程度上可以充分利用集群之间的通信宽带，节省IO时间，提高运行效率。
[0005]在第一方面中，本申请实施例提供了一种基于神经网络的矩阵乘运算方法，所述，该述方法应用于芯片，所述芯片包括N个集群，所述N个集群中的每个集群包括M个处理器核，N和M属于正整数，所述方法包括：将输入矩阵和权值矩阵写入所述N个集群中，其中，所述输入矩阵包括N个输入数据块，所述权值矩阵包括N*M个权值数据块，每个输入数据块分别写入在每个集群中，...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的矩阵乘运算方法，其特征在于，所述方法应用于芯片，所述芯片包括N个集群，所述N个集群中的每个集群包括M个处理器核，N和M属于正整数，所述方法包括：将输入矩阵和权值矩阵写入所述N个集群中，其中，所述输入矩阵包括N个输入数据块，所述权值矩阵包括N*M个权值数据块，每个输入数据块分别写入在每个集群中，每个权值数据块分别写入每个处理器核中；按照预设顺序将第一输入数据块在所述N个集群中依次传递并计算，得到矩阵乘结果，其中，所述第一输入数据块为所述N个输入数据块中的任意一个输入数据块，所述矩阵乘结果为所述输入矩阵和所述权值矩阵的相乘结果。2.根据权利要求1所述的方法，其特征在于，所述按照预设顺序将第一输入数据块在所述N个集群中依次传递计算，得到矩阵乘结果，包括：按照预设顺序将第一输入数据块在所述N个集群中依次传递；将传递到第一集群中的所述第一输入数据块与所述第一集群中每个处理器核中的所述权值数据块进行矩阵乘运算，得到多个第一相乘结果；其中，所述第一集群为所述N个集群中的任意一个集群；根据在N个集群中所得到的多个第一相乘结果确定所述矩阵乘结果。3.根据权利要求2所述的方法，其特征在于，所述N个集群之间存在环状通信链路；所述按照预设顺序将第一输入数据块在所述N个集群中依次传递，包括：通过每个集群之间的所述环状通信链路按照顺时针或逆时针将所述第一输入数据块在所述N个集群中依次传递。4.根据权利要求1至3任一项所述的方法，其特征在于，所述将输入矩阵和权值矩阵写入所述N个集群中，包括：根据所述集群的数量将所述输入矩阵按行进行拆分，得到所述N个输入数据块；根据所述处理器核的数量将所述权值矩阵按列进行拆分，得到N*M个权值数据块；将所述N个输入数据块中的每个输入数据块分别写入所述N个集群的每个集群中，将所述N*M个权值数据块中的每个权值数据块分别写入所述N个集群的所述M个处理器核中。5.根据权利要求1至3任一项所述的方法，其特征在于，所述将输入矩阵和权值矩阵写入所述N个集群中，包括：根据所述集群的数量将所述输入矩阵按列进行拆分，得到所述N个输入数据块；根据所述集群的数量先将所述权值矩阵按行进行拆分，得到N个目标数据块；然后根据每个集群中处理器核的数量再将每个目标数据块按列进行拆分，得到N*M个权值数据块；将所述N个输入数据块中的每个输入数据块分别写入所述N个集群的每个集群中，将所述N*M个权值数据块中的每个权值数据块分别写入所述N个集群的所述M个处理器核中。6.根据权利要求1至3任一项所述的方法，其特征在于，所述将输入矩阵和权值矩阵写入所述N个集群中，包括：根据所述集群的数量对所述输入矩阵按列进行拆分，得到所述N个输入数据块；根据所述处...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人