【技术实现步骤摘要】
本申请涉及计算机信息处理领域,且更具体地涉及矩阵乘性能优化方法、矩阵乘性能优化系统、电子设备、非暂时存储介质和计算机程序。
技术介绍
1、近几年来,计算机在处理深度学习神经网络时会涉及二维或更高维张量的卷积运算或矩阵乘运算。但是在实际运算时,张量的高度或宽度等维度有时可能会超出硬件加速器的相关限制,或者,为了利用多个计算核来并行计算针对张量的卷积运算或矩阵乘运算,都需要对张量的某个维度进行切分(或称为拆分)。
技术实现思路
1、根据本申请的一个方面,提供一种矩阵乘性能优化方法,包括:确定步骤,通过切分策略,根据要进行矩阵乘的左矩阵和右矩阵的形状,确定对所述左矩阵和右矩阵的切分方式;设定步骤,通过存储器配置策略,根据所述切分方式设定所述左矩阵和所述右矩阵的加载方式和存储器类型,作为存储器配置;模拟步骤,通过理论性能计算函数,模拟在所述切分方式和所述存储器配置的情况下利用一个或多个计算核运算所述矩阵乘而得到模拟性能。
2、根据本申请的另一个方面,提供一种矩阵乘性能优化系统,包括:确
...【技术保护点】
1.一种矩阵乘性能优化方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中,所述左矩阵和所述右矩阵的共同维度为X个,其中X是正整数,所述切分策略包括选择切分X个维度中的Y个维度,其中Y是正整数,且Y小于或等于X。
4.根据权利要求1所述的方法,其中,所述存储器配置策略包括根据切分方式、未被切分的矩阵的数据量大小、被切分后的子矩阵的数据量大小和缓冲器的容量设定左矩阵和右矩阵的加载方式和存储器类型。
5.根据权利要求4所述的方法,其中,所述加载方式包括加载到片上缓冲器以及用设备线程组DTG
...
【技术特征摘要】
1.一种矩阵乘性能优化方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中,所述左矩阵和所述右矩阵的共同维度为x个,其中x是正整数,所述切分策略包括选择切分x个维度中的y个维度,其中y是正整数,且y小于或等于x。
4.根据权利要求1所述的方法,其中,所述存储器配置策略包括根据切分方式、未被切分的矩阵的数据量大小、被切分后的子矩阵的数据量大小和缓冲器的容量设定左矩阵和右矩阵的加载方式和存储器类型。
5.根据权利要求4所述的方法,其中,所述加载方式包括加载到片上缓冲器以及用设备线程组dtg广播。
6.根据权利要求1所述的方法,其中,所述理论性能计算函数模拟利用根据所述存储器配置所配置的加载方式和存储器类型,来加载以所述切分方式切分后的子矩阵、读取所述子矩阵的数据、进行矩阵乘累加、进行后处理、存储计算结果的矩阵乘过程。
7.根据权利要求1所述的方法,其中,所述理论性能计算函数计算根据所述存储器配置加载根据所述切分方式切分后的子矩阵并存储矩阵乘结果矩阵所花费的循环数,其中,所述理论性能计算函数根据所述切分方式模拟利用一个或多个计算核对切分后的子矩阵进行矩阵乘所花费的循环数,其中所述理论性能计算函数计算所述加载、矩阵乘和存储所花费的总循环数作为模拟性能。
8.一种矩阵乘性能优化系统,包括:
9.根据权利要求8所述...
【专利技术属性】
技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,
申请(专利权)人:上海壁仞科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。