【技术实现步骤摘要】
一种矩阵乘积转置的加速方法、装置及处理器
本申请涉及计算机
,尤其涉及一种矩阵乘积转置的加速方法、装置及处理器。
技术介绍
随着大数据技术的发展,矩阵乘积转置的使用频率越来越频繁。其中,矩阵乘积转置的定义是矩阵A和矩阵B相乘并转置,其计算公式为:(A×B)T=BT×AT。然而,由于现有的矩阵乘积转置方法进行矩阵乘积转置的计算时,将占用CPU大量的计算资源,导致CPU的计算速度降低,以致于影响CPU处理其他任务。
技术实现思路
为了解决现有技术中存在的以上技术问题,本申请提供一种矩阵乘积转置加速方法、装置及处理器,能够加快矩阵乘积转置的计算速度,进而减少了矩阵乘积转置计算对CPU造成的不良影响。为了实现上述目的,本申请提供的技术方案如下:本申请提供一种矩阵乘积转置的加速方法,包括:第二处理器按行从第一处理器中获取第一矩阵A;所述第二处理器将所述A按行存储至第一存储单元;其中,所述A为m行且p列的矩阵;所述第二处理器按行从所述第一处理器中获取第二矩阵B;所述第二处理器将所述B按列存储至第二存储单元;其中,所述B为p行且n列的矩阵;所述第二处理器从所述第一存储单元中按 ...
【技术保护点】
1.一种矩阵乘积转置的加速方法,其特征在于,包括:第二处理器按行从第一处理器中获取第一矩阵A;所述第二处理器将所述A按行存储至第一存储单元;其中,所述A为m行且p列的矩阵;所述第二处理器按行从所述第一处理器中获取第二矩阵B;所述第二处理器将所述B按列存储至第二存储单元;其中,所述B为p行且n列的矩阵;所述第二处理器从所述第一存储单元中按行读取所述A;所述第二处理器从所述第二存储单元中按列读取所述B,并对所述A和所述B进行乘积转置计算,获得所述A和所述B的乘积转置结果第三矩阵D;其中,所述D为n行且m列的矩阵;所述第二处理器将所述D发送给所述第一处理器。
【技术特征摘要】
1.一种矩阵乘积转置的加速方法,其特征在于,包括:第二处理器按行从第一处理器中获取第一矩阵A;所述第二处理器将所述A按行存储至第一存储单元;其中,所述A为m行且p列的矩阵;所述第二处理器按行从所述第一处理器中获取第二矩阵B;所述第二处理器将所述B按列存储至第二存储单元;其中,所述B为p行且n列的矩阵;所述第二处理器从所述第一存储单元中按行读取所述A;所述第二处理器从所述第二存储单元中按列读取所述B,并对所述A和所述B进行乘积转置计算,获得所述A和所述B的乘积转置结果第三矩阵D;其中,所述D为n行且m列的矩阵;所述第二处理器将所述D发送给所述第一处理器。2.根据权利要求1所述的矩阵乘积转置的加速方法,其特征在于,所述第二处理器将所述B按列存储至第二存储单元,具体包括:所述第二处理器将所述B进行转置,获得第二矩阵的转置矩阵BT;所述第二处理器将所述BT按行存储至第二存储单元;其中,所述BT为n行且p列的矩阵。3.根据权利要求2所述的矩阵乘积转置的加速方法,其特征在于,所述第二处理器将所述B进行转置,获得第二矩阵的转置矩阵BT,具体包括:所述第二处理器将所述B中第i行第j列元素的原地址(i-1)×n+j转换为新地址(j-1)×p+i,获得第二矩阵的转置矩阵BT;其中,1≤i≤p,且1≤j≤n。4.根据权利要求1所述的矩阵乘积转置的加速方法,其特征在于,所述第二处理器从所述第一存储单元按行读取所述A,具体包括:所述第二处理器从所述第一存储单元中按行读取所述A,并依次保存于第1行向量至第m行向量;所述第二处理器从所述第二存储单元按列读取所述B,并对所述A和所述B进行乘积转置计算,获得所述A和所述B的乘积转置结果第三矩阵D,具体包括:所述第二处理器从所述第二存储单元按列读取所述B的第t列,得到第t列向量;其中,1≤t≤n;根据所述A和所述第t列向量,得到第三矩阵D的第t行数据。5.根据权利要求4所述的矩阵乘积转置的加速方法,其特征在于,所述根据所述A和所述第t列向量,得到第三矩阵D的第t行数据,具体包括:并行将所述A的每行数据分别与所述t列向量进行向量相乘,分别得到第三矩阵D的第t行数据中的第1列至第m列。6.根据权利要求1所述的矩阵乘积转置的加速方法,其特征在于,所述第二处理器按行从第一处...
【专利技术属性】
技术研发人员:张贞雷,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。