【技术实现步骤摘要】
数据处理方法、装置、电子设备和存储介质
[0001]本申请涉及数据处理
,特别是涉及一种数据处理方法、装置、电子设备和存储介质。
技术介绍
[0002]随着科学技术的快速发展,在计算应用中,GEMM(General Matrix to Matrix Multiplication,通用矩阵乘法)通常扮演着非常重要的角色,是一种同时具有计算密集和访存密集的运算,对处理器的运算能力、访存带宽及延时的要求非常高。
[0003]GEMM的优化实现方法可以参照图1所示。如图1所示,GEMM通常可以将全局数据划分成很多个数据块,并将数据块不停的搬运到共享内存中。
[0004]全局数据在向共享内存搬运数据时,需要先将全局数据读取到寄存器中,再将寄存器中的数据写回到共享内存中,受限于处理器中寄存器的数量和带宽的大小,导致GEMM运算延时高,效率低下,GEMM的优化效果不够显著。
技术实现思路
[0005]基于此,本申请提供一种能够提高GEMM运算效率,降低GEMM运算延时的数据处理方法、装置、电子设备和存 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:基于第i数据读写指令,从全局数据中读取第i个数据块,将所述第i个数据块写入共享内存中,其中,数据读写指令为用于执行数据读取及写入处理的汇编指令,所述全局数据划分为N个数据块,N为大于0的整数,i为小于或者等于N的整数;从所述共享内存中将所述第i个数据块读取至矢量寄存器中进行乘累加处理,得到所述第i个数据块的乘累加运算结果;根据所述N个数据块对应的乘累加运算结果,得到针对所述全局数据的通用乘法矩阵GEMM运算结果;将所述GEMM运算结果写入全局内存。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于针对各所述数据块的共享内存设置操作,将各所述数据块在所述共享内存中对应的写地址写入目标寄存器中。3.根据权利要求2所述的方法,其特征在于,所述第i数据读写指令中包括所述第i数据块在所述全局内存中的读地址,所述基于第i数据读写指令,从全局数据中读取第i个数据块,将所述第i个数据块写入共享内存中,包括:根据所述第i数据读写指令中第i个数据块在所述全局内存中的读地址,从所述全局数据中读取所述第i个数据块;根据所述第i数据读写指令,从所述目标寄存器中读取所述第i个数据块在所述共享内存中对应的写地址,基于所述第i个数据块在所述共享内存中对应的写地址,将所述第i个数据块写入所述共享内存中。4.根据权利要求1所述的方法,其特征在于,所述从全局数据中读取第i个数据块,将所述第i个数据块写入共享内存中,包括:从所述全局数据中读取所述第i个数据块,将所述第i个数据块写入所述共享内存的第一缓存区域;从所述全局数据中读取第i+1个数据块,将所述第i+1个数据块写入所述共享内存的第二缓存区域;所述从所述共享内存中将所述第i个数据块读取至矢量寄存器中进行乘累加处理,得到所述第i个数据块的乘累加运算结果,包括:从所述共享内存的第一缓存区域中,将所述第i个数据块读取至矢量寄存器中进行乘累加处理,得到所述第i个数据块的乘累加运算结果。5.根据权利要求4所述的方法,其特征在于,所述数据块包括m行k列元素,所述矢量寄存器包括第一矢量寄存器和第二矢量寄存器,所述从所述共享内存的第一缓存区域中,将所述第i个数据块读取至矢量寄存器中进行乘累加处理...
【专利技术属性】
技术研发人员:高娅,卜景德,赵红朋,
申请(专利权)人:曙光信息产业北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。