【技术实现步骤摘要】
一种基于AI处理器的数据处理方法和数据处理装置
[0001]本专利技术涉及数据处理
,具体是涉及一种基于AI处理器的数据处理方法和数据处理装置。
技术介绍
[0002]在计算机上进行数据处理,通过数据处理的结果和计算机执行数据处理所使用的时间可以测试计算机的性能。而在计算机上执行矩阵分解程序这一数据处理程序以获取计算机性能测试是常用的测试计算机性能的方法。矩阵分解程序包括HPL(high performance Linpack)和HPL
‑
AI。HPL(high performance Linpack)是一套被广泛用于测量计算机实际峰值性能的基准测试程序。HPL
‑
AI是在计算机上设置AI芯片,由AI芯片和 CPU(副处理器)共同执行矩阵分解程序,而AI芯片对单精度或半精度矩阵乘的计算提供了更多支持,即AI芯片在处理低精度矩阵乘的计算上具有巨大的性能。从上述分析,现有技术在使用AI执行数据处理时,会增大数据处理所需时间。
[0003]综上所述,现有技术增加了数据处理所需时间。 ...
【技术保护点】
【技术特征摘要】
1.一种基于AI处理器的数据处理方法,其特征在于,包括:依据数据处理所需的各个程序是否涉及矩阵乘,将各个程序划分成主程序和副程序,所述主程序涉及矩阵乘计算,所述副程序未涉及矩阵乘计算;控制AI处理器执行所述主程序和控制副处理器执行所述副程序,所述AI处理器和所述副处理器位于同一计算机中,所述AI处理器执行所述主程序和所述副处理器执行所述副程序构成异构并行,所述AI处理器的处理速度大于所述副处理器的处理速度;依据所述AI处理器执行所述主程序输出的结果和所述副处理器执行所述副程序输出的结果,得到数据处理的最终结果。2.如权利要求1所述的基于AI处理器的数据处理方法,其特征在于,所述依据数据处理所需的各个程序是否涉及矩阵乘,将各个程序划分成主程序和副程序,所述主程序涉及矩阵乘计算,所述副程序未涉及矩阵乘计算,包括:依据所述数据处理,得到所述数据处理中的矩阵分解;确认所述矩阵分解所需的各个程序中的上下三角矩阵分解程序、面板分解程序、三角矩阵求解程序、第一矩阵处理程序、通用矩阵乘程序、第二矩阵处理程序,所述第一矩阵处理程序用于处理所述面板分解程序的输出结果和所述三角矩阵求解程序的输出结果,所述第二矩阵处理程序用于处理所述通用矩阵乘程序的输出结果;将所述通用矩阵乘程序划分为所述主程序,将所述上下三角矩阵分解程序、所述面板分解程序、所述三角矩阵求解程序、所述第一矩阵处理程序、所述第二矩阵处理程序划分为所述副程序。3.如权利要求2所述的基于AI处理器的数据处理方法,其特征在于,所述控制AI处理器执行所述主程序和控制副处理器执行所述副程序,所述AI处理器和所述副处理器位于同一计算机中,所述AI处理器执行所述主程序和所述副处理器执行所述副程序构成异构并行,所述AI处理器的处理速度大于所述副处理器的处理速度,包括:控制所述AI处理器执行当前迭代的所述通用矩阵乘程序、控制所述副处理器执行当前迭代的所述第二矩阵处理程序,所述AI处理器的执行时间与所述副处理器的执行时间重叠,所述当前迭代为所述矩阵分解中的若干次迭代中的其中一次迭代;当执行所述当前迭代至满足设定条件时,控制所述AI处理器执行当前迭代的所述通用矩阵乘程序、控制所述副处理器执行下一迭代的所述上下三角矩阵分解程序、所述面板分解程序、三角矩阵求解程序、所述第一矩阵处理程序,所述AI处理器的执行时间和所述副处理器的执行时间重叠。4.如权利要求3所述的基于AI处理器的数据处理方法,其特征在于,所述控制所述AI处理器执行当前迭代的所述通用矩阵乘程序、控制所述副处理器执行当前迭代的所述第二矩阵处理程序,所述AI处理器的执行时间与所述副处理器的执行时间重叠,所述当前迭代为所述矩阵分解中的若干次迭代中的其中一次迭代,包括:依据当前迭代的所述通用矩阵乘程序,得到当前迭代的所述通用矩阵乘程序中的当前迭代的一区矩阵乘程序和当前迭代的二区矩阵乘程序,当前迭代的一区矩阵乘程序的输出结果比二区矩阵乘程序的输出结果被下一迭代优先使用;控制所述AI处理器执行当前迭代的一区矩阵乘程序,直至当前迭代的一区矩阵乘程序被执行结束,控制所述AI处理器执行当前迭代的二区矩阵乘程序的同时控制所述副处理器
执行当前迭代的所述第二矩阵处理程序。5.如权利要求4所述的基于AI处理器的数据处理方法,其特征在于,所述当执行所述当前迭代至满足设定条件时,控制所述AI处理器执行当前迭代的所述通用矩阵乘程序、控制所述副处理器执行下一迭代的所述上下三角矩阵分解程序、所述面板分解程序、三角矩阵求解程序、所述第一矩阵处理程序,所述AI处理器的执行时间和所述副处理器的执行时间重叠,包括:执行当前迭代的一区矩阵乘程序结束时,控制所述AI处理器执行当前迭代的二区矩阵乘程序的同时控制所述副处理器依次执行下一迭代的所述上下三角矩阵分解程序、所述面板分解程序、三角矩阵求解程序、所述第一矩阵处理程序,直至所述AI处理器执行当前迭代的二区矩阵乘程序结束,控制所述AI处理器执行下一迭代的一区矩阵乘程序。6.如权利要求4所述的基于AI处理器的数据处理方法,其特征在于,所述当执行所述当前迭代至满足设定条件时,控制所述AI处理器执行当前迭代的所述通用矩阵乘程序、控制所述副处理器执行下一迭代的所述上下三角矩阵分解程序、所述面板分解程序、三角矩阵求解程序、所述第一矩阵处理...
【专利技术属性】
技术研发人员:杨凯,范登栋,徐鹏翔,刘勇翔,田永鸿,高文,
申请(专利权)人:鹏城实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。