机器学习指令的转换方法及装置、板卡、主板、电子设备制造方法及图纸

技术编号:28128720 阅读:13 留言:0更新日期:2021-04-19 11:47
本申请涉及一种机器学习指令的转换方法及装置、板卡、主板、电子设备,通过获取机器学习指令序列,并对该机器学习指令序列进行划分,得到至少一个基本块,进而根据窥孔优化算法对基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,从而实现了对机器学习指令的窥孔优化,减少了机器学习指令的时间开销,大大提升了机器学习计算装置的整体性能。能。能。

【技术实现步骤摘要】
机器学习指令的转换方法及装置、板卡、主板、电子设备


[0001]本申请涉及数据处理
,特别是涉及一种机器学习指令的转换方法及装置、板卡、主板、电子设备。

技术介绍

[0002]近年来,机器学习飞速发展,主要是机器学习可以满足人们对于巨大数据量的超快处理需求。机器学习运算是一种功能强大的算法,近年来被应用于图像、语言等领域。
[0003]窥孔优化是一种很局部的优化方式,是指编译器针对已经生成的代码,结合CPU指令的特点,通过一些可能带来性能提升的转换规则,或者通过整体的分析,通过指令转换,以此提升代码性能。
[0004]然而,传统技术缺乏对机器学习计算装置中的机器学习指令进行窥孔优化的方案,因此,如何实现对机器学习指令的窥孔优化,成为本领域技术人员亟待解决的问题。

技术实现思路

[0005]基于此,有必要针对上述如何实现对机器学习指令的窥孔优化的技术问题,提供一种机器学习指令的转换方法及装置、板卡、主板、电子设备。
[0006]一种机器学习指令的转换方法,其特征在于,所述方法包括:
[0007]获取机器学习指令序列;
[0008]对所述机器学习指令序列进行划分,得到至少一个基本块,其中,所述基本块中包括至少一条机器学习指令;
[0009]根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令。
[0010]在其中一个实施例中,所述对所述机器学习指令序列进行划分,得到至少一个基本块,包括:
[0011]查找所述机器学习指令序列中的跳转指令;
[0012]根据所述跳转指令对所述机器学习指令序列进行划分,得到至少一个基本块。
[0013]在其中一个实施例中,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:
[0014]获取所述基本块中的第一偏移寄存器指令;
[0015]根据所述第一偏移寄存器指令,查找所述基本块中的第二偏移寄存器指令,其中,所述第一偏移寄存器指令和所述第二偏移寄存器指令用于对同一个寄存器中的值进行偏移;
[0016]若所述第一偏移寄存器指令和所述第二偏移寄存器指令之间不存在使用所述寄存器中的值的机器学习指令,则合并所述第一偏移寄存器指令和所述第二偏移寄存器指令,得到合并后的偏移寄存器指令。
[0017]在其中一个实施例中,所述根据窥孔优化算法对所述基本块中的机器学习指令进
行指令转换,得到转换后的机器学习指令,包括:
[0018]获取所述基本块中的可提前机器学习指令;
[0019]对所述可提前机器学习指令进行位置前移,并根据所述可提前机器学习指令前移后的位置,判断所述机器学习指令序列是否存在逻辑错误;
[0020]若所述机器学习指令序列存在逻辑错误,则停止对所述可提前机器学习指令进行位置前移,并将所述可提前机器学习指令放置于所述机器学习指令序列不存在逻辑错误所对应的任一前移后的位置。
[0021]在其中一个实施例中,所述获取所述基本块中的可提前机器学习指令,包括:
[0022]将所述基本块中的机器学习指令与预设的可提前机器学习指令进行匹配,得到所述基本块中的可提前机器学习指令。
[0023]在其中一个实施例中,对所述可提前机器学习指令进行位置前移,包括:
[0024]判断所述可提前机器学习指令前移后是否影响其他机器学习指令的执行;
[0025]若判定所述可提前机器学习指令前移后不会影响其他机器学习指令的执行,则对所述可提前机器学习指令进行位置前移。
[0026]在其中一个实施例中,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:
[0027]获取所述基本块中的存储指令,其中,所述存储指令用于对第一数据进行存储;
[0028]在所述存储指令后面继续查找加载所述第一数据的加载指令;
[0029]将所述存储指令和所述加载指令进行合并,得到合并后的移动指令。
[0030]在其中一个实施例中,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:
[0031]获取连续排列数量超过n条的第一机器学习指令,其中,n为所述第一机器学习指令对应的指令发射队列的队列长度;
[0032]将与所述第一机器学习指令在同一个时间片中并行执行的第二机器学习指令提前,并将所述第二机器学习指令插入至第n条所述第一机器学习指令的后面,且所述第二机器学习指令的插入数量不超过所述第二机器学习指令对应的指令发射队列的队列长度。
[0033]在其中一个实施例中,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:
[0034]获取一个时间片内,同步指令的指令块之间的初始相对位置,其中,所述指令块包括至少一条机器学习指令;
[0035]调整所述指令块与其他机器学习指令之间的位置,获得所述同步指令的指令块之间的最终相对位置;
[0036]若所述最终相对位置小于所述初始相对位置,则根据所述最终相对位置确定所述同步指令的指令块调整后的最终位置。
[0037]在其中一个实施例中,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:
[0038]若在一个时间片内,存在先后的对同一段数据的多个乘法操作或激活操作,则将所述多个乘法操作或激活操作进行融合,得到融合后的机器学习指令。
[0039]例如,指令序列中先对数据乘以scale,再进行relu,若scale大于0,则可以把
scale乘到relu的斜率上,而去除乘scale的指令,其结果相同。
[0040]一种机器学习指令的转换装置,所述装置包括:
[0041]指令获取模块,用于获取机器学习指令序列;
[0042]指令划分模块,用于对所述机器学习指令序列进行划分,得到至少一个基本块,其中,所述基本块中包括至少一条机器学习指令;
[0043]指令转换模块,用于根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令。
[0044]一种板卡,所述板卡包括:机器学习处理器,所述机器学习处理器用于执行上述实施例中任一所述的方法。
[0045]一种主板,所述主板包括:通用处理器和如上述实施例中所述的板卡。
[0046]一种电子设备,所述电子设备包括如上述实施例中所述的主板。
[0047]上述机器学习指令的转换方法及装置、板卡、主板、电子设备,通过获取机器学习指令序列,并对该机器学习指令序列进行划分,得到至少一个基本块,进而根据窥孔优化算法对基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,从而实现了对机器学习指令的窥孔优化,以此减少了机器学习指令的时间开销,使得机器学习计算装置的整体性能大大提升。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器学习指令的转换方法,其特征在于,所述方法包括:获取机器学习指令序列;对所述机器学习指令序列进行划分,得到至少一个基本块,其中,所述基本块中包括至少一条机器学习指令;根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令;其中,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:获取连续排列数量超过n条的第一机器学习指令,其中,n为所述第一机器学习指令对应的指令发射队列的队列长度;将与所述第一机器学习指令在同一个时间片中并行执行的第二机器学习指令提前,并将所述第二机器学习指令插入至第n条所述第一机器学习指令的后面,且所述第二机器学习指令的插入数量不超过所述第二机器学习指令对应的指令发射队列的队列长度。2.根据权利要求1所述的方法,其特征在于,所述对所述机器学习指令序列进行划分,得到至少一个基本块,包括:查找所述机器学习指令序列中的跳转指令;根据所述跳转指令对所述机器学习指令序列进行划分,得到至少一个基本块。3.根据权利要求1所述的方法,其特征在于,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:获取所述基本块中的第一偏移寄存器指令;根据所述第一偏移寄存器指令,查找所述基本块中的第二偏移寄存器指令,其中,所述第一偏移寄存器指令和所述第二偏移寄存器指令用于对同一个寄存器中的值进行偏移;若所述第一偏移寄存器指令和所述第二偏移寄存器指令之间不存在使用所述寄存器中的值的机器学习指令,则合并所述第一偏移寄存器指令和所述第二偏移寄存器指令,得到合并后的偏移寄存器指令。4.根据权利要求1所述的方法,其特征在于,所述根据窥孔优化算法对所述基本块中的机器学习指令进行指令转换,得到转换后的机器学习指令,包括:获取所述基本块中的可提前机器学习指令;对所述可提前机器学习指令进行位置前移,并根据所述可提前机器学习指令前移后的位置,判断所述机器学习指令序列是否存在逻辑错误;若所述机器学习指令序列存在逻辑错误,则停止对所述可提前机器学习指令进行位置前移,并将所述可提前机器学习指令放置于所述机器学习指令序列不存在逻辑错误所对应的任一前移后的位置。5.根据权利要求4所述的方法,其特征在于,所述获取所述基本块中的可提前机器学习指令,包括:将所述基本块中的机器学习指...

【专利技术属性】
技术研发人员:ꢀ五一IntClG零六F八四一
申请(专利权)人:安徽寒武纪信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1