【技术实现步骤摘要】
本申请涉及计算机处理器,尤其涉及一种浮点乘加指令的延迟降低的方法及其装置。
技术介绍
1、浮点乘加(fused multiply-add,fma)指令将独立的浮点乘法和浮点加法运算融合为一种运算,fma指令事实上包括浮点乘法(floating point multiply,fmul)和浮点加法(floating point add,fadd)两部分。其中浮点乘法fmul使用前两个操作数,浮点加法fadd使用浮点乘法fmul的结果和第三个操作数。对于流水线中的浮点乘加fma操作来说,先做乘法,乘法结束才会涉及到做加法,如src1*src2+src3,也就是说src3在src1*src2执行结束才会用到。处理器按照流水线执行指令,src1和src2做乘法时用不到src3。如果src3与执行序在其前面的指令存在数据相关时,当操作数src1和src2的值已经准备就绪了,但是第三操作数src3前面的指令还未完成,即src3还未准备就绪,流水线需要等待src3准备就绪才能继续执行,因此就会造成延迟,并会造成流水线的堵塞。
2、fma指令
...【技术保护点】
1.一种浮点乘加指令的延迟降低的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取所述第三操作数对应的就绪时钟周期,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述就绪时钟周期确定所述FMA指令的指令发射时钟周期,包括:
4.根据权利要求3所述的方法,其特征在于,所述在所述指令发射时钟周期将所述FMA指令发射至浮点乘加部件之后,还包括:
5.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
6.根据权利要求1或5所述的方法,其特征在于,所述在所述指令发射时钟周期
...【技术特征摘要】
1.一种浮点乘加指令的延迟降低的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取所述第三操作数对应的就绪时钟周期,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述就绪时钟周期确定所述fma指令的指令发射时钟周期,包括:
4.根据权利要求3所述的方法,其特征在于,所述在所述指令发射时钟周期将所述fma指令发射至浮点乘加部件之后,还包括:
5.根据权利要求1所述的方法,其特征在于,所述方...
【专利技术属性】
技术研发人员:郇丹丹,李祖松,
申请(专利权)人:北京微核芯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。