【技术实现步骤摘要】
可编程的混合精度运算单元
本申请涉及电子信息领域,尤其涉及一种可编程的混合精度运算单元。
技术介绍
深度神经网络在人工智能领域被广泛应用,其应用场景可以大致分为训练(Training)和推断(Inference)两种类型。其中推断算法对运算精度要求相对较低,多使用8位、16位定点精度;训练算法则大多要求达到16位或32位浮点精度。而现有的运算单元,或者仅支持8位或16位定点运算,仅适用于推断;或者,支持浮点运算,适用于训练和推断,但硬件成本高且耗能高,应用于推断场景下的能效比偏低。
技术实现思路
本申请提供了一种可编程的混合精度运算单元,目的在于解决既兼容定点和浮点运算、又具有较高能效比的问题。为了实现上述目的,本申请提供了以下技术方案:一种可编程的混合精度运算单元,包括:四个扩展的半精度乘法器、以及四个扩展的单精度加法器;任意一个所述扩展的半精度乘法器用于将输入数值扩展到X位,并计算第一数值和第二数值之积,其中,第一数值为一个输入数值扩展后的数值中的高位数值或低位数值,第二数值为另一个输入数值扩展后的数值中的高位数值或低位数值,X为预设数值;任意一个所述扩展的单精度加法器用于将输入数值扩展到Y位,并计算扩展后的数值之和,Y为预设数值;其中,所述四个扩展的半精度乘法器和所述四个扩展的单精度加法器以第一方式或第二方式连接;所述第一方式为:所述四个扩展的半精度乘法器与所述四个扩展的单精度加法器一一对应级联,构成四个并联的半精度乘加器;所述第二方式为:第一扩展的单精度加法器与第一扩展的半精度乘法器和第二扩展的半精度乘法器分别级联;第二扩展的单精度加法器与第三扩展的半 ...
【技术保护点】
1.一种可编程的混合精度运算单元,其特征在于,包括:四个扩展的半精度乘法器、以及四个扩展的单精度加法器;任意一个所述扩展的半精度乘法器用于将输入数值扩展到X位,并计算第一数值和第二数值之积,其中,第一数值为一个输入数值扩展后的数值中的高位数值或低位数值,第二数值为另一个输入数值扩展后的数值中的高位数值或低位数值,X为预设数值;任意一个所述扩展的单精度加法器用于将输入数值扩展到Y位,并计算扩展后的数值之和,Y为预设数值;其中,所述四个扩展的半精度乘法器和所述四个扩展的单精度加法器以第一方式或第二方式连接;所述第一方式为:所述四个扩展的半精度乘法器与所述四个扩展的单精度加法器一一对应级联,构成四个并联的半精度乘加器;所述第二方式为:第一扩展的单精度加法器与第一扩展的半精度乘法器和第二扩展的半精度乘法器分别级联;第二扩展的单精度加法器与第三扩展的半精度乘法器和第四扩展的半精度乘法器分别级联;第三扩展的单精度加法器与第一扩展的单精度加法器和第二扩展的单精度加法器分别级联。
【技术特征摘要】
1.一种可编程的混合精度运算单元,其特征在于,包括:四个扩展的半精度乘法器、以及四个扩展的单精度加法器;任意一个所述扩展的半精度乘法器用于将输入数值扩展到X位,并计算第一数值和第二数值之积,其中,第一数值为一个输入数值扩展后的数值中的高位数值或低位数值,第二数值为另一个输入数值扩展后的数值中的高位数值或低位数值,X为预设数值;任意一个所述扩展的单精度加法器用于将输入数值扩展到Y位,并计算扩展后的数值之和,Y为预设数值;其中,所述四个扩展的半精度乘法器和所述四个扩展的单精度加法器以第一方式或第二方式连接;所述第一方式为:所述四个扩展的半精度乘法器与所述四个扩展的单精度加法器一一对应级联,构成四个并联的半精度乘加器;所述第二方式为:第一扩展的单精度加法器与第一扩展的半精度乘法器和第二扩展的半精度乘法器分别级联;第二扩展的单精度加法器与第三扩展的半精度乘法器和第四扩展的半精度乘法器分别级联;第三扩展的单精度加法器与第一扩展的单精度加法器和第二扩展的单精度加法器分别级联。2.根据权利要求1所述的可编程的混合精度运算单元,其特征在于,所述扩展的半精度乘法器中包括:并联的一个单精度指数乘法器和一个扩展的半精度尾数乘法器;所述扩展的半精度尾数乘法器用于将输入数值扩展到X位,并计算所述第一数值和所述第二数值之积。3.根据权利要求1所述的可编程的混合精度运算单元,其特征在于,所述扩展的单精度加法器中包括:并联的一个单精度指数加法器和一个扩展的单精度尾数加法器;所述扩展的单精度尾数加法器用于将输入数值扩展到Y位,并计算扩展后的数值之和。4.一种可编程的混合精度运算单元,其特征在于,包括:四个扩展的单精度乘法器、以及四个扩展的双精度加法器;所述扩展的单精度乘法器为权利要求1-3任一项所述的可编程的混合精度运算单元;所述扩展的双精度加法器用于将输入数值扩展到M位,并计算扩展后的数值之和,M为预设数值;其中,所述四个扩展的单精度乘法器和四个扩展的双精度加法器以第一方式或第二方式连接;所述第一方式为:所述四个扩展的单精度乘法器与所述四个扩展的双精度加法器一一对应级联,构成四个并联的单精度乘加器;所述第二方式为:第一扩展的双精度加法器与第一扩展的单精度乘法器和第二扩展的单精度乘法器分别级联;第二扩展的双精度加法器与第三扩展的单精度乘法器和第四扩展的单精度乘法器分别级联;第三扩展的双精度加法器与第一扩展的双精度加法器和第二扩展的双精度加法器分别级联。5.根据权利要求4所述的可编程的混合精度运算单元,其特征在于,所述扩展的双精度加法器中包括:并联的一个双精度指数加法器和一个扩展的双精度尾数加法器;所述扩展的双精度尾数加法器用于将输入数值扩展到M位,并计算扩展后的数值之和。6.一种可编程的混合精度运算单元,其特...
【专利技术属性】
技术研发人员:刘彦,赵立东,
申请(专利权)人:上海燧原科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。