【技术实现步骤摘要】
数据处理器和电子设备
[0001]本公开涉及浮点数的运算
,更具体地,涉及一种数据处理器和电子设备。
技术介绍
[0002]随着人工智能以及大数据技术的快速发展,对计算机的计算能力要求越来越高。各类机器学习算法如混合精度训练(Mixed Precision Training,MPT)在增加神经网络大小时会提高计算的准确性,但同时也会增加训练模型的内存和计算需求。MPT使用半精度浮点数(Float Point 32,FP16)存储权重和梯度,在减少占用内存的同时起到了加速训练的效果。
[0003]相关技术中,为了尽量不丢失精度的同时便于浮点运算,通常使用非标的FP48(Float Point 48)来保存累加(Psum)结果。以及,为了支持多种数据类型(如Int8、Uint8、Int1 6、FPl 6)的Psum运算,计算单元采用加法器复用的形式来节省面积。由于浮点数的加法单次运算需要经过对阶、尾数求和、规格化、舍入和溢出检测等五个步骤,这些步骤通常需要2~3个时钟周期(Clock Cycle)来完成运算过程。对 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理器,包括:数据预处理电路,包括输入端和输出端;所述数据预处理电路配置为对经由所述输入端接收的待处理数据进行预处理,得到第一运算结果,其中,所述待处理数据包括标识符,以及经由所述输出端输出所述第一运算结果;确定电路,与所述数据预处理电路电连接,配置为根据所述待处理数据的标识符和在后处理周期的待处理数据的标识符,确定当前处理周期的待处理数据与所述在后处理周期的待处理数据是否为累加数据,得到确定结果;其中,所述在后处理周期为所述当前处理周期的下一处理周期;数据归一化电路,与所述确定电路电连接,配置为将所述第一运算结果进行归一化处理;以及根据所述确定结果,将归一化后的第一运算结果输出至所述数据预处理电路;数据运算电路,与所述数据归一化电路电连接,配置为对所述归一化后的第一运算结果进行处理,得到针对所述当前处理周期的第二运算结果。2.根据权利要求1所述的处理器,其中,所述数据归一化电路包括:数据归一化子电路,与所述确定电路电连接,配置为将所述第一运算结果进行归一化处理,得到归一化后的第一运算结果;第一寄存器,与所述数据归一化子电路电连接,配置为将所述归一化后的第一运算结果进行延时处理,得到延时后的第一运算结果;以及根据所述确定结果,将延时后的第一运算结果输出至所述数据预处理电路;其中,所述延时后的第一运算结果用于预处理所述在后处理周期的待处理数据,以完成对所述在后处理周期的待处理数据的处理。3.根据权利要求1所述的处理器,其中,所述数据运算电路包括:舍入子电路,配置为对所述归一化后的第一运算结果进行舍入处理,得到舍入后的第一运算结果;溢出检查子电路,配置为对所述舍入后的第一运算结果进行溢出检查,得到溢出检查结果;后舍入子电路,配置为根据所述溢出检查结果,对所述舍入后的第一运算结果进行后舍入处理,得到针对所述当前处理周期的第二运算结果。4.根据权利要求1所述的处理器...
【专利技术属性】
技术研发人员:孙浩威,孙福海,
申请(专利权)人:北京奕斯伟计算技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。