【技术实现步骤摘要】
累加装置、方法及可读存储介质
[0001]本专利技术一般地涉及计算机领域。更具体地,本专利技术涉及累加装置、方法及可读存储介质。
技术介绍
[0002]计算机经常需要进行浮点数的累加,其是利用多级累加树来完成的。以8个浮点数累加为例,第一级需要4个加法器,两两做加法,得到4个数,第二级需要2个加法器,再两两做加法,得到2个数,第三级需要1个加法器,将两个数相加,得到最后累加结果。这种累加树的布局面积大,且精度不理想。
[0003]再者,在一些特殊应用中,例如神经网络的卷积层和全连接层,会需要将浮点数累加后的结果量化成定点数再输入至华莱士树进行相乘,前述的累加树的结果依旧是浮点数,还需要经过转换才能成为定点数被华莱士树所接受,对于运算的连贯性上并不友善。
[0004]因此,一种有效的浮点数累加方案是迫切需要的。
技术实现思路
[0005]为了至少部分地解决
技术介绍
中提到的技术问题,本专利技术的方案提供了一种累加装置、方法及可读存储介质。
[0006]在一个方面中,本专利技术揭露一种累加装 ...
【技术保护点】
【技术特征摘要】
1.一种累加装置,用以累加识别集群中的多个浮点数,每个浮点数以阶码与尾数来表示,所述累加装置包括:识别模块,用以识别基准阶码,所述基准阶码为所述多个浮点数中的阶码的最大值;筛选模块,用以根据所述基准阶码筛选出累加集群,所述累加集群为所述识别集群的子集;以及加法模块,用以对所述累加集群中的浮点数执行累加。2.根据权利要求1所述的累加装置,其中所述识别模块包括多级二输入比较器,每级比较器对所述多个浮点数的阶码两两比较,输出较大的阶码至下一级比较器。3.根据权利要求1所述的累加装置,其中所述筛选模块包括:减法器,用以获得每个阶码与所述基准阶码的差值;比较器,用以判断所述差值是否小于阈值;第一暂存器,用以存储所述差值小于所述阈值的浮点数;以及第二暂存器,用以存储所述差值不小于所述阈值的浮点数;其中,所述累加集群包括所述第一暂存器中的所有浮点数。4.根据权利要求3所述的累加装置,还包括:集群模块,用以将所述第二暂存器中的浮点数更新为所述识别集群中的浮点数;其中,所述识别模块、所述筛选模块及所述加法模块基于更新后的识别集群执行识别、筛选及累加的操作。5.根据权利要求3所述的累加装置,其中所述加法模块包括多个移位单元,分别用以基于所述差值对相应的尾数进行移位,移位后的所有尾数具有所述阈值减一个位数。6.根据权利要求5所述的累加装置,其中当所述移位单元判断移位后的尾数所移出的位数皆为0时,则将移位后的尾数的粘滞位(sticky bit)设定为0,当所述移位单元判断移位后的尾数所移出的位数皆为1时,则将所述粘滞位设定为1。7.根据权利要求5所述的累加装置,其中所述加法模块还包括第一转换器,用以将移位后的尾数转换成补码。8.根据权利要求7所述的累加装置,其中所述加法模块还包括华莱士树加法器,用以对所述累加集群中的所有补码累加,以产生累加值...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。