硬件加速器和用于在硬件加速器中计算的方法技术

技术编号:36701225 阅读:36 留言:0更新日期:2023-03-01 09:18
公开了硬件加速器和用于在硬件加速器中计算的方法。所述用于计算的方法包括:接收被表示为浮点的多个输入数据;通过基于每个输入数据的指数的大小对每个输入数据的尾数执行掩蔽来调整尾数的位宽;以及执行具有已调整的位宽的输入数据之间的运算。位宽的输入数据之间的运算。位宽的输入数据之间的运算。

【技术实现步骤摘要】
硬件加速器和用于在硬件加速器中计算的方法
[0001]本申请要求于2021年8月23日在韩国知识产权局提交的第10

2021

0111118号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。


[0002]下面的描述涉及一种硬件加速器和用于在硬件加速器中计算的方法。

技术介绍

[0003]人工神经网络可通过参考计算架构而被实现。各种类型的电子系统可使用人工神经网络分析输入数据并提取有效信息。用于处理人工神经网络的设备可能需要针对复杂的输入数据进行大量的计算。这样的技术可能无法有效地处理与用于通过使用人工神经网络分析大量的输入数据来提取期望的信息的与人工神经网络相关的运算。

技术实现思路

[0004]提供
技术实现思路
以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在确定要求保护的主题的关键特征或必要特征,也不意在用于帮助确定要求保护的主题的范围。
[0005]在一个总体方面,一种用于在硬件加速器中计算的方法包括:通过动本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于在硬件加速器中计算的方法,包括:通过动态浮点转换器接收被表示为浮点的多个输入数据;通过动态浮点转换器通过基于每个输入数据的指数的大小对每个输入数据的尾数执行掩蔽来调整尾数的位宽;以及通过混合精度计算单元执行具有已调整的位宽的输入数据之间的运算。2.根据权利要求1所述的方法,其中,针对每个输入数据,通过动态浮点转换器调整尾数的位宽的步骤包括:与输入数据的大小成比例地调整尾数的位宽。3.根据权利要求1所述的方法,其中,针对每个输入数据,通过动态浮点转换器调整尾数的位宽的步骤包括:通过比较器将输入数据与阈值进行比较;通过控制器基于比较的结果来调整尾数的位宽;以及通过寄存器存储具有已调整的位宽的输入数据和关于位宽的信息。4.根据权利要求3所述的方法,其中,阈值基于输入数据的分布和容许误差范围被确定。5.根据权利要求1所述的方法,还包括:接收所述多个输入数据的分布;以及通过控制器基于所述多个输入数据的分布确定对应于所述多个输入数据中的每个输入数据的阈值。6.根据权利要求1所述的方法,其中,执行所述运算的步骤包括:控制具有已调整的位宽的输入数据被输入到的运算器的分组和时序。7.根据权利要求1至权利要求6中的任意一项所述的方法,其中,执行所述运算的步骤包括:基于每个输入数据的已调整的位宽,确定由预设数量的运算器执行的运算的周期的数量;以及基于确定的周期的数量将具有已调整的位宽的输入数据输入到预设数量的运算器。8.根据权利要求7所述的方法,其中,确定运算的周期的数量的步骤包括:基于每个输入数据的尾数的已调整的位宽以及预设数量的运算器在单个周期中能处理的位的数量来确定运算的周期的数量。9.根据权利要求7所述的方法,其中,每个运算器包括:乘法器,被配置为:执行输入数据的尾数的整数乘法;移位器,被配置为:对乘法器的结果进行移位;以及累加器,被配置为:将移位结果累加。10.根据权利要求1至权利要求6中的任意一项所述的方法,其中,执行所述运算的步骤包括:基于每个输入数据的尾数的已调整的位宽,确定用于在预设数量的运算周期内执行运算的运算器的数量;以及基于确定的运算器的数量,将具有已调整的位宽的输入数据输入到运算器。11.根据权利要求10所述的方法,其中,确定运算器的数量的步骤包括:基于每个输入数据的尾数的已调整的位宽以及运算器在单个周期中能处理的位的数量来确定运算器的
数量。12.根据权利要求3所述的方法,其中,调整尾数的位宽的步骤包括:与响应于指数大于或等于阈值相比,响应于指数小于阈值而向尾数分配较小的位宽。13.根据权利要求1所述的方法,其中,执行所述运算的步骤包括:使用运算器,并且尾数的已调整的位宽小于或等于运算器在单个周期中能处理的位的数量。14.根据权利要求3所述的方法,其中,调整尾数的位宽的步骤包括:响应于指数大于或等于阈值而保持尾数的位宽。15.根据权利要求3所述的方法,其中,阈值包括多个阈值范围,每个阈值范围对应于相应的位宽,并且调整尾数的位宽的步骤包括:响应于输入数据对应于所述多个阈值范围中的一个阈值范围,将尾数的位宽调整为与所述多个阈值范围中的所述一个阈值范围对应的位宽。16.根据权利要求1所述的方法,其中,执行所述运算的步骤包括:使用运算器执行乘法运算和累加运算。17.一种硬件加速器,包括:动态浮点转换器,被配置为:接收被表示为浮点的多个输入数据,通过基于每个输入数据的指数的大小对每个输入数据的尾数执行掩蔽来调整尾数的位宽;混合精度计算单元,包括一个或者多个运算器,所述一个或多个运算器被配置为:执行具有已调整的位宽的输入数据之间的运算;以及控制单元。18.根据权利...

【专利技术属性】
技术研发人员:金东英
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1