一种基于指数近似的可变精度浮点函数实现方法技术

技术编号：34099412 阅读：55 留言：0更新日期：2022-07-11 23:05

本发明专利技术公开了一种基于指数近似的可变精度浮点函数实现方法，该方法结合了IEEE 754浮点数表示形式特点和“空间交换时间”的思想。首先，将人工智能应用负载中高频调用的待求解的浮点函数转换为以2为底数的表达式。接着，对表达式的指数进行仿射变换(先平移后放缩)得到中间变量。最后，用中间变量的低位比特作为索引检索查找表，并用返回结果作为最终返回值的尾数域。该方法通过改变查找表规模控制浮点函数的计算精度。使用本发明专利技术可以实现一系列可变精度的浮点函数，具有较好的应用前景。具有较好的应用前景。具有较好的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于指数近似的可变精度浮点函数实现方法

[0001]本专利技术属于浮点数值计算领域，尤其涉及一种基于指数近似的可变精度浮点函数实现方法。

技术介绍

[0002]浮点函数是高性能应用中必不可少的重要组成，一般通过调用标准数学函数库实现，例如，Linux GNU C数学函数库、Python语言的数学模块等。这些标准数学函数库作为软件系统的重要组成部分，是影响高性能计算精度和运行性能的关键因素之一。尤其在生物医药、航空航天、国防军工等计算密集型应用领域，标准数学函数计算耗时占据相当大的比例。
[0003]在标准数学库的设计过程中，为了适用尽可能多的应用场景，浮点函数的实现一般会覆盖函数定义域的全部区间，并且尽可能地逼近当前浮点数类型的精度上限，以保证浮点函数在使用过程中不会出现准确性问题。
[0004]与传统的高精度计算相比，人工智能应用负载往往并不需要高精度，并且在模型推理场景中的精度要求比模型训练更低。因此，在IEEE754双精度浮点数(FP64)和单精度浮点数(FP32)之外，英伟达公司提出了半精度浮点数(FP16)。人工智能研究人员可以借助英伟达张量核(Tensor Cores)，通过设定混合或匹配不同级别的精度方式进行运算，从而优化计算资源，加速人工智能应用。
[0005]本专利技术针对人工智能应用负载对浮点运算误差具有一定容忍度的特点，从优化指数类浮点函数计算方法角度出发，充分结合IEEE754浮点数表示形式特点，采用“空间交换时间”的思想，提出了一种基于指数近似的可变精度浮点函数实...

【技术保护点】

【技术特征摘要】
1.一种基于指数近似的可变精度浮点函数实现方法，其特征在于，包括以下步骤：(1)将人工智能应用负载中高频调用的浮点函数转换为以2为底数的表达式；(2)根据步骤(1)得到的表达式，对该表达式的指数部分进行仿射变换得到中间变量；(3)根据步骤(2)得到的中间变量，取其高n位作为返回值的指数域，n为对应浮点数类型的指数域长度，取中间变量的高n位后的连续k位比特作为索引检索查找表，k为索引长度；(4)使用步骤(3)中查找表的返回结果作为最终返回值的尾数域。2.根据权利要求1所述基于指数近似的可变精度浮点函数实现方法，其特征在于，所述步骤(1)中的人工智能应用负载具体为包含神经网络模型的应用。3.根据权利要求1所述基于...

【专利技术属性】
技术研发人员：张青锖，蔡铭，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人