计算机可读存储介质、计算机实施的方法和计算逻辑区段技术

技术编号:24613613 阅读:26 留言:0更新日期:2020-06-24 01:12
本发明专利技术的各个方面包括一种计算机器的高精度log1p()计算逻辑区段,所述计算机器的高精度log1p()计算逻辑区段使用估测函数E(x)对函数F(x)=log1p(x)=ln(x+1)进行近似且进行至少以下操作:(i)接收输入x,(ii)只使用本机精度计算(x+1),(iii)计算整数N,使得:(4/3)2

Computer readable storage medium, computer implementation method and calculation logic section

【技术实现步骤摘要】
计算机可读存储介质、计算机实施的方法和计算逻辑区段
本公开涉及高精度计算,且更具体来说涉及一种用于log1p()的高精度计算的装置及方法。
技术介绍
如今的计算机器比以往任何时候都更强大且高效。举例来说,图形处理单元(graphicsprocessingunit,GPU)每秒可执行数十亿次计算。例如智能手机、平板计算机(tablet)、膝上型计算机及个人计算机等其他器件中所包括的嵌入式存储器及处理器的处理速度持续提高。然而,一些种类的计算是资源密集型的,因此改为使用近似,或者依赖于查找表,而查找表会占用硅芯片上的面积、增加访问延迟(latency)、增加存储器带宽并导致器件的存储器占用的总体增加。一种实施超越函数(transcendentalfunction)(例如对数(logarithm))的方式是实施不同的非超越数学函数,由非超越数学函数在有限域内将所需函数近似到足够的准确度、但计算起来更简单。此种近似函数通常是简单多项式(polynomial)、多项式比率、泰勒级数(Taylorseries)、样条(spline)(即,在子域内的更简单近似的分段集合)、切比雪兹多项式(Chebyshezpolynomial)或它们的一些组合。当输入值处于近似的有限域之外时,实施方案会利用数学恒等式导出处于近似的域中的另一个值,且使用恒等式公式导出正确结果。这在行业内被称为“范围缩减(rangereduction)”,但实际上“域缩减”会更准确。对于例如ln(x)等简单对数函数,范围缩减恒等式是ln(x)=ln(S*x)–ln(S),其中S是某个标度因数(scalefactor),通常是二的幂,且近似函数的域通常是二的幂,包括x=1.0。举例来说:sqrt(0.5)<=x<=sqrt(2)。对于log1p(x)=ln(1+x),范围缩减恒等式是log1p(x)=log1p(S*(1+x)–1)–ln(S),其中S是某个标度因数,通常是2的幂,且近似函数的域是包括x=0的某个范围。当输入x是小的量值(即,绝对值)时,会出现困难。将项“x+1”与本机精度算术进行组合会导致不可接受地损失精度。举例来说,如果x为O(2-10),则此运算将损失10位精度。因此,目前的做法是使用扩展精度算术来执行“S*(1+x)–1”的计算,这在计算资源(例如,时间、空间、能量)方面通常是昂贵的。
技术实现思路
本专利技术的各个方面包括一种高精度log1p()计算逻辑区段,所述高精度log1p()计算逻辑区段使用估测函数E(x)对函数F(x)=log1p(x)=ln(x+1)进行近似且进行至少以下操作:(i)接收输入x,(ii)只使用本机精度计算(x+1),(iii)计算整数N,使得:(4/3)2N-1≤(x+1)≤(4/3)2N,(iv)计算fN(x)=Sx+(S-1),其中S=2-N,(v)计算E(fN(x)),以及(vi)返回值v=E(fN(x)+Nln(2))作为对F(x)=log1p(x)的近似。一些实施例包括一种用于log1p()的高精度计算的由计算机实施的方法。所述方法可包括:由计算机器的高精度log1p()计算逻辑区段使用估测函数E(x)对函数F(x)=log1p(x)=ln(x+1)进行近似;由所述计算机器的所述高精度log1p()计算逻辑区段接收输入x;由所述计算机器的所述高精度log1p()计算逻辑区段只使用本机精度计算(x+1);由所述计算机器的所述高精度log1p()计算逻辑区段计算整数N,使得:(4/3)2N-1≤(x+1)≤(4/3)2N;由所述计算机器的所述高精度log1p()计算逻辑区段计算fN(x)=Sx+(S-1),其中S=2-N;由所述计算机器的所述高精度log1p()计算逻辑区段计算E(fN(x));以及由所述计算机器的所述高精度log1p()计算逻辑区段返回值v=E(fN(x)+Nln(2))作为对F(x)=log1p(x)的近似。本专利技术特征中的某些特征可通过在图形处理单元(GPU)中或ARM处理器核内实施而得到最好地实现。其他类型的处理器或专用集成电路(applicationspecificintegratedcircuit,ASIC)可实施本文中所公开的专利技术原理。本专利技术概念可在处理器和/或各种移动器件(例如智能手机、平板计算机、笔记本计算机等)的存储器模块内实施或在各种固定器件(例如桌上型计算机、路由器等)中实施。附图说明参照附图阅读以下详细说明,本专利技术原理的上述及附加特征及优点将变得更显而易见,在附图中:图1A是根据本文中所公开实施例的包括高精度log1p()计算逻辑区段的计算机器的示例性方块图。图1B是根据本文中所公开实施例的包括嵌入在一个或多个微处理器中的高精度log1p()计算逻辑区段的另一计算机器的示例性方块图。图1C是示出根据本文中所公开实施例的用于执行高精度log1p()计算的技术的示例性流程图。图1D是示出根据本文中所公开实施例函数集fN的每一函数是线性的图。图2是示出根据本文中所公开实施例的用于执行高精度log1p()计算的另一技术的示例性流程图。图3是根据本文中所公开实施例的包括高精度log1p()计算逻辑区段的图形处理单元(GPU)的示例性方块图。图4是根据本文中所公开实施例的包括高精度log1p()计算逻辑区段的智能手机的示例性方块图。图5是根据本文中所公开实施例的包括高精度log1p()计算逻辑区段的平板计算机的示例性方块图。图6是根据本文中所公开实施例的包括高精度log1p()计算逻辑区段的计算机的示例性方块图。图7是根据本文中所公开实施例的包括高精度log1p()计算逻辑区段的计算系统的示例性方块图。[符号的说明]105、108:计算机器;110:高精度log1p()计算逻辑区段;115、118:微处理器;120:存储器器件;125:存储单元;130:显示器;135:输入/输出(I/O)接口芯片;140:log1p()函数输入;145:log1p()范围缩减技术;150:log1p()函数输出;180、200:流程图;182、184、186、188、190、192、205、210、215、220、225、230、235、240、245:步骤;195:图;305:图形处理单元(GPU);405:智能手机;505:平板计算机;605:计算机;700:计算系统;705:系统总线;710:时钟;715:随机存取存储器(RAM)和/或闪存;720:用户接口;725:调制解调器;740:电池;745:存储器控制器。具体实施方式现将详细参照本专利技术概念的实施例,本专利技术概念的实施例在附图中示出。在以下详细说明中,阐述诸多具体细节以实本文档来自技高网
...

【技术保护点】
1.一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有指令,所述指令在由计算机处理器执行时使高精度log1p()计算逻辑区段使用估测函数E(x)对函数F(x)=log1p(x)=ln(x+1)进行近似且进行至少以下操作:/n(i)接收输入x,/n(ii)只使用本机精度计算(x+1),/n(iii)计算整数N,使得:(4/3)2

【技术特征摘要】
20181217 US 62/780,922;20190213 US 16/275,3021.一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有指令,所述指令在由计算机处理器执行时使高精度log1p()计算逻辑区段使用估测函数E(x)对函数F(x)=log1p(x)=ln(x+1)进行近似且进行至少以下操作:
(i)接收输入x,
(ii)只使用本机精度计算(x+1),
(iii)计算整数N,使得:(4/3)2N-1≤(x+1)≤(4/3)2N
(iv)计算fN(x)=Sx+(S-1),其中S=2-N
(v)计算E(fN(x)),以及
(vi)返回值v=E(fN(x)+Nln(2))作为对F(x)=log1p(x)的近似。


2.根据权利要求1所述的非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有指令,所述指令在由所述计算机处理器执行时,使所述高精度log1p()计算逻辑区段将所返回的所述值存储在非易失性存储单元中。


3.根据权利要求1所述的非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有指令,所述指令在由所述计算机处理器执行时,使所述高精度log1p()计算逻辑区段将所返回的所述值存储在易失性存储器器件中。


4.根据权利要求1所述的非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有指令,所述指令在由所述计算机处理器执行时,使所述高精度log1p()计算逻辑区段通过输入/输出接口芯片传送所返回的所述值。


5.根据权利要求1所述的非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有指令,所述指令在由所述计算机处理器执行时,使所述高精度log1p()计算逻辑区段在显示器件上显示所返回的所述值。


6.一种用于log1p()的高精度计算的由计算机实施的方法,所述方法包括:
由计算机器的高精度log1p()计算逻辑区段使用估测函数E(x)对函数F(x)=log1p(x)=ln(x+1)进行近似,
由所述计算机器的所述高精度log1p()计算逻辑区段接收输入x,
由所述计算机器的所述高精度log1p()计算逻辑区段只使用本机精度计算(x+1),
由所述计算机器的所述高精度log1p()计算逻辑区段计算整数N,使得:(4/3)2N-1≤(x+1)≤(4/3)2N
由所述计算机器的所述高精度log1p()计算逻辑区段计算fN(x)=Sx+(S-1),其中S=2-N
由所述计算机器的所述高精度log1p()计算逻辑区段计算E(fN(x)),以及
由所述计算机器的所述高精度log1p()计...

【专利技术属性】
技术研发人员:吉姆·康尼汉
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1