使用紧凑的运算处理元件进行处理的计算设备制造技术

技术编号：13343057 阅读：38 留言：0更新日期：2016-07-13 20:56

本发明专利技术涉及处理器或其它设备，例如可编程和/或大规模并行的处理器或其它设备，包括设计成对低精度但高动态范围(LPHDR运算)的数值执行运算操作(可能但不一定包括例如加法、乘法、减法和除法中的一个或多个)的处理元件。这样的处理器或其它设备可例如在单芯片上实现。不管是否在单芯片上实现，在本发明专利技术的某些实施例中的处理器或其它设备中的LPHDR运算元件的数量都明显超过(例如，大于其3倍至少20个)在处理器或其它设备中的被设计成执行传统精度的高动态范围运算(例如32位或64位浮点运算)的运算元件(如果有的话)的数量。

全部详细技术资料下载

【技术实现步骤摘要】
使用紧凑的运算处理元件进行处理的计算设备本申请是申请日为2010年6月16日、申请号为201080036873.8，以及专利技术名称为“使用紧凑的运算处理元件进行处理”的中国专利技术专利申请的分案申请。
本专利技术通常涉及数据处理，特别是涉及数据计算。
技术介绍
快速计算的能力已变得对人类非常重要。天气和气候预报、医疗应用(例如药物设计和无创成像)、国防、地理勘探、金融建模、互联网搜索、网络通信、在各种领域中的科学研究，以及甚至新计算硬件的设计，每个都变得依赖于快速执行大量计算的能力。可看到、听到和理解的未来的进步，例如复杂纳米级系统的计算机辅助设计或消费产品的发展，将要求经济地获得甚至更大的计算能力。戈登·摩尔(GordonMoore)的预测(每美元的计算性能将每两年加倍)已证明在过去30年间是有效的，且看起来可能以某种形式继续。但尽管有这个快速的指数增加，事实是，可从硅获得的固有计算能力比从软件可获得的固有计算能力增长得快得多。换句话说，虽然计算硬件的理论计算能力指数地增长，但是，对于任何接近硬件的理论最大计算能力的情况，软件访问硬件所需要的接口限制了软件使用硬件来执行计算的能力。考虑包含大约十亿个晶体管的现代硅微处理器芯片，时钟大约是1GHz。在每个周期上，芯片将大约一个有用的运算操作传送到它正运行的软件。例如，一个值可能在寄存器之间传递，而另一值可能递增，也许实现乘法。这并不与芯片在30年前做的事情十分不同，虽然今天时钟速率也许快1000倍。真正的计算机被构造为物理设备，且由其构造了机器的物理机制常常展示复杂和有意义的行为。例如，硅MOSFET晶体...

【技术保护点】
一种计算设备，所述计算设备包括至少一个运算元件；其中所述至少一个运算元件能被配置成对一组输入信号执行运算操作，以产生输出信号；其中所述一组输入信号中的每个信号代表根据数字表示的数值；其中所述输出信号代表根据所述数字表示的数值；其中由所述数字表示所代表的所述数值的数值范围至少是从1/10000至10000；其中对于可能的多组输入信号的F％，所述F至少等于5，当所述至少一个运算元件对所述多组输入信号执行所述运算操作时，由所述输出信号代表的数值与对由所述多组输入信号代表的数值执行所述运算操作所得的数学上正确的结果相比，具有相对误差E％，所述E至少等于0.2；其中对于可能的多组输入信号的至少50％，当所述至少一个运算元件对所述多组输入信号执行所述运算操作时，由所述输出信号代表的数值与对由所述多组输入信号代表的数值采用IEEE754单精度浮点运算执行所述运算操作所得的结果相比，具有不大于50％的相对误差；并且，其中在所述设备中的所述至少一个运算元件的数量超过在所述设备中的被设计成执行具有至少32位字长的浮点数的浮点运算加法、减法、乘法和除法的运算元件的数量。

【技术特征摘要】
2009.06.19 US 61/218,691;2010.06.15 US 12/816,2011.一种计算设备，所述计算设备包括至少一个运算元件；其中所述至少一个运算元件能被配置成对一组输入信号执行运算操作，以产生输出信号；其中所述一组输入信号中的每个信号代表根据数字表示的数值；其中所述输出信号代表根据所述数字表示的数值；其中由所述数字表示所代表的所述数值的数值范围至少是从六万五千分之一至六万五千；其中对于所述运算操作的有效的输入的特定比例X％，所述X至少等于5，当所述至少一个运算元件对所述有效的输入的特定比例X％的输入信号执行所述运算操作时，由所述输出信号代表的数值与对由所述有效的输入的特定比例X％的输入信号代表的数值执行所述运算操作所得的数学上正确的结果相比，具有相对误差E％，所述E至少等于0.2；并且，其中在所述设备中的所述至少一个运算元件的数量超过在所述设备中的被设计成执行具有至少32位字长的浮点数的浮点运算加法、减法、乘法和除法的运算元件的数量。2.如权利要求1所述的设备，其中所述至少一个运算元件包括现场可编程门阵列FPGA的至少一部分。3.如权利要求1所述的设备,其中所述设备中的所述至少一个运算元件的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的三倍加20个之和。4.如权利要求3所述的设备，其中所述至少一个运算元件包括现场可编程门阵列FPGA的至少一部分。5.如权利要求1所述的设备，其中所述设备中的所述至少一个运算元件的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加50个之和。6.如权利要求1所述的设备，其中在所述设备中的所述至少一个运算元件的数量超过在设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加1000个之和。7.如权利要求1所述的设备，其中所述设备中的所述运算元件的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加100个之和。8.如权利要求1所述的设备，其中在所述设备中的所述至少一个运算元件的数量超过在设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加5000个之和。9.如权利要求1所述的设备，其中所述X至少等于10。10.如权利要求1所述的设备，其中所述运算操作是乘法。11.如权利要求1所述的设备，还包括：数字处理器，其用于控制所述至少一个运算元件的操作。12.如权利要求11所述的设备，还包括：存储器，所述至少一个运算元件能够对所述存储器进行本地访问。13.如权利要求12所述的设备，其中所述设备使用数字技术在硅芯片上实现。14.一种计算设备，所述计算设备包括至少一个运算元件；其中所述至少一个运算元件能被配置成对一组输入信号执行运算操作，以产生输出信号；其中所述一组输入信号中的每个信号代表根据混合信号表示的数值，所述混合信号表示由使用模拟表示代表的尾数和使用二进制数值表示代表的指数组成；其中所述输出信号代表根据混合信号表示的数值；其中由所述混合信号表示代表的所述数值的数值范围至少是从六万五千分之一至六万五千；其中对于所述运算操作的有效的输入的特定比例X％，所述X至少等于5，当所述至少一个运算元件对所述有效的输入的特定比例X％的输入信号执行所述运算操作时，由所述输出信号代表的数值与对由所述有效的输入的特定比例X％的输入信号代表的数值执行所述运算操作所得的数学上正确的结果相比，具有相对误差E％，所述E至少等于0.2；并且，其中在所述设备中的所述至少一个运算元件的数量超过在所述设备中的被设计成执行具有至少32位字长的浮点数的浮点运算加法、减法、乘法和除法的运算元件的数量。15.如权利要求14所述的设备,其中所述设备中的所述至少一个运算元件的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的三倍加20个之和。16.如权利要求14所述的设备，其中所述设备中的所述至少一个运算元件的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加50个之和。17.如权利要求14所述的设备，其中在所述设备中的所述至少一个运算元件的数量超过在设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加1000个之和。18.如权利要求14所述的设备，其中所述设备中的所述运算元件的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加100个之和。19.如权利要求14所述的设备，其中在所述设备中的所述至少一个运算元件的数量超过在设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加5000个之和。20.如权利要求14所述的设备，其中所述X至少等于10。21.如权利要求14所述的设备，其中所述运算操作是乘法。22.如权利要求14所述的设备，还包括：数字处理器，其用于控制所述至少一个运算元件的操作。23.如权利要求22所述的设备，还包括：存储器，所述至少一个运算元件能够对所述存储器进行本地访问。24.一种计算设备，包括至少一个第一低精度高动态范围LPHDR执行单元，其适合于对代表第一数值的第一输入信号执行第一运算，以产生代表第二数值的第一输出信号，其中，对所述第一运算的有效的输入的动态范围是至少宽至从1/65,000到65,000，和对于所述第一运算的有效的输入的特定比例X％，所述X大于等于5，当对来自所述第一运算的有效的输入的所述特定比例X％内的每一个特定输入重复地执行所述第一运算时，其中，对所述特定输入执行所述第一运算的所述低精度高动态范围LPHDR单元的所述第一输出信号所代表的数值的统计平均为所产生的结果，对所述特定输入的数值的利用IEEE754单精度浮点运算进行的所述第一运算的数学计算的结果为正确的结果，所述所产生的结果与所述正确的结果之间的差的绝对值不小于所述正确的结果的绝对值的Y，其中Y＝0.05％；其中所述计算设备使用三维制造技术实现。25.如权利要求24所述的设备，其中所述至少一个第一低精度高动态范围LPHDR执行单元包括现场可编程门阵列FPGA的至少一部分。26.如权利要求24所述的设备，其中，在所述设备中的所述低精度高动态范围LPHDR执行单元的总的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的三倍加20个之和。27.如权利要求24所述的设备，其中所述至少一个第一低精度高动态范围LPHDR执行单元包括现场可编程门阵列FPGA的至少一部分。28.如权利要求24所述的设备，其中在所述设备中的低精度高动态范围LPHDR执行单元的总的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加50个之和。29.如权利要求24所述的设备，其中在所述设备中的低精度高动态范围LPHDR执行单元的总的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加100个之和。30.如权利要求24所述的设备，其中在所述设备中的低精度高动态范围LPHDR执行单元的总的数量超过在所述设备中的被设计成执行传统精度的具有32位或更多位的字长的浮点运算加法、减法、乘法和除法的执行单元的总的数量，超过后者的执行单元的总的数量的五倍加100个之和，其中所述设备包括所述至少一个低精度高动态范围LPHDR执行单元局部可访问的存储器，且其中所述设备使用数字技术在硅芯片上实现。31.一种计算设备，包括至少一个第一低精度高动态范围LPHDR执行单元，其适合于对代表第一数值的第一输入信号执行第一运算，以产生代表第二数值的第一输出信号，其中，对所述第一运算的有效的输入的动态范围是至少宽至从1/...

【专利技术属性】
技术研发人员：约瑟夫·贝茨，
申请(专利权)人：奇异计算有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人