用于提高能量效率的错误感知运行时可配置存储器层级的系统和方法技术方案

技术编号：26173053 阅读：40 留言：0更新日期：2020-10-31 13:53

一种优化神经网络加速器(NNAccel)中的操作的方法(以及结构和计算机产品)，所述神经网络加速器包括作为NNAccel的计算级的神经网络层的层级和可配置的存储器模块的层级，其中该存储器模块包括一个或多个片上静态随机存取存储器(SRAM)模块和一个或多个动态随机存取存储器(DRAM)模块，每个存储器模块由可由NNAccel的控制器调节的多个操作参数控制。该方法包括检测当前正在被NNAccel使用的存储器模块的误比特率，并且由控制器确定所检测的误比特率是否足以满足NNAccel的处理的准确度的预定阈值。当准确度低于预定阈值时，由控制器动态地改变一个或多个存储器模块的一个或多个操作参数，以移动到更高准确度的状态。

全部详细技术资料下载

【技术实现步骤摘要】
用于提高能量效率的错误感知运行时可配置存储器层级的系统和方法
本专利技术涉及用于提高能量效率的错误感知运行时可配置存储器层级(memoryhierarchy)的系统和方法。
技术介绍
本专利技术总体上涉及神经网络加速器(NeuralNetworkAccelerator，NNAccel)。更具体地，错误控制单元使用与加速器相关联的错误简档(errorprofile)来确定作为动态闭环控制系统的存储器设备的可调参数的设置，以优化受制于(如通过准确度测量的)质量的约束的(如通过总能量消耗测量的)性能。
技术实现思路
分布式边缘计算包括将应用、数据和计算能力从集中点推向离用户更近的位置的任何类型的计算，从而提供更接近请求的低延迟。例如，在物联网(IoT)设备中，数据经由各种传感器从物理世界传入，并且经由各种形式的输出和执行器采取行动来改变状态。通过在边缘执行分析和知识生成，减少了受控制的系统和中央数据中心之间的通信带宽。在这种分布式边缘计算的范例中，边缘设备上的计算负载显著增加，尤其是在认知IoT...

【技术保护点】
1.一种优化神经网络加速器(NNAccel)中的操作的方法，所述神经网络加速器包括作为NNAccel的计算级的神经网络层的层级和可配置的存储器模块的层级，所述存储器模块包括一个或多个片上静态随机存取存储器(SRAM)模块和一个或多个动态随机存取存储器(DRAM)模块，每个存储器模块由可由NNAccel的控制器调节的多个操作参数控制，所述方法包括：/n检测当前正在被NNAccel使用的存储器模块的误比特率；/n由所述控制器确定所检测的误比特率是否足以满足NNAccel的处理的准确度的预定阈值；和/n当所述准确度低于所述预定阈值时，由所述控制器动态地改变一个或多个存储器模块的一个或多个操作参数，以...

【技术特征摘要】
20190425 US 16/394,2721.一种优化神经网络加速器(NNAccel)中的操作的方法，所述神经网络加速器包括作为NNAccel的计算级的神经网络层的层级和可配置的存储器模块的层级，所述存储器模块包括一个或多个片上静态随机存取存储器(SRAM)模块和一个或多个动态随机存取存储器(DRAM)模块，每个存储器模块由可由NNAccel的控制器调节的多个操作参数控制，所述方法包括：
检测当前正在被NNAccel使用的存储器模块的误比特率；
由所述控制器确定所检测的误比特率是否足以满足NNAccel的处理的准确度的预定阈值；和
当所述准确度低于所述预定阈值时，由所述控制器动态地改变一个或多个存储器模块的一个或多个操作参数，以移动到更高准确度的状态。

2.根据权利要求1所述的方法，其中，NNAccel包括人工智能(AI)加速器。

3.根据权利要求1所述的方法，其中，通过对来自所述存储器模块中的纠错码(ECC)单元的错误进行计数来检测误比特率。

4.根据权利要求1所述的方法，其中，误比特率由奇偶校验单元和内建自测试(BIST)单元中的一个来检测。

5.根据权利要求1所述的方法，其中，用于量化NNAccel的处理的准确度的度量包括NNAccel的推断准确度。

6.根据权利要求1所述的方法，还包括：
当确定NNAccel在预定准确度内操作时，由所述控制器进一步确定NNAccel是否在目标能量水平内操作；和
当NNAccel在所述目标能量水平之外操作时，由所述控制器动态地改变一个或多个存储器模块的一个或多个操作参数，以移动到更节能的状态。

7.根据权利要求1所述的方法，还包括：将参数值的组合的删减列表存储在NNAccel的非易失性存储器中，以提供NNAccel的可能的运行时配置的列表，所述列表中的每个配置标识用所述配置可实现的准确度的指示。

8.根据权利要求1所述的方法，其中，至少一个DRAM模块包括片外DRAM模块。

9.根据权利要求1所述的方法，所述方法在网络上的服务器上实现。

10.根据权利要求1所述的方法，所述方法被实现为云服务的一部分。

11.根据权利要求1所述的方法，所述方法在分布式边缘计算场景中实现，所述分布式边缘计算场景涉及物联网(IoT)设备的认知处理。

12.一种神经网络加速器(NNAccel)，包括：
神经网络层的层级，其包括NNAccel的计算级；和
可配置的存储器模块的层级，所述存储器模块包括一个或多个片上静态随机存取存储器(SRAM)模块和一个或多个动态随机存取存储器(DRAM)模块，每个存储器模块由可由NNAccel的控制器调节的多个操作参数控制，
其中，所述控制器由控制方法来控制NNAccel，所述控制方法包括：
检测当前正在被NNAccel使用的存储器模块的误比特率；
由所述控制器确定所检测的误比特率是否足以提供NNAccel的处理的准确度的预定阈值；和
当所述准确度低于所述预定阈值时，由所述控制器动态地改变一个...

【专利技术属性】
技术研发人员：A布尤克托苏诺格鲁，N钱德拉穆尔锡，PJ奈尔，KV斯瓦米纳坦，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人