当前位置: 首页 > 专利查询>浙江大学专利>正文

一种面向DNN模型的Crossbar级异构ReRAM加速器配置方法及系统技术方案

技术编号:40524871 阅读:21 留言:0更新日期:2024-03-01 13:44
本发明专利技术提供了一种面向DNN模型的Crossbar级异构ReRAM加速器配置方法及系统,本发明专利技术面向基于ReRAM的存内计算架构,分析模型层中权重参数与Crossbar大小在性能表现中的关系,提出分层异构的思想;使用强化学习算法自动化进行模型异构配置,在不损失模型精度的情况下,能够有效提升Crossbar利用率,降低系统计算延迟和能耗。

【技术实现步骤摘要】

本专利技术涉及计算机科学人工智能领域,尤其涉及一种面向dnn模型的crossbar级异构reram加速器配置方法及系统。


技术介绍

1、人工智能技术已经在众多领域发挥作用,并受到了业界和学术界的极大关注。深度神经网络(dnn)作为人工智能神经网络的进化形式,其应用覆盖了各个领域,如图像处理、语音识别、自然语言处理、推荐系统等。然而,为了提高神经网络在训练和推理过程中的表现,网络的层数不断加深,参数量不断增大,这带来了对计算资源的巨大需求。传统的计算硬件,如中央处理器(cpu)和图形处理器(gpu),在处理复杂的dnn模型时往往面临计算能力瓶颈,这限制了模型的规模和性能。其次,dnn的计算流程通常需要大量的数据传输和存储。传统的存储解决方案,如动态随机存储器(dram),在处理海量数据时可能成为性能瓶颈。再者,高性能计算硬件通常需要大量的电能供应,这导致了高昂的能源成本,并对环境产生不利影响。此外,对于移动设备和嵌入式系统,高功耗也限制了电池寿命和设备的便携性。随着dnn模型的不断发展,它们的规模和复杂性也在迅速增加。这需要更多的存储和更高的计算能力,因此需本文档来自技高网...

【技术保护点】

1.一种面向DNN模型的Crossbar级异构ReRAM加速器配置方法,其特征在于,具体为:

2.根据权利要求1所述的方法,其特征在于,每一网络层的结构信息包括:网络层编号、网络层类型、输入通道数、输出通道数、网络层卷积核的大小、卷积步长、网络层权重参数量、输入特征图的大小中的一种或多种。

3.根据权利要求1所述的方法,其特征在于,在每次迭代中,还包括将状态、动作、奖励的组合记作一次经验样本并存储至经验池中。

4.根据权利要求3所述的方法,其特征在于,在每个批次迭代配置中,全部迭代完毕后,会从经验池中采样出一批样本数据,对现实表演者和现实评论者进行训练...

【技术特征摘要】

1.一种面向dnn模型的crossbar级异构reram加速器配置方法,其特征在于,具体为:

2.根据权利要求1所述的方法,其特征在于,每一网络层的结构信息包括:网络层编号、网络层类型、输入通道数、输出通道数、网络层卷积核的大小、卷积步长、网络层权重参数量、输入特征图的大小中的一种或多种。

3.根据权利要求1所述的方法,其特征在于,在每次迭代中,还包括将状态、动作、奖励的组合记作一次经验样本并存储至经验池中。

4.根据权利要求3所述的方法,其特征在于,在每个批次迭代配置中,全部迭代完毕后,会从经验池中采样出一批样本数据,对现实表演者和现实评论者进行训练优化。

5.根据权利要求3所述的方法,其特征在于,所述基于强化学习进行迭代配置过程中,前若干个批次为热身阶段,动作随机产生。

<...

【专利技术属性】
技术研发人员:何水兵朱建新吴桐杨斯凌陈平
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1