【技术实现步骤摘要】
一种基于FPGA模拟的阻变神经网络加速器评估方法
本专利技术涉及存算一体体系结构领域,尤其涉及一种基于FPGA模拟的阻变神经网络加速器评估方法。
技术介绍
忆阻器阵列集成计算和存储功能,常通过非易失性阻性随机访问存储(ReRAM)实现。在神经元结构中,突触可以根据在其两端的神经元的激励发生变化,在忆阻器阵列中可以在ReRAM两端外加电压来改变其电导值进行神经计算。利用ReRAM器件的特性,可以外加数字电压,将电压进行数模转换得到模拟电压值,加在器件两端的模拟电压和器件预编程的电导值通过欧姆定律和基尔霍夫定律计算得出流出器件的电流值,将电流值进行模数转换得到计算的数字结果,实现存算一体的功能。现阶段的存算一体神经网络加速器通常进行分层拓扑架构设计。有文献对存算一体神经网络加速器的架构进行Chip、Tile、IMA、Crossbar四层架构设计。Chip以集中网络的形式连接多个Tile;Tile通过多个共享总线连接多个IMA和累加器等功能单元;IMA通过共享总线连接多个Crossbar和数模转换器等功能单元。类似的,有文 ...
【技术保护点】
1.一种基于FPGA模拟的阻变神经网络加速器评估方法,其特征在于,包括以下步骤:/n步骤1、架构设计;/n步骤2、指令集设计;/n步骤3、加速器硬件设计,硬件并行;/n步骤4、加速器软件库设计,通用指令集,软件调度分时复用方案。/n
【技术特征摘要】
1.一种基于FPGA模拟的阻变神经网络加速器评估方法,其特征在于,包括以下步骤:
步骤1、架构设计;
步骤2、指令集设计;
步骤3、加速器硬件设计,硬件并行;
步骤4、加速器软件库设计,通用指令集,软件调度分时复用方案。
2.如权利要求1所述的基于FPGA模拟的阻变神经网络加速器评估方法,其特征在于,所述步骤1支持Core、Tile、Crossbar三层架构。
3.如权利要求1所述的基于FPGA模拟的阻变神经网络加速器评估方法,其特征在于,所述步骤2指令集包括在线编程的LdWGT指令、用于配置的SetTile指令。
4.如权利要求1所述的基于FPGA模拟的阻变神经网络加速器评估方法,其特征在于,所述步骤3硬件并行包括构建向量矩阵乘法运算模块、构建向量ALU运算模块。
5.如权利要求4所述的基于FPGA模拟的阻变神经网络加速器评估方法,其特征在于,所述步骤3构建向量矩阵乘法运算模块:利用DSP搭建乘累加树实现向量矩阵乘法运算模块,增加循环控制逻辑保证忆阻器阵列的功能模拟;插入触发器,使向量矩阵乘法运算模块单周期可以获得一个1×16的向量和16×16的矩阵的乘法运算结果。
6.如权利要求4所述的基于FPGA模拟的阻变神...
【专利技术属性】
技术研发人员:景乃锋,石永泉,孙永帅,蒋剑飞,绳伟光,贺光辉,王琴,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。