基于RISC-V架构的长短期记忆网络加速器系统及其控制方法技术方案

技术编号:42373234 阅读:31 留言:0更新日期:2024-08-16 14:56
本发明专利技术公开了基于RISC‑V架构的长短期记忆网络加速器系统及其控制方法。属于处理器与神经网络领域,系统包括指令派遣模块、指令译码模块、运算模块、加速器内存控制模块、缓存模块、运算单元控制模块、处理器内存控制模块;本发明专利技术在具备ASIC的高能效优势的同时具备CPU的通用性和灵活性,可通过自定义拓展指令灵活配置LSTM加速器的计算维度、关键运算颗粒度和关键运算迭代次数,从而调整LSTM前向推理计算过程的功耗、速度和精度,能够适应不同的应用场景。

【技术实现步骤摘要】

本专利技术属于处理器与神经网络领域,具体涉及基于risc-v架构的长短期记忆网络加速器系统及其控制方法。


技术介绍

1、lstm(long short-term memory,长短期记忆网络)属于循环神经网络(recurrentneural network,简称rnn)的一种,其通过设计“遗忘门”、“输入门”和“输出门”有效解决了rnn中梯度消失和爆炸的问题,因此广泛用于长时多维时间序列预测。然而,由于lstm前向推理算法过程复杂,权重参数规模大,如何以高性能和低功耗的方式实现lstm应用是目前研究的热点。

2、目前lstm的主流实现方式有cpu、gpu、asic。cpu平台软件算法开发灵活,易于移植,但其处理并行度受限,无法满足高算力的应用场景;gpu平台拥有充足算力,可以并发进行大量浮点运算,但其工作功耗大,对嵌入式应用场景不友好;asic全定制芯片能效高,但其流片完成后算法设计固定,可配置度低,无法有效满足不同的应用需求。


技术实现思路

1、本专利技术的目的在于克服各传统平台实现lstm前向本文档来自技高网...

【技术保护点】

1.基于RISC-V架构的长短期记忆网络加速器系统,其特征在于,包括指令派遣模块,用于向指令译码模块派遣自定义拓展指令;

2.根据权利要求1所述的基于RISC-V架构的长短期记忆网络加速器系统,其特征在于,所述运算单元包括矩阵乘法运算单元、元素点乘运算单元和Sigmoid激活和Tanh激活运算单元;所述矩阵乘法运算单元利用基于Cannon算法的矩阵乘法器进行矩阵乘法运算;所述元素点乘运算单元采用基4布斯编码结合华莱士树结构和超前进位加法器的元素点乘乘法器进行元素点乘运算;所述Sigmoid激活和Tanh激活运算单元利用基于CORDIC算法的Sigmoid或Tanh激活模块进行...

【技术特征摘要】

1.基于risc-v架构的长短期记忆网络加速器系统,其特征在于,包括指令派遣模块,用于向指令译码模块派遣自定义拓展指令;

2.根据权利要求1所述的基于risc-v架构的长短期记忆网络加速器系统,其特征在于,所述运算单元包括矩阵乘法运算单元、元素点乘运算单元和sigmoid激活和tanh激活运算单元;所述矩阵乘法运算单元利用基于cannon算法的矩阵乘法器进行矩阵乘法运算;所述元素点乘运算单元采用基4布斯编码结合华莱士树结构和超前进位加法器的元素点乘乘法器进行元素点乘运算;所述sigmoid激活和tanh激活运算单元利用基于cordic算法的sigmoid或tanh激活模块进行sigmoid激活和tanh激活运算。

3.根据权利要求2所述的基于risc-v架构的长短期记忆网络加速器系统,其特征在于,所述自定义拓展指令包括用于加速器的四条指令:用于对加速器隐藏层单元维度和前向推理运算次数进行配置的init_th指令;用于对加速器矩阵乘法中cannon算法的矩阵分块尺寸进行配置的init_mp指令;用于对加速器sigmoid激活或tanh激活模块中cordic算法的迭代次数进行配置的init_ite指令;用于启动加速器的前向推理计算过程的cal指令;所述四条指令定义选用同一个指令组。

4.根据权利要求3所述的基于risc-v架构的长短期记忆网络加速器系统,其特征在于,定义init_th指令的方法为:定义指令无写回结果,指令需读取操作数rs1和rs2,操作数rs1的值为隐藏层单元维度,操作数rs2的值为前向推理运算次数;

5.根据权利要求1所述的基于risc-v架构的长短期记忆网络加速器系统,其特征在于,所述数据信息包括加速器单元输入、加速器偏置参数和加速器权值矩阵信息。

6.基于risc-v架构的长短期记忆网络加速器控制方法,其特征在于,包括以下步骤:处理器...

【专利技术属性】
技术研发人员:徐文涛孙肇星雷战
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1