基于RISC-V的Softmax指令集扩展方法及系统技术方案

技术编号:46611200 阅读:0 留言:0更新日期:2025-10-14 21:09
本发明专利技术属于神经网络硬件加速领域,提供了一种基于RISC‑V的Softmax指令集扩展方法及系统,包括取指阶段,RISC‑V处理器根据指令计数器PC生成的地址从Softmax指令存储器中取出Softmax指令;译码阶段,对于Softmax指令的Opcode、funct7与funct3进行解析对应指令功能,并产生对应的控制信号;执行阶段,将待进行Softmax运算的数据从数据存储器中取出,根据控制信号传入Softmax计算单元中;根据以下公式执行Softmax计算,将Softmax计算结果写回到目标寄存器中;通过将计算过程划分为最大值求解、指数计算、求和与归一化四个子模块,并设计硬件加速策略,大幅降低了运算延迟与资源开销,有效提升了计算的并行度、精度与能效比,适用于高性能神经网络推理加速场景。

【技术实现步骤摘要】

本专利技术属于神经网络硬件加速,具体涉及一种基于risc-v的softmax指令集扩展方法及系统。


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。

2、随着深度学习在自然语言处理、语音识别、图像理解等领域的广泛应用,transformer结构因其强大的建模能力和可并行计算特性逐渐取代传统的循环神经网络(rnn)与卷积神经网络(cnn),成为主流的神经网络架构。特别是在bert、gpt等模型中,transformer中的注意力机制广泛依赖softmax函数来实现注意力权重的归一化计算,进而决定了模型的信息聚合方式。因此,softmax计算作为transformer结构中的核心组成部分,其性能直接影响整个神经网络的推理速度与计算延迟,成为高性能神经网络处理器设计中的关键瓶颈之一。

3、softmax函数计算包含最大值提取、指数运算与归一化除法等复杂数值操作,通常需要多个乘法器和除法器资源,占据大量硬件面积并消耗多个时钟周期,难以满足低功耗、低延迟的实时推理需求。尽管已有基于查找表、分段逼近或旋本文档来自技高网...

【技术保护点】

1.基于RISC-V的Softmax指令集扩展方法,其特征在于,RISC-V处理器采用N级流水线结构,包括:

2.如权利要求1所述的基于RISC-V的Softmax指令集扩展方法,其特征在于,所述Softmax计算单元包括最大值查找、指数求解、求和、对数求解以及复用指数计算五个过程;

3.如权利要求2所述的基于RISC-V的Softmax指令集扩展方法,其特征在于,所述数据存储器将待进行Softmax运算的数据发送至Softmax计算单元进行Softmax运算,具体为:

4.如权利要求3所述的基于RISC-V的Softmax指令集扩展方法,其特征在于,...

【技术特征摘要】

1.基于risc-v的softmax指令集扩展方法,其特征在于,risc-v处理器采用n级流水线结构,包括:

2.如权利要求1所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述softmax计算单元包括最大值查找、指数求解、求和、对数求解以及复用指数计算五个过程;

3.如权利要求2所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述数据存储器将待进行softmax运算的数据发送至softmax计算单元进行softmax运算,具体为:

4.如权利要求3所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述softmax计算单元分为九个步骤,分别为初始idle阶段,data_check数据检查阶段,spilt数据分割阶段,find_max最大值寻找阶段,clac_exp指数计算阶段,clac_sum求和阶段,ln_unit对数计算阶段,第二次clac_exp指数计算阶段和最终的pack结果打包阶段;

5.如权利要求1所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述执行阶段接收softmax计算单元传递回来的计算结果是使能信号,检测是否计算完成,若计算完成则将计算结果与地址信息写回至目标寄存器...

【专利技术属性】
技术研发人员:程银涛焦文博谷逸明朱顺意
申请(专利权)人:山东领能电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1