【技术实现步骤摘要】
本专利技术属于神经网络硬件加速,具体涉及一种基于risc-v的softmax指令集扩展方法及系统。
技术介绍
1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
2、随着深度学习在自然语言处理、语音识别、图像理解等领域的广泛应用,transformer结构因其强大的建模能力和可并行计算特性逐渐取代传统的循环神经网络(rnn)与卷积神经网络(cnn),成为主流的神经网络架构。特别是在bert、gpt等模型中,transformer中的注意力机制广泛依赖softmax函数来实现注意力权重的归一化计算,进而决定了模型的信息聚合方式。因此,softmax计算作为transformer结构中的核心组成部分,其性能直接影响整个神经网络的推理速度与计算延迟,成为高性能神经网络处理器设计中的关键瓶颈之一。
3、softmax函数计算包含最大值提取、指数运算与归一化除法等复杂数值操作,通常需要多个乘法器和除法器资源,占据大量硬件面积并消耗多个时钟周期,难以满足低功耗、低延迟的实时推理需求。尽管已有基于
...【技术保护点】
1.基于RISC-V的Softmax指令集扩展方法,其特征在于,RISC-V处理器采用N级流水线结构,包括:
2.如权利要求1所述的基于RISC-V的Softmax指令集扩展方法,其特征在于,所述Softmax计算单元包括最大值查找、指数求解、求和、对数求解以及复用指数计算五个过程;
3.如权利要求2所述的基于RISC-V的Softmax指令集扩展方法,其特征在于,所述数据存储器将待进行Softmax运算的数据发送至Softmax计算单元进行Softmax运算,具体为:
4.如权利要求3所述的基于RISC-V的Softmax指令集扩
...【技术特征摘要】
1.基于risc-v的softmax指令集扩展方法,其特征在于,risc-v处理器采用n级流水线结构,包括:
2.如权利要求1所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述softmax计算单元包括最大值查找、指数求解、求和、对数求解以及复用指数计算五个过程;
3.如权利要求2所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述数据存储器将待进行softmax运算的数据发送至softmax计算单元进行softmax运算,具体为:
4.如权利要求3所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述softmax计算单元分为九个步骤,分别为初始idle阶段,data_check数据检查阶段,spilt数据分割阶段,find_max最大值寻找阶段,clac_exp指数计算阶段,clac_sum求和阶段,ln_unit对数计算阶段,第二次clac_exp指数计算阶段和最终的pack结果打包阶段;
5.如权利要求1所述的基于risc-v的softmax指令集扩展方法,其特征在于,所述执行阶段接收softmax计算单元传递回来的计算结果是使能信号,检测是否计算完成,若计算完成则将计算结果与地址信息写回至目标寄存器...
【专利技术属性】
技术研发人员:程银涛,焦文博,谷逸明,朱顺意,
申请(专利权)人:山东领能电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。