一种基于FPGA的DNN推理加速器设计制造技术

技术编号:40470719 阅读:20 留言:0更新日期:2024-02-26 19:08
本发明专利技术公开一种基于FPGA的DNN推理加速器设计,包括多个独立处理元件(PE)以及一个精简指令集的控制部分。每个PE配有加法器、乘法器和内部缓存,支持并行数据处理,加速推理运算。控制部分负责解码指令和配置计算任务,确保运算精度和效率。加速器内置量化机在推理前对数据进行优化量化,配合脉冲阵列以1‑D结构加速矩阵运算。数据流重组模块调整输入数据以符合运算需求。PE的灵活配置适应多种DNN模型,提高了推理效率和应用范围。

【技术实现步骤摘要】

本专利技术属于人工智能神经网络,具体来说是一种基于fpga的dnn推理加速器设计。


技术介绍

1、随着深度学习技术在人工智能领域的广泛应用,对于能够高效执行dnn模型推理任务的硬件加速器的需求急剧增加。然而,在现有技术中,尤其是那些基于传统cpu和gpu的系统,在dnn推理加速器的设计和实施方面存在若干问题:

2、1.算力与能耗问题:现有的处理器在执行复杂dnn推理任务时面临着算力不足和能耗过高的问题。虽然传统的cpu和gpu在通用计算任务中表现良好,但它们在执行dnn推理时的能源效率低下,特别是在移动和边缘计算设备中,这些设备的能源和散热能力有限。

3、2.时延与成本考量:推理芯片需要在保持高性能的同时,考虑到时延和成本效益。cpu和gpu在处理时延敏感的任务时可能无法满足低延迟的需求,而高性能的硬件成本也可能过高,不适合成本敏感型应用。

4、3.灵活性与优化不足:虽然fpga提供了可编程性和灵活性,但许多现有的基于fpga的推理加速器在设计时未能充分利用这些特性。这导致了在针对特定dnn模型和推理任务优化时,现有方案本文档来自技高网...

【技术保护点】

1.一种基于FPGA的DNN推理加速器设计,其特征在于,所述加速器包括:

2.根据权利要求1所述的基于FPGA的DNN推理加速器设计,其特征在于,所述计算部分进一步包括一个量化机,用于在推理过程开始前对原始数据流进行量化。

3.根据权利要求2所述的基于FPGA的DNN推理加速器设计,其特征在于,所述量化机使用掩码的方式决定量化精度,以便在保留原权重参数值的同时调整量化精度。

4.根据权利要求1所述的基于FPGA的DNN推理加速器设计,其特征在于,所述计算部分进一步包括一个脉冲阵列,用于加速矩阵运算。

5.根据权利要求4所述的基于FPGA的D...

【技术特征摘要】

1.一种基于fpga的dnn推理加速器设计,其特征在于,所述加速器包括:

2.根据权利要求1所述的基于fpga的dnn推理加速器设计,其特征在于,所述计算部分进一步包括一个量化机,用于在推理过程开始前对原始数据流进行量化。

3.根据权利要求2所述的基于fpga的dnn推理加速器设计,其特征在于,所述量化机使用掩码的方式决定量化精度,以便在保留原权重参数值的同时调整量化精度。

4.根据权利要求1所述的基于fpga的dnn推理加速器设计,其特征在于,所述计算部分进一步包括一个脉冲阵列,用于加速矩阵运算。

5.根据权利要求4所述的基于fpga的dnn推理加速器设计,其...

【专利技术属性】
技术研发人员:董俊逸赵鑫鑫姜凯
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1