一种基于FPGA的DNN推理加速器设计制造技术

技术编号：40470719 阅读：20 留言：0更新日期：2024-02-26 19:08

本发明专利技术公开一种基于FPGA的DNN推理加速器设计，包括多个独立处理元件(PE)以及一个精简指令集的控制部分。每个PE配有加法器、乘法器和内部缓存，支持并行数据处理，加速推理运算。控制部分负责解码指令和配置计算任务，确保运算精度和效率。加速器内置量化机在推理前对数据进行优化量化，配合脉冲阵列以1‑D结构加速矩阵运算。数据流重组模块调整输入数据以符合运算需求。PE的灵活配置适应多种DNN模型，提高了推理效率和应用范围。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人工智能神经网络，具体来说是一种基于fpga的dnn推理加速器设计。

技术介绍

1、随着深度学习技术在人工智能领域的广泛应用，对于能够高效执行dnn模型推理任务的硬件加速器的需求急剧增加。然而，在现有技术中，尤其是那些基于传统cpu和gpu的系统，在dnn推理加速器的设计和实施方面存在若干问题：

2、1.算力与能耗问题：现有的处理器在执行复杂dnn推理任务时面临着算力不足和能耗过高的问题。虽然传统的cpu和gpu在通用计算任务中表现良好，但它们在执行dnn推理时的能源效率低下，特别是在移动和边缘计算设备中，这些设备的能源和散热能力有限。

3、2.时延与成本考量：推理芯片需要在保持高性能的同时，考虑到时延和成本效益。cpu和gpu在处理时延敏感的任务时可能无法满足低延迟的需求，而高性能的硬件成本也可能过高，不适合成本敏感型应用。

4、3.灵活性与优化不足：虽然fpga提供了可编程性和灵活性，但许多现有的基于fpga的推理加速器在设计时未能充分利用这些特性。这导致了在针对特定dnn模型和推理...

【技术保护点】

1.一种基于FPGA的DNN推理加速器设计，其特征在于，所述加速器包括：

2.根据权利要求1所述的基于FPGA的DNN推理加速器设计，其特征在于，所述计算部分进一步包括一个量化机，用于在推理过程开始前对原始数据流进行量化。

3.根据权利要求2所述的基于FPGA的DNN推理加速器设计，其特征在于，所述量化机使用掩码的方式决定量化精度，以便在保留原权重参数值的同时调整量化精度。

4.根据权利要求1所述的基于FPGA的DNN推理加速器设计，其特征在于，所述计算部分进一步包括一个脉冲阵列，用于加速矩阵运算。

5.根据权利要求4所述的基于FPGA的D...

【技术特征摘要】

1.一种基于fpga的dnn推理加速器设计，其特征在于，所述加速器包括：

2.根据权利要求1所述的基于fpga的dnn推理加速器设计，其特征在于，所述计算部分进一步包括一个量化机，用于在推理过程开始前对原始数据流进行量化。

3.根据权利要求2所述的基于fpga的dnn推理加速器设计，其特征在于，所述量化机使用掩码的方式决定量化精度，以便在保留原权重参数值的同时调整量化精度。

4.根据权利要求1所述的基于fpga的dnn推理加速器设计，其特征在于，所述计算部分进一步包括一个脉冲阵列，用于加速矩阵运算。

5.根据权利要求4所述的基于fpga的dnn推理加速器设计，其...

【专利技术属性】
技术研发人员：董俊逸，赵鑫鑫，姜凯，
申请(专利权)人：山东浪潮科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人