一种基于FPGA的卷积神经网络加速架构制造技术

技术编号:45078855 阅读:23 留言:0更新日期:2025-04-25 18:19
本发明专利技术公开了深度学习硬件加速技术领域的一种基于FPGA的卷积神经网络加速架构,包括:处理器系统PS,用于从外部存储设备读取数据并将数据存储于内存中,通过接口模块与可编程逻辑PL进行数据交互;可编程逻辑PL,包括卷积模块、池化模块和上采样模块,所述可编程逻辑PL通过接口模块接收来自处理器系统PS的数据并执行并行计算;接口模块,用于连接处理器系统PS与可编程逻辑PL,通过时延优化机制,并将可编程逻辑PL中不同模块的逻辑端口分别绑定至独立的总线。本发明专利技术提出的基于FPGA的卷积神经网络加速架构,能够有效解决数据传输效率低、计算复杂度高以及模块间协同工作不足的问题。

【技术实现步骤摘要】

本专利技术涉及深度学习硬件加速,尤其涉及一种基于fpga的卷积神经网络加速架构。


技术介绍

1、随着深度学习技术的发展,卷积神经网络(cnn)已广泛应用于图像识别、目标检测和语义分割等领域。然而,cnn计算过程通常涉及大量的卷积、池化和上采样操作,这对计算资源和运行效率提出了较高的要求。传统的处理器架构在处理这些任务时效率较低,尤其是在需要低延迟、高吞吐率的实时应用中,难以满足性能需求。fpga(现场可编程门阵列)作为一种可编程硬件,凭借其并行处理能力和高效的资源利用,成为加速cnn的重要选择。然而,现有fpga加速架构往往在数据传输效率、计算复杂度优化以及模块间协同工作方面存在不足,导致系统性能未能充分发挥。


技术实现思路

1、本专利技术的目的在于克服现有技术中的不足,提供一种基于fpga的卷积神经网络加速架构,在保证卷积神经网络高精度的同时,充分发挥fpga的硬件加速能力,显著提高了卷积神经网络的运行效率和系统资源的利用率。

2、为达到上述目的,本专利技术是采用下述技术方案实现的:

...

【技术保护点】

1.一种基于FPGA的卷积神经网络加速架构,其特征在于,包括:

2.根据权利要求1所述的基于FPGA的卷积神经网络加速架构,其特征在于,所述接口模块包括AXI-Lite接口和AXI-Full接口,其中AXI-Lite接口用于在处理器系统PS和可编程逻辑PL之间传输控制信号,AXI-Full接口用于在处理器系统PS和可编程逻辑PL之间传输特征图、权重数据及计算结果,从而实现控制信号与数据流的分离。

3.根据权利要求2所述的基于FPGA的卷积神经网络加速架构,其特征在于,所述接口模块通过设置期望的AXI接口时延,在执行读写操作前允许发起总线请求。</p>

4.根据...

【技术特征摘要】

1.一种基于fpga的卷积神经网络加速架构,其特征在于,包括:

2.根据权利要求1所述的基于fpga的卷积神经网络加速架构,其特征在于,所述接口模块包括axi-lite接口和axi-full接口,其中axi-lite接口用于在处理器系统ps和可编程逻辑pl之间传输控制信号,axi-full接口用于在处理器系统ps和可编程逻辑pl之间传输特征图、权重数据及计算结果,从而实现控制信号与数据流的分离。

3.根据权利要求2所述的基于fpga的卷积神经网络加速架构,其特征在于,所述接口模块通过设置期望的axi接口时延,在执行读写操作前允许发起总线请求。

4.根据权利要求2所述的基于fpga的卷积神经网络加速架构,其特征在于,所述接口模块通过端口绑定方式,将可编程逻辑pl中的各模块的逻辑端口分别绑定至独立的axi总线,以...

【专利技术属性】
技术研发人员:刘砚一杜航冯硕蒋孟男张长煜刘秀娟
申请(专利权)人:南京林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1