基于FPGA的深度卷积神经网络加速器及其设计方法技术

技术编号:40489902 阅读:58 留言:0更新日期:2024-02-26 19:20
本发明专利技术提出了一种面向FPGA的深度卷积神经网络加速器及其设计方法,所述面向FPGA的深度卷积神经网络加速器包括:DCNN模型优化单元、DCNN模型量化单元和硬件结构设计单元;各个单元之间彼此相连作用,最终得到基于FPGA的DCNN加速器;所述DCNN模型优化单元包括冗余特征压缩、模型并行训练和参数并行合并。本发明专利技术提出的基于FPGA的深度卷积神经网络加速器及其的设计方法,不仅能够减少DCNN模型的参数数量和计算量,降低其对存储空间和计算资源的需求,使得在FPGA上的部署更为便捷,而且通过设计合理的硬件架构,成功实现在FPGA上部署复杂的DCNN模型,极大提升了模型的计算速度。此外,这种方法充分考虑到不同DCNN模型的结构差异,因此对各类DCNN模型具有广泛适用性。

【技术实现步骤摘要】

本专利技术涉及人工智能与电子信息交叉,特别是涉及一种基于fpga的深度卷积神经网络加速器及其设计方法。


技术介绍

1、dcnn(deep convolutional neural network)是一种特殊类型的神经网络,它对特征的多阶段提取,使其具有强大的学习能力,可以自动学习数据特征,被广泛应用于图像分类、语义分割、目标检测、自然语言处理和语音识别。如今,随着现代互联网技术的不断发展,网络数据呈几何级数增长,大数据时代已经到来。网络中的海量数据信息蕴含着大量的行业资源,如何正确快速处理所需的数据信息,成为各行业面临的重要课题。传统dcnn算法难以适应数据量的爆炸增长,模型训练代价和复杂程度也随着数据规模增大不断提升。因此,改进dcnn算法使其适用于大数据环境具有十分重要的意义。

2、当前,dcnn的部署多选用图形处理器(graphics processing unit,gpu)、张量处理器(tensor processing unit,tpu)等器件作为平台来承载算法。但是由于gpu等器件具有能耗高、体积大等缺点,人们在小型移动系统和可穿戴本文档来自技高网...

【技术保护点】

1.一种基于FPGA的深度卷积神经网络加速器,其特征在于,包括:DCNN模型优化单元、DCNN模型量化单元和硬件结构设计单元;各个单元之间彼此相连作用,最终得到基于FPGA的DCNN加速器;所述DCNN模型优化单元包括冗余特征压缩、模型并行训练和参数并行合并。

2.一种基于FPGA的深度卷积神经网络加速器的设计方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的一种基于FPGA的深度卷积神经网络加速器的设计方法,其特征在于,根据数据倾斜因子,检测中间数据倾斜程度;所述数据倾斜因子DSF的计算公式如下:

4.根据权利要求1所述的一种基于FPGA的深...

【技术特征摘要】

1.一种基于fpga的深度卷积神经网络加速器,其特征在于,包括:dcnn模型优化单元、dcnn模型量化单元和硬件结构设计单元;各个单元之间彼此相连作用,最终得到基于fpga的dcnn加速器;所述dcnn模型优化单元包括冗余特征压缩、模型并行训练和参数并行合并。

2.一种基于fpga的深度卷积神经网络加速器的设计方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的一种基于fpga的深度卷积神经网络加速器的设计方法,其特征在于,根据数据倾斜因子,检测中间数据倾斜程度;所述数据倾斜因子dsf的计算公式如下:

4.根据权利要求1所述的一种基于fpga的深度卷积神经网络加速器的设计方...

【专利技术属性】
技术研发人员:毛伊敏苗德成周奇航
申请(专利权)人:江西理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1