【技术实现步骤摘要】
本专利技术涉及人工智能与电子信息交叉,特别是涉及一种基于fpga的深度卷积神经网络加速器及其设计方法。
技术介绍
1、dcnn(deep convolutional neural network)是一种特殊类型的神经网络,它对特征的多阶段提取,使其具有强大的学习能力,可以自动学习数据特征,被广泛应用于图像分类、语义分割、目标检测、自然语言处理和语音识别。如今,随着现代互联网技术的不断发展,网络数据呈几何级数增长,大数据时代已经到来。网络中的海量数据信息蕴含着大量的行业资源,如何正确快速处理所需的数据信息,成为各行业面临的重要课题。传统dcnn算法难以适应数据量的爆炸增长,模型训练代价和复杂程度也随着数据规模增大不断提升。因此,改进dcnn算法使其适用于大数据环境具有十分重要的意义。
2、当前,dcnn的部署多选用图形处理器(graphics processing unit,gpu)、张量处理器(tensor processing unit,tpu)等器件作为平台来承载算法。但是由于gpu等器件具有能耗高、体积大等缺点,人们在
...【技术保护点】
1.一种基于FPGA的深度卷积神经网络加速器,其特征在于,包括:DCNN模型优化单元、DCNN模型量化单元和硬件结构设计单元;各个单元之间彼此相连作用,最终得到基于FPGA的DCNN加速器;所述DCNN模型优化单元包括冗余特征压缩、模型并行训练和参数并行合并。
2.一种基于FPGA的深度卷积神经网络加速器的设计方法,其特征在于,包括以下步骤:
3.根据权利要求2所述的一种基于FPGA的深度卷积神经网络加速器的设计方法,其特征在于,根据数据倾斜因子,检测中间数据倾斜程度;所述数据倾斜因子DSF的计算公式如下:
4.根据权利要求1所述的
...【技术特征摘要】
1.一种基于fpga的深度卷积神经网络加速器,其特征在于,包括:dcnn模型优化单元、dcnn模型量化单元和硬件结构设计单元;各个单元之间彼此相连作用,最终得到基于fpga的dcnn加速器;所述dcnn模型优化单元包括冗余特征压缩、模型并行训练和参数并行合并。
2.一种基于fpga的深度卷积神经网络加速器的设计方法,其特征在于,包括以下步骤:
3.根据权利要求2所述的一种基于fpga的深度卷积神经网络加速器的设计方法,其特征在于,根据数据倾斜因子,检测中间数据倾斜程度;所述数据倾斜因子dsf的计算公式如下:
4.根据权利要求1所述的一种基于fpga的深度卷积神经网络加速器的设计方...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。