【技术实现步骤摘要】
一种神经网络加速系统和方法
本专利技术实施例涉及神经网络技术,尤其涉及一种神经网络加速系统和方法。
技术介绍
卷积神经网络在过去几年中取得显著发展,它目前是许多智能系统的基本工具。但是为了提高图像分类、图像识别等准确率,卷积神经网络的计算复杂度和对存储资源的消耗也在不断增加。因此,卷积神经网络加速已成为一个热门课题。对于卷积神经网络的硬件实现,近年来已经提出了一批基于FPGA或ASIC的加速器。这些加速器的设计从不同的方面来对卷积神经网络进行优化,例如优化卷积神经网络的计算资源,优化数据的输出,优化计算资源和片下存储器的访问等待。然而这些加速器的设计通常将卷积神经网络算法当成一个小黑盒,只优化了硬件结构,容易造成硬件加速后的卷积神经网络计算的准确率下降。
技术实现思路
有鉴于此,本专利技术实施例提供一种神经网络加速系统和方法,以减少神经网络计算需要使用的逻辑资源,提高数据传输速度。第一方面,本专利技术实施例提供一种神经网络加速系统,包括:数据处理模块,用于将卷积神经网络计算 ...
【技术保护点】
1.一种神经网络加速系统,其特征在于,包括:/n数据处理模块,用于将卷积神经网络计算的输入数据从浮点数转为定点数;/n特征图拆分模块,用于根据第一预设规则将输入数据拆分为多个计算特征图qd
【技术特征摘要】
1.一种神经网络加速系统,其特征在于,包括:
数据处理模块,用于将卷积神经网络计算的输入数据从浮点数转为定点数;
特征图拆分模块,用于根据第一预设规则将输入数据拆分为多个计算特征图qdj;
第一计算模块,用于根据第二预设规则对每个计算特征图qdi进行计算得到多个第一输出特征图qoi;
累加模块,用于依次对所有第一输出特征图qoi进行累加得到第二输出特征图;
第二计算模块,用于根据第三预设规则对所述第二输出特征图进行处理得到输出数据。
2.如权利要求1所述的系统,其特征在于,所述第一计算模块包括:
权值存储器,用于存储权值qw;
卷积计算单元,用于根据所述计算特征图qdj和所述权值qw进行卷积计算得到第一输出特征图的第一部分
支路加法树单元,用于根据第四预设规则对将所述计算特征图qdj进行计算得到第一输出特征图的第二部分
第一输出特征图计算单元,用于将所述第一输出特征图的第一部分和所述第一输出特征图的第二部分相减得到所述第一输出特征图qoi。
3.如权利要求2所述的系统,其特征在于,所述数据处理模块还用于将所述权值存储器内存储的权值qw转化为定点数。
4.如权利要求1所述的系统,其特征在于,所述特征图拆分模块具体用于:
根据预设步长将输入数据拆分为多个包括3*3矩阵数据结构的计算特征图qdj。
5.如权利要求1所述的系统,其特征在于,所述第二计算模块包括:
偏置模块,用于将所述第二输出特征图加上预设偏置参数,得到输出偏置特征图;
量化模块,用于将所述输出偏置特征图与预设量化参数进行计算,得到输出数据。
6.如权利要求1所述的系统...
【专利技术属性】
技术研发人员:李远超,蔡权雄,牛昕宇,
申请(专利权)人:深圳鲲云信息科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。