【技术实现步骤摘要】
【国外来华专利技术】神经网络的运算装置及其控制方法版权申明本专利文件披露的内容包含受版权保护的材料。该版权为版权所有人所有。版权所有人不反对任何人复制专利与商标局的官方记录和档案中所存在的该专利文件或者该专利披露。
本申请涉及神经网络领域,并且更为具体地,涉及一种神经网络的运算装置及其控制方法。
技术介绍
计算机中数值的表示有两种形式,一种是定点数(fixed-pointnumber),另一种是浮点数(floating-pointnumber)。当前主流的神经网络计算框架中,普遍采用浮点数作为计算单元运算时要求的数据格式,例如,神经网络计算框架训练后得到的权重系数和各层的输出特征数据都是浮点数。由于定点运算装置相比于浮点运算装置占用的面积更小,消耗的功耗更少,所以神经网络加速装置普遍采用定点数作为计算单元运算时要求的数据格式。因此,神经网络计算框架训练得到的权重系数和各层的输出特征数据在神经网络加速装置中部署时,均需要进行定点化。定点化指的是将数据由浮点数转换为定点数的过程。有些深度卷积神经网络为满足运算精度要求需要使用 ...
【技术保护点】
1.一种神经网络的运算装置,其特征在于,包括脉动阵列;/n所述脉动阵列的处理单元为第一计算单元,所述第一计算单元支持乘法操作数的定点数位宽为n比特,n为2的m次方,m为正整数;/n所述第一计算单元可进行先移位后累加操作,以使得所述脉动阵列中2行c列的多个所述第一计算单元作为一个整体形成支持乘法操作数的定点数位宽为2n比特的第二计算单元,c为1或2。/n
【技术特征摘要】
【国外来华专利技术】1.一种神经网络的运算装置,其特征在于,包括脉动阵列;
所述脉动阵列的处理单元为第一计算单元,所述第一计算单元支持乘法操作数的定点数位宽为n比特,n为2的m次方,m为正整数;
所述第一计算单元可进行先移位后累加操作,以使得所述脉动阵列中2行c列的多个所述第一计算单元作为一个整体形成支持乘法操作数的定点数位宽为2n比特的第二计算单元,c为1或2。
2.如权利要求1所述的运算装置,其特征在于,还包括控制单元,用于:
在所述运算装置需要处理定点数位宽为n比特的输入特征数据的情况下,控制所述第一计算单元不进行先移位后累加操作,以使所述脉动阵列对定点数位宽为n比特的输入特征数据进行处理;
在所述运算装置需要处理定点数位宽为2n比特的输入特征数据的情况下,控制用于形成所述第二计算单元的2行c列的所述第一计算单元中的一个或多个所述第一计算单元进行先移位后累加操作,以使所述脉动阵列对定点数位宽为2n比特的输入特征数据进行处理。
3.如权利要求2所述的运算装置,其特征在于,c为2,所述控制单元用于,在所述运算装置需要对定点数位宽为2n比特的输入特征数据与定点数位宽为2n比特的权重进行运算的情况下,控制所述第二计算单元中所包含的部分所述第一计算单元进行先移位后累加操作,使得所述第二计算单元中所包含的2行所述第一计算单元中后1行的2个所述第一计算单元分别输出所述第二计算单元的4n比特运算结果的低2n比特位与高2n比特位。
4.如权利要求2或3所述的运算装置,其特征在于,所述控制单元还用于,在所述运算装置需要处理定点数位宽为2n比特的输入特征数据的情况下,将定点数位宽为2n比特的输入特征数据的低n比特位与高n比特位分别送入所述第二计算单元中所包含的2行所述第一计算单元中。
5.如权利要求2-4中任一项所述的运算装置,其特征在于,c为2;
所述控制单元还用于,在所述运算装置需要处理定点数位宽为2n比特的权重的情况下,将定点数位宽为2n比特的权重的低n比特位与高n比特位分别送入所述第二计算单元中所包含的2列所述第一计算单元中。
6.如权利要求3所述的运算装置,其特征在于,还包括输出处理单元,用于:
对所述脉动阵列输出的对应于同一个所述第二计算单元的低2n比特位运算结果与高2n比特位运算结果进行拼接,获得所述同一个所述第二计算单元的4n比特运算结果;
对对应于同一个权重矩阵的p个所述第二计算单元的4n比特运算结果进行累加,以获得所述权重矩阵对应的输出特征数据,p等于所述权重矩阵的宽度。
7.如权利要求2-6中任一项所述的运算装置,其特征在于,还包括:
特征数据输入单元,用于缓存待处理的输入特征数据,并根据所述控制单元的控制信令将所述输入特征数据送入所述脉动阵列中;
权重输入单元,用于缓存待处理的权重,并根据所述控制单元的控制信令将所述权重送入所述脉动阵列中。
8.如权利要求3-6中任一项所述的运算装置,其特征在于,所述定点数位宽为2n比特的输入特征数据在外部存储器中的存储格式为:输入特征图中每行输入特征数据的低n比特位与高n比特位分别集中存储。
9.如权利要求1-8中任一项所述的运算装置,其特征在于,所述运算装置用于执行卷积操作。
10.一种神经网络加速器,其特征在于,包括:
处理模块,所述处理模块为如权利要求1-9中任一项所述神经网络的运算装置;
输入模块,用于将特征数据与权重从外部存储器读出并送入所述处理模块中;
输出模块,用于将所述处理模块输出的输出特征数据存储到所述外部存储器中。
11.一种运算装置的控制方法,其特征...
【专利技术属性】
技术研发人员:韩峰,杨康,
申请(专利权)人:深圳市大疆创新科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。