一种计算方法及计算装置制造方法及图纸

技术编号:19859191 阅读:16 留言:0更新日期:2018-12-22 12:04
本申请实施例公开了一种计算方法,用于提升计算效率,节约功耗。本申请实施例方法包括:计算装置对预置的卷积滤波器系数矩阵中的元素进行比较,得到卷积滤波器系数索引矩阵;所述计算装置根据所述卷积滤波器系数索引矩阵依次获取对应的目标卷积滤波器系数;所述计算装置对预置的输入特征数据进行重排,得到重排后的输入特征数据;所述计算装置根据所述目标卷积滤波器系数和所述重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果;若所述不同输入通道上的当前计算结果的累加和小于等于0,且所述不同输入通道上之后的滤波器系数为0或者负数时,所述计算装置确定输出特征的值为0。

【技术实现步骤摘要】
一种计算方法及计算装置
本申请涉及人工智能领域,尤其涉及一种计算方法及计算装置。
技术介绍
深度神经网络技术由于在性能方面相比于传统人工智能技术的优势,已经成为当前人工智能领域研究的主流技术,得到了广泛的研究和关注,并已经在语音识别、图像分类、目标识别、文本分类等方面得到了广泛的应用。卷积神经网络作为深度神经网络技术中计算复杂度最高的部分,如何提高卷积神经网络的计算效率和能效是当前深度神经网络高效计算所面临的最主要的问题。传统的产品和研究采用脉动阵列来进行卷积神经网络的计算,但是需要在利用脉动阵列完成整个卷积网络层的计算之后,才开始对计算结果应用激活函数计算来得到输出神经元的值,即特征值。
技术实现思路
本申请实施例提供了一种计算方法及计算装置,用于提升计算效率,节约功耗。有鉴于此,本申请实施例第一方面提供了一种计算方法,可以包括:计算装置对预置的卷积滤波器系数矩阵中的元素进行比较,得到卷积滤波器系数索引矩阵;该计算装置根据该卷积滤波器系数索引矩阵依次获取对应的目标卷积滤波器系数;该计算装置对预置的输入特征数据进行重排,得到重排后的输入特征数据;该计算装置根据该目标卷积滤波器系数和该重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果;若该不同输入通道上的当前计算结果的累加和小于等于0,且该不同输入通道上之后的滤波器系数为0或者负数时,该计算装置确定输出特征的值为0。可选的,在本申请的一些实施例中,该卷积滤波器系数矩阵中的元素按照从正到负的顺序排列。可选的,在本申请的一些实施例中,该卷积滤波器系数矩阵中的元素按照从大到小的顺序排列。可选的,在本申请的一些实施例中,该计算装置对预置的输入特征数据进行重排,得到重排后的输入特征数据,可以包括:该计算装置对预置的输入特征矩阵进行处理,得到向量输入矩阵;该计算装置根据该向量输入矩阵和计算单元的标号,得到特征向量;该计算装置根据该卷积滤波器系数索引矩阵和该计算单元的标号,得到特征向量索引矩阵;该计算装置根据该特征向量和该特征向量索引矩阵,得到目标特征向量。可选的,在本申请的一些实施例中,该计算装置根据该目标卷积滤波器系数和该重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果,可以包括:该计算装置根据该目标卷积滤波器系数和该目标特征向量进行乘法运算,得到不同输入通道上的该当前计算结果。本申请实施例第二方面提供了一种计算装置,可以包括:比较模块,用于对预置的卷积滤波器系数矩阵中的元素进行比较,得到卷积滤波器系数索引矩阵;获取模块,用于根据该卷积滤波器系数索引矩阵依次获取对应的目标卷积滤波器系数;重排模块,用于对预置的输入特征数据进行重排,得到重排后的输入特征数据;计算模块,用于根据该目标卷积滤波器系数和该重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果;确定模块,用于若该不同输入通道上的当前计算结果的累加和小于等于0,且该不同输入通道上之后的滤波器系数为0或者负数时,确定输出特征的值为0。可选的,在本申请的一些实施例中,该卷积滤波器系数矩阵中的元素按照从正到负的顺序排列。可选的,在本申请的一些实施例中,该卷积滤波器系数矩阵中的元素按照从大到小的顺序排列。可选的,在本申请的一些实施例中,该重排模块,具体用于对预置的输入特征矩阵进行处理,得到向量输入矩阵;根据该向量输入矩阵和计算单元的标号,得到特征向量;根据该卷积滤波器系数索引矩阵和该计算单元的标号,得到特征向量索引矩阵;根据该特征向量和该特征向量索引矩阵,得到目标特征向量。可选的,在本申请的一些实施例中,该计算模块,具体用于根据该目标卷积滤波器系数和该目标特征向量进行乘法运算,得到不同输入通道上的该当前计算结果。本申请实施例第三方面提供了一种计算装置,可以包括:存储器和处理器,其中,存储器和处理器通过总线连接;所述存储器,用于存储指令;所述处理器,用于调用所述指令,执行上述第一方面及第一方面任一可选实现方式中所述的方法。本申请实施例第四方面提供一种存储介质,需要说明的是,本申请技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产口的形式体现出来,该计算机软件产品存储在一个存储介质中,用于储存为上述计算装置所用的计算机软件指令,其包含用于执行上述各方面为计算装置所设计的程序。该存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。本申请实施例第五方面提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如上述各方面或各方面任一可选实现方式中所述的方法。从以上技术方案可以看出,本申请实施例具有以下优点:在本申请实施例中,计算装置对预置的卷积滤波器系数矩阵中的元素进行比较,得到卷积滤波器系数索引矩阵;所述计算装置根据所述卷积滤波器系数索引矩阵依次获取对应的目标卷积滤波器系数;所述计算装置对预置的输入特征数据进行重排,得到重排后的输入特征数据;所述计算装置根据所述目标卷积滤波器系数和所述重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果;若所述不同输入通道上的当前计算结果的累加和小于等于0,且所述不同输入通道上之后的滤波器系数为0或者负数时,所述计算装置确定输出特征的值为0。计算装置在可以确定卷积神经网络计算后的输出结果经过激活函数计算必定为0时,提前终止卷积神经网络脉动阵列中该输出结果的卷积计算以及激活函数的计算,从而达到提升计算效率,节约功耗的结果。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,还可以根据这些附图获得其它的附图。图1为传统的卷积神经网络的计算示意图;图2为ReLU激活函数特性的高效卷积神经网络脉动阵列的整体结构示意图;图3为本申请实施例中计算方法的一个实施例示意图;图4为卷积滤波器系数索引矩阵规则的一个示意图;图5为卷积滤波器系数矩阵及其对应的卷积滤波器系数索引矩阵的示例图;图6为本申请实施例中脉动阵列中输入数据重排的一个示意图;图7为本申请实施例中计算装置的一个实施例示意图;图8为本申请实施例中计算装置的另一个实施例示意图。具体实施方式本申请实施例提供了一种计算方法及计算装置,用于提升计算效率,节约功耗。为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,都应当属于本申请保护的范围。如图1所示,图1为传统的卷积神经网络的计算示意图。但是,目前深度神经网络中广泛使用激活函数修正的线性单元(RectifiedLinearUnits,ReLU)函数的形式如下公式1所示:ReLU(x)=max{0,x}公式1)在公式1所示中,如果x的值在小于等于0时,那么ReLU(x)的计算值一定为0。由于输入特征数据必然大于等于0,因此可以通过对滤波器系数按从正到负进行排序,当卷积网络计算的部分和小于0,并且下一个本文档来自技高网
...

【技术保护点】
1.一种计算方法,其特征在于,包括:计算装置对预置的卷积滤波器系数矩阵中的元素进行比较,得到卷积滤波器系数索引矩阵;所述计算装置根据所述卷积滤波器系数索引矩阵依次获取对应的目标卷积滤波器系数;所述计算装置对预置的输入特征数据进行重排,得到重排后的输入特征数据;所述计算装置根据所述目标卷积滤波器系数和所述重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果;若所述不同输入通道上的当前计算结果的累加和小于等于0,且所述不同输入通道上之后的滤波器系数为0或者负数时,所述计算装置确定输出特征的值为0。

【技术特征摘要】
1.一种计算方法,其特征在于,包括:计算装置对预置的卷积滤波器系数矩阵中的元素进行比较,得到卷积滤波器系数索引矩阵;所述计算装置根据所述卷积滤波器系数索引矩阵依次获取对应的目标卷积滤波器系数;所述计算装置对预置的输入特征数据进行重排,得到重排后的输入特征数据;所述计算装置根据所述目标卷积滤波器系数和所述重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果;若所述不同输入通道上的当前计算结果的累加和小于等于0,且所述不同输入通道上之后的滤波器系数为0或者负数时,所述计算装置确定输出特征的值为0。2.根据权利要求1所述的方法,其特征在于,所述卷积滤波器系数矩阵中的元素按照从正到负的顺序排列。3.根据权利要求2所述的方法,其特征在于,所述卷积滤波器系数矩阵中的元素按照从大到小的顺序排列。4.根据权利要求1-3任一项所述的方法,其特征在于,所述计算装置对预置的输入特征数据进行重排,得到重排后的输入特征数据,包括:所述计算装置对预置的输入特征矩阵进行处理,得到向量输入矩阵;所述计算装置根据所述向量输入矩阵和计算单元的标号,得到特征向量;所述计算装置根据所述卷积滤波器系数索引矩阵和所述计算单元的标号,得到特征向量索引矩阵;所述计算装置根据所述特征向量和所述特征向量索引矩阵,得到目标特征向量。5.根据权利要求4所述的方法,其特征在于,所述计算装置根据所述目标卷积滤波器系数和所述重排后的输入特征数据进行乘法运算,得到不同输入通道上的当前计算结果,包括:所述计算装置根据所述...

【专利技术属性】
技术研发人员:方兴赵雅倩
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1