深度神经网络计算加速的方法和装置制造方法及图纸

技术编号：19512308 阅读：47 留言：0更新日期：2018-11-21 08:23

本发明专利技术实施例提出一种深度神经网络计算加速的方法、装置、终端和计算机可读存储介质，方法包括：对需要输入到矩阵模型中的各输入向量进行采样，获得多个采样向量；根据预设的量化参数对各采样向量进行乘积量化，获得多个量化点；根据量化参数将矩阵模型切分为多个矩阵块；各量化点与各矩阵块计算得到多个预计算表；通过各预计算表对各输入向量进行计算，得到矩阵模型的计算结果。本发明专利技术实施例中同一个矩阵模型的预计算表只需要建立一次，所有需要通过该矩阵模型进行计算的输入向量均可使用该预计算表进行查表计算，有效节省了输入向量与矩阵模型的计算过程，同时还能够保持矩阵模型原有的计算效果。

全部详细技术资料下载

【技术实现步骤摘要】
深度神经网络计算加速的方法和装置
本专利技术涉及数据处理
，尤其涉及一种深度神经网络计算加速的方法、装置、终端和计算机可读存储介质。
技术介绍
现有技术中提速深度神经网络的方法包括矩阵运算、pruning(剪支)算法和二值网络。其中，矩阵运算中的矩阵向量乘法是内存受限的，因此在计算过程中限制了深度神经网络的预测速度。而二值网络精度损失较大。pruning剪支算法需要较高的矩阵稀疏程度，重训过程繁杂。因此现有的计算方法均不能够很好的实现神经网络的计算加速。在
技术介绍
中公开的上述信息仅用于加强对本专利技术的背景的理解，因此其可能包含没有形成为本领域普通技术人员所知晓的现有技术的信息。
技术实现思路
本专利技术实施例提供一种深度神经网络计算加速的方法、装置、终端和计算机可读存储介质，以解决现有技术中的一个或多个技术问题。第一方面，本专利技术实施例提供了一种深度神经网络计算加速的方法，包括：对需要输入到矩阵模型中的各输入向量进行采样，获得多个采样向量；根据预设的量化参数对各所述采样向量进行乘积量化，获得多个量化点；根据所述量化参数将所述矩阵模型切分为多个矩阵块；各所述量化点与各所述矩阵块计算得到多个预计算表；通过各所述预计算表对各所述输入向量进行计算，得到所述矩阵模型的计算结果。结合第一方面，本专利技术实施例在第一方面的第一种实现方式中，根据预设的量化参数对各所述采样向量进行乘积量化，获得多个量化点，包括：根据量化维数对各所述采样向量进行切分；根据量化类数对切分后的各所述采样向量进行聚类，得到多个所述量化点。结合第一方面，本专利技术实施例在第一方面的第二种实现方...

【技术保护点】
1.一种深度神经网络计算加速的方法，其特征在于，包括：对需要输入到矩阵模型中的各输入向量进行采样，获得多个采样向量；根据预设的量化参数对各所述采样向量进行乘积量化，获得多个量化点；根据所述量化参数将所述矩阵模型切分为多个矩阵块；各所述量化点与各所述矩阵块计算得到多个预计算表；通过各所述预计算表对各所述输入向量进行计算，得到所述矩阵模型的计算结果。

【技术特征摘要】
1.一种深度神经网络计算加速的方法，其特征在于，包括：对需要输入到矩阵模型中的各输入向量进行采样，获得多个采样向量；根据预设的量化参数对各所述采样向量进行乘积量化，获得多个量化点；根据所述量化参数将所述矩阵模型切分为多个矩阵块；各所述量化点与各所述矩阵块计算得到多个预计算表；通过各所述预计算表对各所述输入向量进行计算，得到所述矩阵模型的计算结果。2.如权利要求1所述的方法，其特征在于，根据预设的量化参数对各所述采样向量进行乘积量化，获得多个量化点，包括：根据量化维数对各所述采样向量进行切分；根据量化类数对切分后的各所述采样向量进行聚类，得到多个所述量化点。3.如权利要求1所述的方法，其特征在于，根据所述量化参数将所述矩阵模型切分为多个矩阵块，包括：根据量化维数将所述矩阵模型切分为多个矩阵块。4.如权利要求1所述的方法，其特征在于，各所述量化点与各所述矩阵块计算得到多个预计算表，包括：将每一个所述量化点分别与所有的所述矩阵块相乘，得到与所述量化点对应的所述预计算表。5.如权利要求1所述的方法，其特征在于，通过各所述预计算表对各所述输入向量进行计算，得到所述矩阵模型的计算结果，包括：根据量化维度将各所述输入向量切分为多个输入向量块；获取各所述输入向量块在所述输入向量中的位置以及对应的所述量化点；根据各所述输入向量块的位置和对应的所述量化点，在所述预计算表中查找出各所述输入向量块对应的预计算向量；将各所述预计算向量相加，得到所述矩阵模型与各所述输入向量的计算结果。6.如权利要求5所述的方法，其特征在于，获取各所述输入向量块在所述输入向量中的位置以及对应的所述量化点，包括：将所述输入向量块分别与所有的所述量化点按照预设度量规则进行计算；根据与各所述量化点的计算结果，选择符合所述预设度量规则的计算结果对应的所述量化点，作为所述输入向量块对应的所述量化点。7.一种深度神经网络计算加速的装置，其特征在于，包括：采样模块，用于对需要输入到矩阵模型中的各输入向量进行采样...

【专利技术属性】
技术研发人员：朱志凡，冯仕堃，陈徐屹，朱丹翔，曹宇慧，何径舟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人