一种计算装置及相关产品制造方法及图纸

技术编号：22021827 阅读：16 留言：0更新日期：2019-09-04 01:10

本公开提供了一种计算装置，所述计算装置获取训练样本、训练模型；所述训练模型包括n层结构；包括：指令控制单元用于获取训练指令，根据所述训练指令得到正向运算指令和反向运算指令；运算单元用于根据所述正向运算指令对所述训练样本进行n层正向运算得到第n层正向运算结果，根据所述第n层正向运算结果获得第n层输出数据梯度，根据所述反向运算指令对所述第n层输出数据梯度执行n层反向运算得到所述训练模型的权值梯度；所述训练模型的权值梯度包括每层的权值梯度；压缩单元用于对所述训练模型的权值梯度进行处理，以对应得到处理后的权值梯度；计算装置用于依据所述处理后的权值梯度对所述训练模型的权值进行更新，以完成训练。

A Computing Device and Related Products

全部详细技术资料下载

【技术实现步骤摘要】
一种计算装置及相关产品
本申请涉及信息处理
，具体涉及一种计算装置及相关产品。
技术介绍
随着信息技术的不断发展和人们日益增长的需求，人们对信息及时性的要求越来越高了。目前，终端对信息的获取以及处理均是基于通用处理器获得的。在实践中发现，这种基于通用处理器运行软件程序来处理信息的方式，受限于通用处理器的运行速率，特别是在通用处理器负荷较大的情况下，信息处理效率较低、时延较大。申请内容本申请实施例提供了一种数据处理方法及相关产品，可提升计算装置的处理速度，提高效率。第一方面，提供一种使用计算装置进行数据处理的方法，所述计算装置包括运算单元、指令控制单元以及压缩单元；所述计算装置获取训练样本、训练模型；所述训练模型为：神经网络训练模型和/或非神经网络训练模型，所述训练模型包括n层结构；所述方法包括：所述指令控制单元获取训练指令，根据所述训练指令得到正向运算指令和方向运算指令，并将所述正向运算指令和所述反向运算指令分别发送给所述运算单元；所述运算单元根据所述所述正向运算指令对所述训练样本进行n层正向运算得到第n层正向运算结果；根据所述第n层正向运算结果获得第n层输出数据梯度；根据所述反向运算指令对所述第n层输出数据梯度执行n层反向运算得到所述训练模型的权值梯度；所述训练模型的权值梯度包括n层中每层的权值梯度；所述压缩单元对所述训练模型的权值梯度进行处理，以对应得到处理后的权值梯度；所述计算装置依据所述处理后的权值梯度对所述训练模型的权值进行更新，以完成训练。第二方面，提供一种计算装置，所述计算装置包括用于执行上述第一方面的方法的硬件单元。第三方面，提供一种...

【技术保护点】
1.一种计算装置，其特征在于，包括运算单元、指令控制单元以及压缩单元；所述计算装置获取训练样本、训练模型；所述训练模型为：神经网络训练模型和/或非神经网络训练模型，所述训练模型包括n层结构；所述指令控制单元用于获取训练指令，根据所述训练指令得到正向运算指令和反向运算指令；将所述正向运算指令和所述反向运算指令分别发送给所述运算单元；所述运算单元用于根据所述正向运算指令对所述训练样本进行n层正向运算得到第n层正向运算结果；根据所述第n层正向运算结果获得第n层输出数据梯度；所述运算单元还用于根据所述反向运算指令对所述第n层输出数据梯度执行n层反向运算得到所述训练模型的权值梯度；所述训练模型的权值梯度包括n层中每层的权值梯度；所述压缩单元用于对所述训练模型的权值梯度进行处理，以对应得到处理后的权值梯度；所述计算装置用于依据所述处理后的权值梯度对所述训练模型的权值进行更新，以完成训练。

【技术特征摘要】
1.一种计算装置，其特征在于，包括运算单元、指令控制单元以及压缩单元；所述计算装置获取训练样本、训练模型；所述训练模型为：神经网络训练模型和/或非神经网络训练模型，所述训练模型包括n层结构；所述指令控制单元用于获取训练指令，根据所述训练指令得到正向运算指令和反向运算指令；将所述正向运算指令和所述反向运算指令分别发送给所述运算单元；所述运算单元用于根据所述正向运算指令对所述训练样本进行n层正向运算得到第n层正向运算结果；根据所述第n层正向运算结果获得第n层输出数据梯度；所述运算单元还用于根据所述反向运算指令对所述第n层输出数据梯度执行n层反向运算得到所述训练模型的权值梯度；所述训练模型的权值梯度包括n层中每层的权值梯度；所述压缩单元用于对所述训练模型的权值梯度进行处理，以对应得到处理后的权值梯度；所述计算装置用于依据所述处理后的权值梯度对所述训练模型的权值进行更新，以完成训练。2.根据权利要求1所述的计算装置，其特征在于，所述指令运算单元还用于将所述正向运算指令进行译码得到第一微指令和第二微指令；所述压缩单元，还用于根据所述第一微指令对所述训练样本进行处理，得到处理后的训练样本；所述运算单元，具体用于根据所述第二微指令对所述处理后的训练样本进行n层正向运算得到第n层正向运算结果。3.根据权利要求1所述的计算装置，其特征在于，所述运算单元，具体用于根据所述反向运算指令对所述第n层输出权值梯度执行第n层反向运算得到所述训练模型中第n层的权值梯度；所述压缩单元，还用于对所述第n层的权值梯度进行处理，得到处理后的第n层的权值梯度；所述计算装置，具体用于利用所述处理后的第n层的权值梯度对所述训练模型中第n层的权值进行更新。4.根据权利要求3所述的计算装置，其特征在于，所述运算单元，还用于获取第n-1层输出数据梯度，对所述第n-1层输出数据梯度执行第n-1层反向运算得到第n-1层的权值梯度；所述压缩单元，还用于对所述第n-1层的权值梯度进行处理，得到处理后的第n-1层的权值梯度；所述计算装置，具体用于依据所述处理后的第n-1层的权值梯度对所述训练模型中第n-1层的权值进行更新，依次类推，所述计算装置将依据所述训练模型中处理后的每层的权值梯度对应对所述训练模型的权值进行更新，以完成训练。5.根据权利要求1-4中任一项所述的计算装置，其特征在于，所述压缩单元，用于确定数据处理方式，根据所述数据处理方式对所述训练模型的权值梯度进行处理，以对应得到处理后的权值梯度；所述数据处理方式包括以下中的至少一项：剪枝处理、量化处理以及编码处理。6.根据权利要求5所述的计算装置，其特征在于，所述压缩单元还包括控制单元，在所述压缩单元内部通过所述控制单元对所述处理方式对应的运算状态进行修改，以实现多种处理方式的数据处理；所述运算状态包括以下中的至少一项：第一状态、第二状态、第三状态以及第四状态，其中，所述第一状态，用于指示所述压缩单元处于初始状态，不进行任何数据处理；所述第二状态与所述剪枝处理关联，用于指示所述压缩单元将进行数据的剪枝处理；所述第三状态与所述量化处理关联，用于指示所述压缩单元将进行数据的量化处理；所述第四状态与所述编码处理关联，用于指示所述压缩单元将进行数据的编码处理。7.根据权利要求5所述的计算装置，其特征在于，当所述数据处理方式为剪枝处理时，所述压缩单元，具体用于根据所述剪枝处理，将绝对值大于或等于第一阈值的...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人