用于定点神经网络的位宽选择制造技术

技术编号：30333973 阅读：37 留言：0更新日期：2021-10-10 00:57

本申请涉及用于定点神经网络的位宽选择。一种用于选择定点机器学习模型的位宽的方法包括评估该模型的每个计算级处的模型准确度对于位宽的敏感度。该方法还包括选择该模型的计算级中的参数和/或中间计算的位宽。该参数的位宽和该中间计算的位宽可以是不同的。所选择的位宽可以基于敏感度评估来确定。择的位宽可以基于敏感度评估来确定。择的位宽可以基于敏感度评估来确定。

全部详细技术资料下载

【技术实现步骤摘要】
用于定点神经网络的位宽选择
[0001]本申请是申请日为2016年4月11日、国际申请日为“PCT/US2016/026944”、申请日为“201680026249.7”、专利技术名称为“用于定点神经网络的位宽选择”的申请的分案申请。
[0002]相关申请的交叉引用
[0003]本申请要求于2015年5月8日提交的题为“BIT WIDTH SELECTION FOR FIXED POINT NEURAL NETWORKS(用于定点神经网络的位宽选择)”的美国临时专利申请No.62/159,097的权益，其公开内容通过援引全部明确纳入于此。

[0004]本公开的某些方面一般涉及机器学习，并且尤其涉及改进用于定点机器学习模型(诸如人工神经网络)的位宽选择的系统和方法。

技术介绍

[0005]可包括一群互连的人工神经元(例如，神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。
[0006]卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合，其中每个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)具有众多应用。具体而言，CNN已被广泛使用于模式识别和分类领域。
[0007]深度学习架构(诸如深度置信网络和深度卷积网络)是分层神经网络架构，其中第一层神经元的输出变成第二层神经元的输入，第二层神经元的输出变成第三层神经元的输入，依此类推。深度神经网络可被训练以识别特征阶层并且因此它们已被越来越多地用于对象识别应用。类似于卷积神经网络，这些...

【技术保护点】

【技术特征摘要】
1.一种用于为包括神经网络的机器学习模型选择位宽的计算机实现的方法，所述方法包括：接收第一输入，所述第一输入包括在所述神经网络的第一层的激活值的第一集合，所述第一层包括对应的权重的第一集合；处理以执行以下至少一者：将所述激活值的第一集合量化为第一层激活位宽，以及将所述权重的第一集合量化为第一层权重位宽；确定用于所述机器学习模型的模型性能度量，其中所述确定包括将经处理的激活值的第一集合与经处理的权重的第一集合相乘；以及基于所确定的模型性能度量来改变所述第一层激活位宽和所述第一层权重位宽中的至少一者。2.如权利要求1所述的方法，其中所述第一层是卷积层。3.如权利要求2所述的方法，其中接收所述第一输入的步骤包括首先将所述第一输入分解成多个通道。4.如权利要求1所述的方法，其中所述第一层是全连接层。5.如权利要求1
‑
4中任一项所述的方法，其中所述处理包括量化所述激活值的第一集合和所述权重的第一集合两者。6.如权利要求5所述的方法，其中所述第一层激活位宽与所述第一层权重位宽不同。7.如权利要求1
‑
6中任一项所述的方法，进一步包括：接收第二输入，所述第二输入包括所述神经网络的第二层的激活值的第二集合，所述第二层包括与所述权重的第一集合不同的对应的权重的第二集合；处理以执行以下至少一者：将所述激活值的第二集合量化为第二层激活位宽，以及将所述权重的第二集合量化为第二层权重位宽；以及确定用于所述机器学习模型的第二模型性能度量，其中所述确定包括将经处理的...

【专利技术属性】
技术研发人员：D，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人