A method used to improve the performance of a trained machine learning model, including adding second classifiers with second objective functions to the first classifier with the first objective function. Second the objective function is used to directly reduce the number of errors of the first classifier, rather than minimizing the error function of the first classifier.
【技术实现步骤摘要】
【国外来华专利技术】用于提高经训练的机器学习模型的性能的方法相关申请的交叉引用本申请要求于2015年8月25日提交且题为“METHODFORIMPROVINGPERFORMANCEOFATRAINEDMACHINELEARNINGMODEL(用于提高经训练的机器学习模型的性能的方法)”的美国临时专利申请No.62/209,859的权益,其公开内容通过援引全部明确纳入于此。背景领域本公开的某些方面一般涉及机器学习,尤其涉及用于提高经训练的机器学习模型的性能的方法。背景可包括一群互连的人工神经元(例如,神经元模型)的机器学习模型(诸如,人工神经网络)是一种计算设备或者表示将由计算设备执行的方法。卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合,其中每一个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)具有众多应用。具体而言,CNN已被广泛使用于模式识别和分类领域。深度学习架构(诸如深度置信网络和深度卷积网络)是分层神经网络架构,其中第一层神经元的输出变成第二层神经元的输入,第二层神经元的输出变成第三层神经元的输入,依此类推。深度神经网络可被训练以识别特征阶层并且因此它们已被越来越多地用于对象识别应用。类似于卷积神经网络,这些深度学习架构中的计算可分布在处理节点群体上,其可被配置在一个或多个计算链中。这些多层架构可每次训练一层并可使用反向传播微调。其他模型也可用于对象识别。例如,支持向量机(SVM)是可被应用于分类的学习工具。支持向量机包括对数据进行归类的分离超平面(例如,决策边界)。该超平面由监督式学习来定义。期望的超平面增加训练数据的裕量。换言之, ...
【技术保护点】
一种用于提高经训练的机器学习模型的性能的方法,包括:将具有第二目标函数的第二分类器添加到具有第一目标函数的第一分类器,所述第二目标函数用于直接减少所述第一分类器的误差。
【技术特征摘要】
【国外来华专利技术】2015.08.25 US 62/209,859;2015.09.23 US 14/863,4101.一种用于提高经训练的机器学习模型的性能的方法,包括:将具有第二目标函数的第二分类器添加到具有第一目标函数的第一分类器,所述第二目标函数用于直接减少所述第一分类器的误差。2.如权利要求1所述的方法,其特征在于,所述第一目标函数是可微分的。3.如权利要求1所述的方法,其特征在于,所述第二目标函数是非可微分的。4.如权利要求1所述的方法,其特征在于,所述第二目标函数是所述第一分类器与所述第二分类器的误差之间的差的函数。5.如权利要求1所述的方法,其特征在于,进一步包括至少部分地基于来自较高复杂度模型的概率的混合来确定所述第二目标函数。6.如权利要求1所述的方法,其特征在于,进一步包括添加所述第二分类器而不重新训练所述第一分类器。7.如权利要求1所述的方法,其特征在于,进一步包括将所述第二分类器外部地添加到所述第一分类器。8.如权利要求1所述的方法,其特征在于,进一步包括将为身份值的权重指派给由所述第一分类器训练的模型产生的特征。9.如权利要求8所述的方法,其特征在于,进一步包括将为零的权重指派给由高复杂度模型的概率向量产生的特征。10.如权利要求1所述的方法,其特征在于,进一步包括将权重指派给由所述第二分类器的概率向量产生的特征。11.如权利要求1所述的方法,其特征在于,进一步包括将为零的权重指派给由高复杂度模型的概率向量产生的特征。12.如权利要求11所述的方法,其特征在于,进一步包括将权重指派给由所述第二分类器的概率向量产生的特征。13.如权利要求1所述的方法,其特征在于,进一步包括将由较高复杂度模型产生的概率向量以固定的温度T为因子进行缩放。14.一种用于提高经训练的机器学习模型的性能的装置,包括:存储器;以及至少一个处理器,其耦合到所述存储器,所述至少一个处理器被配置为将具有第二目标函数的第二分类器添加到具有第一目标函数的第一分类器,所述第二目标函数用于直接减少所述第一分类器的误差。15.如权利要求14所述的装置,其特征在于,所述第一目标函数是可微分的。1...
【专利技术属性】
技术研发人员:S·S·塔拉迪,A·瓦尔塔卡,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。