【技术实现步骤摘要】
训练模型的方法、信息处理方法、装置及电子设备
本专利技术涉及机器学习
,更具体地,涉及一种训练机器学习模型的方法、一种信息处理方法、一种训练机器学习模型的装置、一种信息处理装置、一种电子设备、及一种可读存储介质。
技术介绍
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。半定规划(semi-definiteprogramming,SDP)研究的是半正定约束下具有凸目标函数的优化问题,即半定规划用于处理具有凸目标函数和半定约束的优化问题。很多机器学习算法都可以变成半定规划问题,如嵌入和聚类算法,稀疏的主成分分析算法,最大差异延展算法(maximumvarianceunfolding),无参数核学习算法以及距离度量学习算法等。在图片或文本的相似性比对等应用场景下,可以是利用匹配的机器学习模型来对输入的图片对或文本对之间的相似性进行预测;在自然语言处理的应用场景下,可以是利用匹配的机器学习模型 ...
【技术保护点】
1.一种训练机器学习模型的方法,其特征在于,包括:/n获取训练样本集;/n将预先选定的机器学习算法的半定规划目标函数中的平方和损失函数项替换为L1损失函数项,得到新的目标函数;/n根据所述机器学习算法以及所述新的目标函数,基于所述训练样本集完成机器学习训练,得到最终的机器学习模型。/n
【技术特征摘要】
1.一种训练机器学习模型的方法,其特征在于,包括:
获取训练样本集;
将预先选定的机器学习算法的半定规划目标函数中的平方和损失函数项替换为L1损失函数项,得到新的目标函数;
根据所述机器学习算法以及所述新的目标函数,基于所述训练样本集完成机器学习训练,得到最终的机器学习模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述新的目标函数中进一步添加一项正则项,得到最终的目标函数,其中,所述正则项包含关于所述预先选定的机器学习算法的模型参数的平方和;
根据所述机器学习算法以及所述最终的目标函数,基于所述训练样本集完成机器学习训练,得到最终的机器学习模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述机器学习算法以及所述最终的目标函数,基于所述训练样本集完成机器学习训练,得到机器学习模型的步骤包括:
构建最终的目标函数的替代函数;
根据所述训练样本集求解所述替代函数,得到每一轮迭代过程所对应的模型参数的变化增量;
根据每一轮迭代过程所对应的变化增量,更新机器学习模型的模型参数,完成机器学习训练,得到所述最终的机器学习模型。
4.根据权利要求3所述的方法,其特征在于,所述构建所述最终的目标函数的替代函数的步骤包括:
根据所述最终的目标函数、及预设的规则,以模型参数的变化增量为变量,构建所述最终的目标函数的凸的上界函数,作为所述替代函数。
5.根据权利要求4所述的方法,其特征在于,所述预设的规则包括:
将任意变化增量代入所述替代函数和所述最终的目标函数,使得所述替代函数的结果大于或等于所述最终的目标函数的结果;和/或...
【专利技术属性】
技术研发人员:姚权铭,
申请(专利权)人:第四范式北京技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。