机器学习模型训练方法、装置、存储介质和计算机设备制造方法及图纸

技术编号:20365186 阅读:22 留言:0更新日期:2019-02-16 17:34
本申请涉及一种机器学习模型训练方法、装置、存储介质和计算机设备,所述方法包括:获取模型训练数据和相对应的标签;所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据;根据所述模型训练数据的产生时间确定所述模型训练数据的权重;将所述模型训练数据输入机器学习模型,得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果;根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标;按照优化所述训练目标的方向,调整所述机器学习模型的模型参数并继续训练,直至满足训练停止条件时结束训练。本申请提供的方案训练出的机器学习模型预测效果好。

【技术实现步骤摘要】
机器学习模型训练方法、装置、存储介质和计算机设备
本申请涉及计算机
,特别是涉及一种机器学习模型训练方法、装置、存储介质和计算机设备。
技术介绍
随着计算机技术的发展,在推荐对象的过程中,通常会用到机器学习模型来对推荐对象的进行推荐预测。在通过机器学习模型对推荐对象的进行推荐预测之前,需要先训练出用于推荐预测的机器学习模型。然而,传统的机器学习模型训练过程中,未考虑到训练样本之间的差异性,导致在利用传统方法训练出的机器学习模型进行推荐预测时,可能会出现预测不准确的问题。
技术实现思路
基于此,有必要针对利用传统方法训练出的机器学习模型进行推荐预测时,可能会出现预测不准确的问题,提供一种机器学习模型训练方法、装置、存储介质和计算机设备。一种机器学习模型训练方法,包括:获取模型训练数据和相对应的标签;所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据;根据所述模型训练数据的产生时间确定所述模型训练数据的权重;将所述模型训练数据输入机器学习模型,得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果;根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标;按照优化所述训练目标的方向,调整所述机器学习模型的模型参数并继续训练,直至满足训练停止条件时结束训练。一种机器学习模型训练装置,包括:获取模块,用于获取模型训练数据和相对应的标签;所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据;确定模块,用于根据所述模型训练数据的产生时间确定所述模型训练数据的权重;将所述模型训练数据输入机器学习模型,得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果;根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标;调整模块,用于按照优化所述训练目标的方向,调整所述机器学习模型的模型参数并继续训练,直至满足训练停止条件时结束训练。一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述机器学习模型训练方法的步骤。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述机器学习模型训练方法的步骤。上述机器学习模型训练方法、装置、计算机可读存储介质和计算机设备,将用户样本的特征数据和推荐对象样本的特征数据共同作为模型训练数据,以训练出可预测用户对推荐对象的用户行为结果的机器学习模型。在确定训练目标时,考虑模型训练数据随时间的变化对预测结果的影响,根据模型训练数据产生的时间为模型训练数据赋予权重,这样可在学习全部数据的基础上,重点学习某一时间段产生的模型训练数据,来提高模型预估的准确性;在用户对推荐对象的行为随时间变化明显的情况下,效果尤为明显。附图说明图1为一个实施例中机器学习模型训练方法的流程示意图;图2为一个实施例中机器学习模型的结构示意图;图3为一个实施例中机器学习模型使用方法的流程示意图;图4为一个实施例中训练和使用机器学习模型的应用环境示意图;图5为一个实施例中训练和使用机器学习模型的流程示意图;图6为一个实施例中机器学习模型训练装置的结构框图;图7为另一个实施例中机器学习模型训练装置的结构框图;图8为一个实施例中计算机设备的结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。如图1所示,在一个实施例中,提供了一种机器学习模型训练方法。本实施例主要以该方法应用于计算机设备来举例说明。该计算机设备具体可以是服务器,也可以是终端。参照图1,该机器学习模型训练方法具体包括如下步骤:S102,获取模型训练数据和相对应的标签;模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据。其中,模型训练数据是用于训练模型的样本的特征数据,是模型训练时输入模型的数据。模型训练数据相对应的标签,是模型训练时模型的期望输出。不同的模型由于学习的能力或者用途不同,训练所需要的样本、样本的特征数据以及模型的输出也不同。比如,用于识别人脸图像的模型训练所需的样本为人脸图像,样本的特征数据为人脸特征数据,模型的输出为人脸识别结果。再比如,用于识别声音的模型所需的样本为音频数据,样本的特征数据为声学特征数据,模型的输出为声音识别结果。在本实施例中,计算机设备意图训练出能够预测用户对推荐对象的用户行为结果的机器学习模型。那么,本领域技术人员可以理解,本专利技术实施例中,样本包括用户样本和推荐对象样本;模型训练数据,也就是样本的特征数据,包括用户样本的特征数据和推荐对象样本的特征数据。这样,计算机设备即可训练模型学习用户样本的特征数据和推荐对象样本的特征数据,来预测用户对推荐对象的用户行为结果。推荐对象是用于向用户进行推荐的对象。推荐对象具体可以是推广信息、应用程序、视频、音频、新闻或者商品等。其中,推广信息具体可以是广告。S104,根据模型训练数据的产生时间确定模型训练数据的权重。其中,模型训练数据的权重,用于反映模型训练数据在训练过程中的重要程度。本领域技术人员可以理解,用户对推荐对象的用户行为结果会随时间的变化而发生变化。比如,用户兴趣特征可随着时间的变化发生变化,而用户兴趣特征是用户特征,会影响用户对推荐对象的用户行为结果。再比如,广告投放多天后,点击率或者转化率随时间呈现出逐渐增加或者减少的趋势。那么,计算机设备在采用模型训练数据训练机器学习模型时,可以为不同时间点产生的模型训练数据赋予不同的样本权重,这样可在学习全部样本的基础上,重点学习某一时间段产生的样本,来提高模型预估的准确性。可以理解,这里提到的为不同时间点产生的模型训练数据赋予不同样本权重的设置方式有多种,具体的设置方式可参考后续实施例中的相关描述。具体地,计算机设备可事先根据先验知识或者经验数据,设置模型训练数据的权重随模型训练数据的产生时间变化的映射关系。这样,计算机设备生成模型训练数据时,或者在需要用模型训练数据来训练模型时,即可根据该映射关系来确定模型训练数据的权重。其中,映射关系具体可以是函数关系。函数关系可以是正相关函数关系,也可以是负相关函数关系;即模型训练数据的权重随模型训练数据的产生时间变化可以是正相关变化,也可以是负相关变化。S106,将模型训练数据输入机器学习模型,得到与用户样本及推荐对象样本对应的用户行为预测结果。其中,机器学习英文全称为MachineLearning,简称ML。机器学习模型可通过样本学习具备特定的能力。机器学习模型可采用神经网络模型、支持向量机、逻辑回归模型、随机森林模型或者梯度提升树模型等。本专利技术实施例中的机器学习模型,是经过训练后具有预测用户对推荐对象的行为结果的模型。用户行为预测结果是预测用户对推荐对象进行某种行为的结果。用户行为预测结果作为机器学习模型的输出,与输入机器学习模型的模型训练数据一一对应;与用户样本及推荐对象样本对应的用户行为预测结果,表示的是预测模型训练数据源自的用户对模型训练数据源自的推荐对象进行某种行为的结果。用户行为预测结果可以是用户行为预测概率。比如,用户查看推荐对象的概率或者用户转化推荐对象的概率等。具体比如,用本文档来自技高网...

【技术保护点】
1.一种机器学习模型训练方法,包括:获取模型训练数据和相对应的标签;所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据;根据所述模型训练数据的产生时间确定所述模型训练数据的权重;将所述模型训练数据输入机器学习模型,得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果;根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标;按照优化所述训练目标的方向,调整所述机器学习模型的模型参数并继续训练,直至满足训练停止条件时结束训练。

【技术特征摘要】
1.一种机器学习模型训练方法,包括:获取模型训练数据和相对应的标签;所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据;根据所述模型训练数据的产生时间确定所述模型训练数据的权重;将所述模型训练数据输入机器学习模型,得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果;根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标;按照优化所述训练目标的方向,调整所述机器学习模型的模型参数并继续训练,直至满足训练停止条件时结束训练。2.根据权利要求1所述的方法,其特征在于,所述获取模型训练数据和相对应的标签,包括:收集用户样本的特征数据和推荐对象样本的特征数据生成模型训练数据;当所述用户样本的特征数据中存在对所述推荐对象样本的目标行为数据时,则设置所述模型训练数据相对应的标签为正样本训练标签;当所述用户样本的特征数据中不存在对所述推荐对象样本的目标行为数据时,则设置所述模型训练数据相对应的标签为负样本训练标签。3.根据权利要求2所述的方法,其特征在于,所述模型训练数据为样本特征向量;所述收集用户样本的特征数据和推荐对象样本的特征数据生成模型训练数据,包括:收集用户样本的用户行为数据和用户属性数据;收集推荐对象样本的推荐对象内容数据和推荐对象属性数据;将用户样本的用户行为数据和用户属性数据各自映射为向量元素,并将推荐对象样本的推荐对象内容数据和推荐对象属性数据各自映射为向量元素;组合用户样本相应的各向量元素和推荐对象样本相应的各向量元素,生成样本特征向量。4.根据权利要求1所述的方法,其特征在于,所述将所述模型训练数据输入机器学习模型,得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果,包括:确定所述推荐对象样本所属的对象类型;将所述模型训练数据输入机器学习模型,控制通过所述机器学习模型中与所述对象类型对应的输出单元,输出与所述用户样本及所述推荐对象样本对应的用户行为预测结果。5.根据权利要求4所述的方法,其特征在于,所述机器学习模型包括输入层、中间隐藏层和输出层;所述输出层包括多个对象类型各自对应的输出单元;所述按照优化所述训练目标的方向,调整所述机器学习模型的模型参数并继续训练,直至满足训练停止条件时结束训练,包括:按照优化所述训练目标的方向,调整所述机器学习模型中输入层、中间隐藏层以及与确定的所述对象类型对应的输出单元的模型参数,并继续训练,直至满足训练停止条件时结束训练。6.根据权利要求4所述的方法,其特征在于,所述根据所述模型训练数据的产生时间确定所述模型训练数据的权重,包括:查询所述模型训练数据的产生时间;获取与所述对象类型相应配置的时间衰减函数;根据所述产生时间和所述时间衰减函数,计算所述模型训练数据的权重。7.根据权利要求6所述的方法,其特征在于,所述时间衰减函数为分段函数;当所述时间衰减函数的时间自变量落于预设时间节点与当前时间节点构成的时间区间内时;所述时间衰减函数为常数函数;当所述时间衰减函数的时间自变量落于预设时间节点与当前时间节点构成的时间区间外时,所述时间衰减函数为与时间自变量负相关的函数。8.根据权利要求1所述的方法,其特征在于,所述模型训练数...

【专利技术属性】
技术研发人员:谭奔牟蕾尤爱华刘大鹏肖磊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1