机器学习模型训练方法、装置、存储介质和计算机设备制造方法及图纸

技术编号：20365186 阅读：22 留言：0更新日期：2019-02-16 17:34

本申请涉及一种机器学习模型训练方法、装置、存储介质和计算机设备，所述方法包括：获取模型训练数据和相对应的标签；所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据；根据所述模型训练数据的产生时间确定所述模型训练数据的权重；将所述模型训练数据输入机器学习模型，得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果；根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标；按照优化所述训练目标的方向，调整所述机器学习模型的模型参数并继续训练，直至满足训练停止条件时结束训练。本申请提供的方案训练出的机器学习模型预测效果好。

全部详细技术资料下载

【技术实现步骤摘要】
机器学习模型训练方法、装置、存储介质和计算机设备
本申请涉及计算机
，特别是涉及一种机器学习模型训练方法、装置、存储介质和计算机设备。
技术介绍
随着计算机技术的发展，在推荐对象的过程中，通常会用到机器学习模型来对推荐对象的进行推荐预测。在通过机器学习模型对推荐对象的进行推荐预测之前，需要先训练出用于推荐预测的机器学习模型。然而，传统的机器学习模型训练过程中，未考虑到训练样本之间的差异性，导致在利用传统方法训练出的机器学习模型进行推荐预测时，可能会出现预测不准确的问题。
技术实现思路
基于此，有必要针对利用传统方法训练出的机器学习模型进行推荐预测时，可能会出现预测不准确的问题，提供一种机器学习模型训练方法、装置、存储介质和计算机设备。一种机器学习模型训练方法，包括：获取模型训练数据和相对应的标签；所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据；根据所述模型训练数据的产生时间确定所述模型训练数据的权重；将所述模型训练数据输入机器学习模型，得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果；根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标；按照优化所述训练目标的方向，调整所述机器学习模型的模型参数并继续训练，直至满足训练停止条件时结束训练。一种机器学习模型训练装置，包括：获取模块，用于获取模型训练数据和相对应的标签；所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据；确定模块，用于根据所述模型训练数据的产生时间确定所述模型训练数据的权重；将所述模型训练数据输入机器学习模型，得到与所述用户样本及所述推荐对象样本...

【技术保护点】
1.一种机器学习模型训练方法，包括：获取模型训练数据和相对应的标签；所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据；根据所述模型训练数据的产生时间确定所述模型训练数据的权重；将所述模型训练数据输入机器学习模型，得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果；根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标；按照优化所述训练目标的方向，调整所述机器学习模型的模型参数并继续训练，直至满足训练停止条件时结束训练。

【技术特征摘要】
1.一种机器学习模型训练方法，包括：获取模型训练数据和相对应的标签；所述模型训练数据包括用户样本的特征数据和推荐对象样本的特征数据；根据所述模型训练数据的产生时间确定所述模型训练数据的权重；将所述模型训练数据输入机器学习模型，得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果；根据所述用户行为预测结果和所述标签的差异及所述权重确定训练目标；按照优化所述训练目标的方向，调整所述机器学习模型的模型参数并继续训练，直至满足训练停止条件时结束训练。2.根据权利要求1所述的方法，其特征在于，所述获取模型训练数据和相对应的标签，包括：收集用户样本的特征数据和推荐对象样本的特征数据生成模型训练数据；当所述用户样本的特征数据中存在对所述推荐对象样本的目标行为数据时，则设置所述模型训练数据相对应的标签为正样本训练标签；当所述用户样本的特征数据中不存在对所述推荐对象样本的目标行为数据时，则设置所述模型训练数据相对应的标签为负样本训练标签。3.根据权利要求2所述的方法，其特征在于，所述模型训练数据为样本特征向量；所述收集用户样本的特征数据和推荐对象样本的特征数据生成模型训练数据，包括：收集用户样本的用户行为数据和用户属性数据；收集推荐对象样本的推荐对象内容数据和推荐对象属性数据；将用户样本的用户行为数据和用户属性数据各自映射为向量元素，并将推荐对象样本的推荐对象内容数据和推荐对象属性数据各自映射为向量元素；组合用户样本相应的各向量元素和推荐对象样本相应的各向量元素，生成样本特征向量。4.根据权利要求1所述的方法，其特征在于，所述将所述模型训练数据输入机器学习模型，得到与所述用户样本及所述推荐对象样本对应的用户行为预测结果，包括：确定所述推荐对象样本所属的对象类型；将所述模型训练数据输入机器学习模型，控制通过所述机器学习模型中与所述对象类型对应的输出单元，输出与所述用户样本及所述推荐对象样本对应的用户行为预测结果。5.根据权利要求4所述的方法，其特征在于，所述机器学习模型包括输入层、中间隐藏层和输出层；所述输出层包括多个对象类型各自对应的输出单元；所述按照优化所述训练目标的方向，调整所述机器学习模型的模型参数并继续训练，直至满足训练停止条件时结束训练，包括：按照优化所述训练目标的方向，调整所述机器学习模型中输入层、中间隐藏层以及与确定的所述对象类型对应的输出单元的模型参数，并继续训练，直至满足训练停止条件时结束训练。6.根据权利要求4所述的方法，其特征在于，所述根据所述模型训练数据的产生时间确定所述模型训练数据的权重，包括：查询所述模型训练数据的产生时间；获取与所述对象类型相应配置的时间衰减函数；根据所述产生时间和所述时间衰减函数，计算所述模型训练数据的权重。7.根据权利要求6所述的方法，其特征在于，所述时间衰减函数为分段函数；当所述时间衰减函数的时间自变量落于预设时间节点与当前时间节点构成的时间区间内时；所述时间衰减函数为常数函数；当所述时间衰减函数的时间自变量落于预设时间节点与当前时间节点构成的时间区间外时，所述时间衰减函数为与时间自变量负相关的函数。8.根据权利要求1所述的方法，其特征在于，所述模型训练数...

【专利技术属性】
技术研发人员：谭奔，牟蕾，尤爱华，刘大鹏，肖磊，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人