一种模型训练的方法、业务处理的方法以及相关装置制造方法及图纸

技术编号：41404834 阅读：4 留言：0更新日期：2024-05-20 19:30

本申请实施例公开了一种模型训练的方法、业务处理的方法以及相关装置，用于提升推荐精确度和推荐效果，并扩展使用场景。模型训练的方法包括：获取包括多个对象训练样本的训练数据；提取每个对象训练样本的游戏样本特征，每个游戏样本特征用于表征对应对象训练样本在虚拟游戏业务中的对局属性情况；基于初始推荐模型对多个对象训练样本的游戏样本特征进行处理，得到样本推荐列表；基于样本推荐列表和样本推荐列表对应的标签对初始推荐模型进行训练，以得到目标推荐模型，目标推荐模型用于对待处理对象的目标游戏特征进行处理，以得到与待处理对象对应的目标推荐列表，目标推荐列表包括至少两个目标对象，每个目标对象用于被推荐给待处理对象。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及人工智能，具体涉及一种模型训练的方法、业务处理的方法以及相关装置。

技术介绍

1、随着大数据时代的到来，在互联网上提供了针对用户的许多对象推荐服务，例如包括但不限于音乐、视频、游戏好友、广告、商品等等。推荐是基于收集到的历史数据来学习用户的特征和对象的特征来进行的。尤其是在个性化推荐领域中，最传统的推荐算法是在使用词频-逆文档频率（term frequency-inverse document frequency，tf-idf）模型提取出每个商品的评论文本所对应的商品内容向量的基础上，利用稀疏边缘降噪自动编码模型确定商品内容向量的商品特征之间的相似度，并结合用户评分矩阵确定出近邻商品的预测评分，从而根据预测评分将合适的近邻商品推荐给用户。

2、然而，上述传统的推荐算法仅适用于文本推荐场景，导致使用场景存在局限性。另外，传统推荐算法中所使用的稀疏边缘降噪自动编码模型需要依赖于商品特征的相似度进行降噪，无法直接预测出用于推荐的近邻商品，从而无法做到端到端的训练，使得推荐精确度和推荐效果较差。

技术实现思路

1、本申请实施例提供了一种模型训练的方法、业务处理的方法以及相关装置，用于提升推荐精确度和推荐效果，并且扩展使用场景。

2、第一方面，本申请实施例提供了一种模型训练的方法。方法包括：获取训练数据，训练数据包括多个对象训练样本，每个对象训练样本均与虚拟游戏业务相关；提取每个对象训练样本的游戏样本特征，每个游戏样本特征用于表征对应对象训练样本在虚拟

3、第二方面，本申请实施例提供了一种业务处理的方法。该方法包括：接收终端设备发送的对象推荐请求，并基于对象推荐请求确定待处理对象；提取待处理对象的目标游戏特征，目标游戏特征用于表征待处理对象在虚拟游戏业务中的对局属性情况；基于目标推荐模型对目标游戏特征进行处理，得到目标推荐列表，目标推荐列表包括至少两个目标对象，目标推荐模型是以样本推荐列表和样本推荐列表对应的标签为训练数据，对初始推荐模型进行训练得到的机器学习模型，样本推荐列表是由初始推荐模型对多个对象训练样本的游戏业务特征进行处理得到，每个对象训练样本的游戏业务特征用于表征对应对象训练样本在虚拟游戏业务中的对局属性情况，每个对象训练样本均与虚拟游戏业务相关；向终端设备发送目标推荐列表，目标推荐列表用于终端设备显示至少两个目标对象，以使每个目标对象与待处理对象执行虚拟游戏业务。

4、第三方面，本申请实施例提供了一种模型训练装置。该模型训练装置包括获取单元、提取单元、处理单元以及训练单元。其中，获取单元，用于获取训练数据，训练数据包括多个对象训练样本，每个对象训练样本均与虚拟游戏业务相关。提取单元，用于提取每个对象训练样本的游戏样本特征，每个游戏样本特征用于表征对应对象训练样本在虚拟游戏业务中的对局属性情况。处理单元，用于基于初始推荐模型对多个对象训练样本的游戏样本特征进行处理，得到样本推荐列表，样本推荐列表包括至少两个被推荐的样本对象。训练单元，用于基于样本推荐列表和样本推荐列表对应的标签对初始推荐模型进行训练，以得到目标推荐模型，目标推荐模型用于对待处理对象的目标游戏特征进行处理，以得到与待处理对象对应的目标推荐列表，目标推荐列表包括至少两个目标对象，每个目标对象用于被推荐给待处理对象，以执行虚拟游戏业务。

5、在一些可选的实施方式中，训练单元，具体用于：对样本推荐列表进行正则化处理，得到目标正则项信息；基于样本推荐列表、样本推荐列表对应的标签以及预设鲁棒性参数构建目标损失函数；基于目标损失函数、目标正则信息以及初始推荐模型中的初始优化函数，确定目标优化函数，初始优化函数是以求解样本推荐列表与样本推荐列表对应的标签之间最小差异为求解目标时的函数；对目标优化函数进行泰勒展开式处理，以确定目标损失值，目标损失值用于表征样本推荐列表和样本推荐列表对应的标签之间的最小差异；基于目标损失值对初始推荐模型的模型参数进行更新，以得到目标推荐模型。

6、在另一些可选的实施方式中，训练单元，具体用于：提取初始优化函数中的初始正则项信息和初始损失函数；将初始优化函数的初始正则项信息更新为目标正则项信息、以及将初始优化函数的初始损失函数更新为目标损失函数，以构建得到目标优化函数。

7、在另一些可选的实施方式中，训练单元，具体用于：计算第一概率值与第二概率值之间的乘积，得到第一值，第一概率值用于指示所样本推荐列表的预测概率，第二概率值用于指示样本推荐列表对应的标签的概率；对第一值与预设鲁棒性参数之间的差异进行对数求解处理，得到第二值；基于第二值与预设阈值之间的最小值关系，构建目标损失函数。

8、在另一些可选的实施方式中，处理单元，具体用于：将每个游戏样本特征分别作为初始推荐模型的输入，以确定与游戏样本特征对应的对象训练样本的样本分数；基于多个对象训练样本的样本分数，从多个对象训练样本中确定样本推荐列表。

9、在另一些可选的实施方式中，初始推荐模型包括xgboost模型，xgboost模型包括至少一个特征子模型；处理单元，具体用于：针对每个特征子模型，确定每个第一业务特征所对应于每个特征子模型的叶子节点，以得到每个游戏样本特征的叶子节点集合，每个游戏样本特征的叶子节点集合用于表征对应游戏样本特征对应于每个特征子模型的叶子节点的集合，每个第一业务特征均为每个游戏样本特征中的业务子特征；计算每个游戏样本特征的叶子节点集合中的所有叶子节点的节点分数之和，得到每个游戏样本特征对应于每个特征子模型的特征分数；针对每个游戏样本特征，将与游戏样本特征对应的至少一个特征子模型的特征分数进行求和，得到对应游戏样本特征所对应的对象训练样本的样本分数。

10、在另一些可选的实施方式中，游戏样本特征包括对局社交特征、对局统计特征、对局消耗特征、对局活跃特征以及对局对象属性中的一个或多个，对局社交特征用于指示对象训练样本在虚拟游戏业务中的社交情况，对局统计特征用于指示对象训练样本在虚拟游戏业务中的业务统计情况，对局消耗特征用于指示对象训练样本在虚拟游戏业务中的资源消耗情况，对局活跃特征用于指示对象训练样本在虚拟游戏业务中的活跃情况。

11、第四方面，本申请实施例提供了一种业务处理装置。该业务处理装置包括接收模块、提取模块、处理模块以及发送模块。其中，接收模块，用于接收终端设备发送的对象推荐请求。处理模块，用于基于对象推荐请求确定待处理对象。提取模块，用于提取待处理对象的目标游戏特征，目标游戏特征用于表征待处理对象在虚拟游戏本文档来自技高网...

【技术保护点】

1.一种模型训练的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，基于所述样本推荐列表和所述样本推荐列表对应的标签对所述初始推荐模型进行训练，以得到目标推荐模型，包括：

3.根据权利要求2所述的方法，其特征在于，基于所述目标损失函数、所述目标正则信息以及所述初始推荐模型中的初始优化函数，确定目标优化函数，包括：

4.根据权利要求2至3中任一项所述的方法，其特征在于，基于所述样本推荐列表、所述样本推荐列表对应的标签以及预设鲁棒性参数构建目标损失函数，包括：

5.根据权利要求1至3中任一项所述的方法，其特征在于，基于初始推荐模型对多个所述对象训练样本的游戏样本特征进行处理，以得到样本推荐列表，包括：

6.根据权利要求5所述的方法，其特征在于，所述初始推荐模型包括XGBoost模型，所述XGBoost模型包括至少一个特征子模型；将每个所述游戏样本特征分别作为所述初始推荐模型的输入，以确定与所述游戏样本特征对应的所述对象训练样本的样本分数，包括：

7.根据权利要求1至3中任一项所述的方法，其特征在

8.一种业务处理的方法，其特征在于，包括：

9.根据权利要求8所述的方法，其特征在于，基于目标推荐模型对所述目标游戏特征进行处理，得到目标推荐列表，包括：

10.根据权利要求9所述的方法，其特征在于，所述目标推荐模型包括XGBoost模型，所述XGBoost模型包括至少一个特征子模型；将所述目标游戏特征作为所述目标推荐模型的输入，以确定与所述目标游戏特征对应的所述待处理对象的目标分数，包括：

11.根据权利要求8至10中任一项所述的方法，其特征在于，基于所述对象推荐请求确定待处理对象，包括：

12.根据权利要求8至10中任一项所述的方法，其特征在于，所述方法还包括：

13.根据权利要求8至10中任一项所述的方法，其特征在于，所述目标游戏特征包括对局社交特征、对局统计特征、对局消耗特征、对局活跃特征以及对局对象属性中的一个或多个，所述对局社交特征用于指示所述待处理对象在所述虚拟游戏业务中的社交情况，所述对局统计特征用于指示所述待处理对象在所述虚拟游戏业务中的业务统计情况，所述对局消耗特征用于指示所述待处理对象在所述虚拟游戏业务中的资源消耗情况，所述对局活跃特征用于指示所述待处理对象在所述虚拟游戏业务中的活跃情况。

14.一种模型训练装置，其特征在于，包括：

15.一种业务处理装置，其特征在于，包括：

16.一种业务处理设备，其特征在于，包括：输入/输出（I/O）接口、处理器和存储器，所述存储器中存储有程序指令；

17.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括指令，当所述指令在计算机设备上运行时，使得所述计算机设备执行如权利要求1至7中任一所述的方法；或者，执行如权利要求8至13中任一所述的方法。

18.一种计算机程序产品，其特征在于，所述计算机程序产品包括指令，当所述指令在计算机设备上运行时，使得所述计算机设备执行如权利要求1至7中任一所述的方法；或者，执行如权利要求8至13中任一所述的方法。

...

【技术特征摘要】

1.一种模型训练的方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，所述初始推荐模型包括xgboost模型，所述xgboost模型包括至少一个特征子模型；将每个所述游戏样本特征分别作为所述初始推荐模型的输入，以确定与所述游戏样本特征对应的所述对象训练样本的样本分数，包括：

7.根据权利要求1至3中任一项所述的方法，其特征在于，所述游戏样本特征包括对局社交特征、对局统计特征、对局消耗特征、对局活跃特征以及对局对象属性中的一个或多个，所述对局社交特征用于指示所述对象训练样本在所述虚拟游戏业务中的社交情况，所述对局统计特征用于指示所述对象训练样本在所述虚拟游戏业务中的业务统计情况，所述对局消耗特征用于指示所述对象训练样本在所述虚拟游戏业务中的资源消耗情况，所述对局活跃特征用于指示所述对象训练样本在所述虚拟游戏业务中的活跃情况。

8.一种业务处理的方法，其特征在于，包括：

9.根据权利要求8所述的方法，其特征在于，基于目标推荐模型对所述目标游戏特征进行处理，得到目标推荐列表，包括：

...

【专利技术属性】
技术研发人员：谭莲芝，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人