【技术实现步骤摘要】
一种数据预测方法、模型训练方法及相关装置
[0001]本申请涉及人工智能
,尤其涉及一种数据预测方法、模型训练方法及相关装置。
技术介绍
[0002]生命周期价值(Life Time Value,LTV)是一种用于衡量客户对企业产生的经济效益的指标,其具体是指客户为企业带来的总经济收益,包括因购买产品或服务产生的直接收益、以及因推荐其他潜在客户等产生的间接收益。在互联网领域,LTV用于衡量应用程序的用户为该应用程序的运营商带来的经济收益。
[0003]在实际应用中,LTV数据通常具有不平衡性和稀疏性的特点。图1示出了三款不同的应用程序的七日LTV数据(即用户注册应用程序后七日内的LTV)分布,从图1可以看出,大多数用户注册应用程序后七日内未贡献任何收益,而贡献收益的用户所贡献的收益分布也比较稀疏。
[0004]LTV数据的上述特点阻碍了模型学习准确捕捉数据固有规律的能力,因而,导致相关技术中所训练的用于预测LTV数据的模型普遍性能较差,难以准确地预测用户的LTV。
技术实现思路
[0005]本申请实施例提供了一种数据预测方法、模型训练方法及相关装置,能够提高LTV预测模型的性能,并且提高所预测的用户的LTV的准确性。
[0006]有鉴于此,本申请第一方面提供了一种数据预测方法,所述方法包括:获取目标对象的参考特征数据;所述参考特征数据用于在生命周期价值LTV预测任务中提供参考信息;通过LTV预测模型中的多通道网络包括的n个网络通道,基于所述参考特征数据进行深度特征提取处理 ...
【技术保护点】
【技术特征摘要】
1.一种数据预测方法,其特征在于,所述方法包括:获取目标对象的参考特征数据;所述参考特征数据用于在生命周期价值LTV预测任务中提供参考信息;通过LTV预测模型中的多通道网络包括的n个网络通道,基于所述参考特征数据进行深度特征提取处理,得到n个通道输出特征;所述n为大于1的整数,在所述LTV预测模型的训练过程中,所述n个网络通道分别用于学习对应于不同LTV区间的特征数据的深度特征表示;通过所述LTV预测模型中的通道学习控制器,根据所述参考特征数据,确定所述n个通道输出特征各自对应的重要度权重;通过所述LTV预测模型中的预测结构,根据所述n个通道输出特征及其各自对应的所述重要度权重,确定所述目标对象对应的目标嵌入特征;根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果。2.根据权利要求1所述的方法,其特征在于,所述通过LTV预测模型中的多通道网络包括的n个网络通道,基于所述参考特征数据进行深度特征提取处理,得到n个通道输出特征,包括:通过所述多通道网络中的共享特征编码层,基于所述参考特征数据进行特征编码处理,得到参考输入特征;通过所述多通道网络中的每个所述网络通道,对所述参考输入特征进行深度特征提取处理,得到每个所述网络通道对应的通道输出特征。3.根据权利要求1所述的方法,其特征在于,所述通过所述LTV预测模型中的通道学习控制器,根据所述参考特征数据,确定所述n个通道输出特征各自对应的重要度权重,包括:通过所述通道学习控制器中的多层感知器结构,根据所述参考特征数据,确定分类特征向量;所述分类特征向量中包括n个维度的重要性数据,所述n个维度的重要性数据与所述n个通道输出特征一一对应;通过所述通道学习控制器中的规范化网络,对所述分类特征向量进行规范化处理,得到规范分类特征向量;所述规范分类特征向量中包括所述n个通道输出特征各自对应的重要度权重。4.根据权利要求1所述的方法,其特征在于,所述通过所述LTV预测模型中的预测结构,根据所述n个通道输出特征及其各自对应的所述重要度权重,确定所述目标对象对应的目标嵌入特征,包括:通过所述预测结构中的特征融合结构,根据所述n个通道输出特征各自对应的所述重要度权重,对所述n个通道输出特征进行加权求和处理,得到所述目标嵌入特征;所述根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果,包括:通过所述预测结构中的全连接层,根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果。5.根据权利要求1至4任一项所述的方法,其特征在于,所述LTV预测结果用于表征所述目标对象注册目标应用程序后预设时段内为所述目标应用程序带来的收益;所述获取目标对象的参考特征数据,包括:根据所述目标对象在所述目标应用程序上的登录信息,确定关联应用程序;所述关联应用程序为所述目标对象使用所述登录信息登录使用的其它应用程序;
获取所述目标对象在所述关联应用程序上的参考离散特征和参考连续特征,作为所述参考特征数据。6.一种模型训练方法,其特征在于,所述方法包括:获取训练样本集合;所述训练样本集合中包括多个训练样本,每个所述训练样本包括训练特征数据及其对应的LTV标注结果;通过待训练的LTV预测模型中的多通道网络包括的n个网络通道,基于所述训练样本中的所述训练特征数据进行深度特征提取处理,得到n个训练通道输出特征;所述n为大于1的整数,所述n个网络通道分别用于学习对应于不同LTV区间的训练特征数据的深度特征表示;通过所述LTV预测模型中的通道学习控制器,根据所述训练样本中所述训练特征数据,确定所述n个训练通道输出特征各自对应的训练重要度权重;通过所述LTV预测模型中的预测结构,根据所述n个训练通道输出特征及其各自对应的所述训练重要度权重,确定所述训练样本对应的训练嵌入特征;根据所述训练嵌入特征,确定所述训练样本对应的LTV训练预测结果;根据所述训练样本集合中各所述训练样本各自对应的LTV训练预测结果、以及各所述训练样本各自包括的LTV标注结果,确定LTV损失;基于所述LTV损失,调整所述LTV预测模型的模型参数。7.根据权利要求6所述的方法,其特征在于,所述训练样本集合中包括n个LTV区间各自对应的训练样本子集,所述LTV区间对应的训练样本子集中各个所述训练样本各自包括的LTV预测结果均属于所述LTV区间;所述n个LTV区间包括一个LTV等于0的区间、以及n
‑
1个LTV不等于0的区间,所述n
‑
1个LTV不等于0的区间各自对应的训练样本子集包括的训练样本数量之间的差值满足预设差值阈值。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:针对每个所述训练样本,根据所述训练样本包括的LTV标注结果,确定所述训练样本对应的分类标签;所述分类标签中包括所述n个LTV区间各自对应的分类标签数据,所述LTV标注结果所属的LTV区间对应的分类标签数据为1,其它分类标签数据为0;根据所述训练样本集合中各所述训练样本各自对应的预测权重分布、以及各所述训练样本各自对应的分类标签,确定分类损失;所述训练样本对应的预测权重分布为所述通道学习控制器根据所述训练样本中的所述训练特征数据确定的...
【专利技术属性】
技术研发人员:刘文双,罗鑫骥,尹存祥,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。