一种数据预测方法、模型训练方法及相关装置制造方法及图纸

技术编号:39041869 阅读:10 留言:0更新日期:2023-10-10 11:54
本申请实施例公开了一种人工智能领域的数据预测方法、模型训练方法及相关装置,其中该数据预测方法包括:获取目标对象的参考特征数据;通过LTV预测模型中的多通道网络包括的n个网络通道,基于参考特征数据进行深度特征提取处理得到n个通道输出特征,n个网络通道分别用于学习对应于不同LTV区间的特征数据的深度特征表示;通过LTV预测模型中的通道学习控制器,根据参考特征数据确定n个通道输出特征各自对应的重要度权重;通过LTV预测模型中的预测结构,根据n个通道输出特征及其各自对应的重要度权重确定目标嵌入特征;根据目标嵌入特征确定目标对象对应的LTV预测结果。该方法能够提高LTV预测结果的准确性。够提高LTV预测结果的准确性。够提高LTV预测结果的准确性。

【技术实现步骤摘要】
一种数据预测方法、模型训练方法及相关装置


[0001]本申请涉及人工智能
,尤其涉及一种数据预测方法、模型训练方法及相关装置。

技术介绍

[0002]生命周期价值(Life Time Value,LTV)是一种用于衡量客户对企业产生的经济效益的指标,其具体是指客户为企业带来的总经济收益,包括因购买产品或服务产生的直接收益、以及因推荐其他潜在客户等产生的间接收益。在互联网领域,LTV用于衡量应用程序的用户为该应用程序的运营商带来的经济收益。
[0003]在实际应用中,LTV数据通常具有不平衡性和稀疏性的特点。图1示出了三款不同的应用程序的七日LTV数据(即用户注册应用程序后七日内的LTV)分布,从图1可以看出,大多数用户注册应用程序后七日内未贡献任何收益,而贡献收益的用户所贡献的收益分布也比较稀疏。
[0004]LTV数据的上述特点阻碍了模型学习准确捕捉数据固有规律的能力,因而,导致相关技术中所训练的用于预测LTV数据的模型普遍性能较差,难以准确地预测用户的LTV。

技术实现思路

[0005]本申请实施例提供了一种数据预测方法、模型训练方法及相关装置,能够提高LTV预测模型的性能,并且提高所预测的用户的LTV的准确性。
[0006]有鉴于此,本申请第一方面提供了一种数据预测方法,所述方法包括:获取目标对象的参考特征数据;所述参考特征数据用于在生命周期价值LTV预测任务中提供参考信息;通过LTV预测模型中的多通道网络包括的n个网络通道,基于所述参考特征数据进行深度特征提取处理,得到n个通道输出特征;所述n为大于1的整数,在所述LTV预测模型的训练过程中,所述n个网络通道分别用于学习对应于不同LTV区间的特征数据的深度特征表示;通过所述LTV预测模型中的通道学习控制器,根据所述参考特征数据,确定所述n个通道输出特征各自对应的重要度权重;通过所述LTV预测模型中的预测结构,根据所述n个通道输出特征及其各自对应的所述重要度权重,确定所述目标对象对应的目标嵌入特征;根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果。
[0007]本申请第二方面提供了一种模型训练方法,所述方法包括:获取训练样本集合;所述训练样本集合中包括多个训练样本,每个所述训练样本包括训练特征数据及其对应的LTV标注结果;通过待训练的LTV预测模型中的多通道网络包括的n个网络通道,基于所述训练样本中的所述训练特征数据进行深度特征提取处理,得到n个训练通道输出特征;所述n为大
于1的整数,所述n个网络通道分别用于学习对应于不同LTV区间的训练特征数据的深度特征表示;通过所述LTV预测模型中的通道学习控制器,根据所述训练样本中所述训练特征数据,确定所述n个训练通道输出特征各自对应的训练重要度权重;通过所述LTV预测模型中的预测结构,根据所述n个训练通道输出特征及其各自对应的所述训练重要度权重,确定所述训练样本对应的训练嵌入特征;根据所述训练嵌入特征,确定所述训练样本对应的LTV训练预测结果;根据所述训练样本集合中各所述训练样本各自对应的LTV训练预测结果、以及各所述训练样本各自包括的LTV标注结果,确定LTV损失;基于所述LTV损失,调整所述LTV预测模型的模型参数。
[0008]本申请第三方面提供了一种数据预测装置,所述装置包括:数据获取模块,用于获取目标对象的参考特征数据;所述参考特征数据用于在生命周期价值LTV预测任务中提供参考信息;特征提取模块,用于通过LTV预测模型中的多通道网络包括的n个网络通道,基于所述参考特征数据进行深度特征提取处理,得到n个通道输出特征;所述n为大于1的整数,在所述LTV预测模型的训练过程中,所述n个网络通道分别用于学习对应于不同LTV区间的特征数据的深度特征表示;权重确定模块,用于通过所述LTV预测模型中的通道学习控制器,根据所述参考特征数据,确定所述n个通道输出特征各自对应的重要度权重;LTV预测模块,用于通过所述LTV预测模型中的预测结构,根据所述n个通道输出特征及其各自对应的所述重要度权重,确定所述目标对象对应的目标嵌入特征;根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果。
[0009]本申请第四方面提供了一种模型训练装置,所述装置包括:样本获取模块,用于获取训练样本集合;所述训练样本集合中包括多个训练样本,每个所述训练样本包括训练特征数据及其对应的LTV标注结果;训练特征提取模块,用于通过待训练的LTV预测模型中的多通道网络包括的n个网络通道,基于所述训练样本中的所述训练特征数据进行深度特征提取处理,得到n个训练通道输出特征;所述n为大于1的整数,所述n个网络通道分别用于学习对应于不同LTV区间的训练特征数据的深度特征表示;训练权重确定模块,用于通过所述LTV预测模型中的通道学习控制器,根据所述训练样本中所述训练特征数据,确定所述n个训练通道输出特征各自对应的训练重要度权重;训练LTV预测模块,用于通过所述LTV预测模型中的预测结构,根据所述n个训练通道输出特征及其各自对应的所述训练重要度权重,确定所述训练样本对应的训练嵌入特征;根据所述训练嵌入特征,确定所述训练样本对应的LTV训练预测结果;模型训练模块,用于根据所述训练样本集合中各所述训练样本各自对应的LTV训练预测结果、以及各所述训练样本各自包括的LTV标注结果,确定LTV损失;基于所述LTV损失,调整所述LTV预测模型的模型参数。
[0010]本申请第五方面提供了一种计算机设备,所述设备包括处理器和存储器:所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序,执行如上述第一方面所述的数据预测方法的步骤、或者上述第二方面所述的模型训练方法的步骤。
[0011]本申请第六方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的数据预测方法的步骤、或者上述第二方面所述的模型训练方法的步骤。
[0012]本申请第七方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的数据预测方法的步骤、或者上述第二方面所述的模型训练方法的步骤。
[0013]从以上技术方案可以看出,本申请实施例具有以下优点:本申请实施例提供了一种数据预测方法,该方法创新地提出了一种融合了分类机制和回归机制的LTV预测模型。在该方法中,先利用LTV预测模型中基于分类机制的多通道网络和通道学习控制器,根据目标对象的参考特征数据,确定n个通道输出特征和这n个通道输出特征各自对应的重要度权重;由于多通道网络中的n个网络通道在模型训练阶段分别用于学习对应于不同LTV区间的特征数据的深度特征表示,且目标对象的参考特征数据必然对应其中一个LTV区间,因此,多通道网络中存在至少一个网络通道可以从参考特征数据中准确地提取出对于预测LTV具有较高参考价值的深度特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据预测方法,其特征在于,所述方法包括:获取目标对象的参考特征数据;所述参考特征数据用于在生命周期价值LTV预测任务中提供参考信息;通过LTV预测模型中的多通道网络包括的n个网络通道,基于所述参考特征数据进行深度特征提取处理,得到n个通道输出特征;所述n为大于1的整数,在所述LTV预测模型的训练过程中,所述n个网络通道分别用于学习对应于不同LTV区间的特征数据的深度特征表示;通过所述LTV预测模型中的通道学习控制器,根据所述参考特征数据,确定所述n个通道输出特征各自对应的重要度权重;通过所述LTV预测模型中的预测结构,根据所述n个通道输出特征及其各自对应的所述重要度权重,确定所述目标对象对应的目标嵌入特征;根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果。2.根据权利要求1所述的方法,其特征在于,所述通过LTV预测模型中的多通道网络包括的n个网络通道,基于所述参考特征数据进行深度特征提取处理,得到n个通道输出特征,包括:通过所述多通道网络中的共享特征编码层,基于所述参考特征数据进行特征编码处理,得到参考输入特征;通过所述多通道网络中的每个所述网络通道,对所述参考输入特征进行深度特征提取处理,得到每个所述网络通道对应的通道输出特征。3.根据权利要求1所述的方法,其特征在于,所述通过所述LTV预测模型中的通道学习控制器,根据所述参考特征数据,确定所述n个通道输出特征各自对应的重要度权重,包括:通过所述通道学习控制器中的多层感知器结构,根据所述参考特征数据,确定分类特征向量;所述分类特征向量中包括n个维度的重要性数据,所述n个维度的重要性数据与所述n个通道输出特征一一对应;通过所述通道学习控制器中的规范化网络,对所述分类特征向量进行规范化处理,得到规范分类特征向量;所述规范分类特征向量中包括所述n个通道输出特征各自对应的重要度权重。4.根据权利要求1所述的方法,其特征在于,所述通过所述LTV预测模型中的预测结构,根据所述n个通道输出特征及其各自对应的所述重要度权重,确定所述目标对象对应的目标嵌入特征,包括:通过所述预测结构中的特征融合结构,根据所述n个通道输出特征各自对应的所述重要度权重,对所述n个通道输出特征进行加权求和处理,得到所述目标嵌入特征;所述根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果,包括:通过所述预测结构中的全连接层,根据所述目标嵌入特征,确定所述目标对象对应的LTV预测结果。5.根据权利要求1至4任一项所述的方法,其特征在于,所述LTV预测结果用于表征所述目标对象注册目标应用程序后预设时段内为所述目标应用程序带来的收益;所述获取目标对象的参考特征数据,包括:根据所述目标对象在所述目标应用程序上的登录信息,确定关联应用程序;所述关联应用程序为所述目标对象使用所述登录信息登录使用的其它应用程序;
获取所述目标对象在所述关联应用程序上的参考离散特征和参考连续特征,作为所述参考特征数据。6.一种模型训练方法,其特征在于,所述方法包括:获取训练样本集合;所述训练样本集合中包括多个训练样本,每个所述训练样本包括训练特征数据及其对应的LTV标注结果;通过待训练的LTV预测模型中的多通道网络包括的n个网络通道,基于所述训练样本中的所述训练特征数据进行深度特征提取处理,得到n个训练通道输出特征;所述n为大于1的整数,所述n个网络通道分别用于学习对应于不同LTV区间的训练特征数据的深度特征表示;通过所述LTV预测模型中的通道学习控制器,根据所述训练样本中所述训练特征数据,确定所述n个训练通道输出特征各自对应的训练重要度权重;通过所述LTV预测模型中的预测结构,根据所述n个训练通道输出特征及其各自对应的所述训练重要度权重,确定所述训练样本对应的训练嵌入特征;根据所述训练嵌入特征,确定所述训练样本对应的LTV训练预测结果;根据所述训练样本集合中各所述训练样本各自对应的LTV训练预测结果、以及各所述训练样本各自包括的LTV标注结果,确定LTV损失;基于所述LTV损失,调整所述LTV预测模型的模型参数。7.根据权利要求6所述的方法,其特征在于,所述训练样本集合中包括n个LTV区间各自对应的训练样本子集,所述LTV区间对应的训练样本子集中各个所述训练样本各自包括的LTV预测结果均属于所述LTV区间;所述n个LTV区间包括一个LTV等于0的区间、以及n

1个LTV不等于0的区间,所述n

1个LTV不等于0的区间各自对应的训练样本子集包括的训练样本数量之间的差值满足预设差值阈值。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:针对每个所述训练样本,根据所述训练样本包括的LTV标注结果,确定所述训练样本对应的分类标签;所述分类标签中包括所述n个LTV区间各自对应的分类标签数据,所述LTV标注结果所属的LTV区间对应的分类标签数据为1,其它分类标签数据为0;根据所述训练样本集合中各所述训练样本各自对应的预测权重分布、以及各所述训练样本各自对应的分类标签,确定分类损失;所述训练样本对应的预测权重分布为所述通道学习控制器根据所述训练样本中的所述训练特征数据确定的...

【专利技术属性】
技术研发人员:刘文双罗鑫骥尹存祥
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1