增益预测方法、装置和计算机设备制造方法及图纸

技术编号:34919865 阅读:17 留言:0更新日期:2022-09-15 07:11
本申请涉及一种增益预测方法、装置和计算机设备。所述方法包括从预设对象群组中确定实验组和对照组;获取实验组和对照组中每个对象的初始特征数据和转化结果标签,初始特征数据包括至少两个特征维度下的数据;计算每个特征维度所对应的净信息价值;确定实验组和对照组中每个对象的目标特征数据;根据转换规则,将实验组和对照组中每个对象的转化结果标签调整为增益标签;从实验组和对照组中分别选取第一对象数量的对象,作为训练对象群组,通过训练对象群组中每个对象的目标特征数据和增益标签,对增益预测模型进行训练,得到目标增益预测模型,目标增益预测模型用于预测对象在参与目标业务后的增益。采用本方法能够提高增益预测的准确性。预测的准确性。预测的准确性。

【技术实现步骤摘要】
增益预测方法、装置和计算机设备


[0001]本申请涉及计算机
,特别是涉及一种增益预测方法、装置和计算机设备。

技术介绍

[0002]随着计算机技术的发展,出现了机器学习技术,可基于机器学习技术构建增益预测模型,用于预测某种干预(例如是否参与目标业务)对应的增量,即有干预相对于无干预的转化的提升,以从全部对象群组中识别出由于有干预而转化的对象群组。增量为正值,表示有干预的情况下会产生正面效果,增量为负值,表示有干预的情况下会产生负面效果,并且增量的绝对值越大,表示有干预的情况下产生的效果越强。
[0003]现有的建立增益预测模型的主要方法是基于单模型的差分响应模型,通过在实验组和对照组的特征变量中,引入与干预相关的特征进行建模,使得实验组和对照组的训练样本集可使用同一个模型进行训练。但这种建立增益预测模型的方法仍然是基于响应模型,对增益的建模比较间接,因此对增益的预测能力比较有限。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高增益预测的准确性增益预测方法、装置和计算机设备。
[0005]第一方面,本申请提供了一种增益预测方法。所述方法包括:
[0006]从预设对象群组中确定实验组和对照组,实验组和对照组的对象数量相同、且初始特征数据分布一致,实验组中的对象参与了目标业务;
[0007]获取实验组和对照组中每个对象的初始特征数据和转化结果标签,初始特征数据包括至少两个特征维度下的数据;
[0008]根据实验组和对照组中每个对象的初始特征数据,计算每个特征维度所对应的净信息价值;
[0009]基于每个特征维度所对应的净信息价值,从至少两个特征维度中筛选出目标特征维度,并确定实验组和对照组中每个对象分别在目标特征维度下的目标特征数据;
[0010]根据转换规则,将实验组和对照组中每个对象的转化结果标签调整为增益标签,增益标签包括第一取值、第二取值和第三取值,第二取值和第一取值互为相反数,第一取值表示实验组中对象的转化结果标签为转化,第二取值表示对照组中对象的转化结果标签为转化,第三取值表示实验组和对照组中对象的转化结果标签均为未转化;
[0011]从实验组和对照组中分别选取第一对象数量的对象,作为训练对象群组,参与目标业务通过训练对象群组中每个对象的目标特征数据和增益标签,对待训练的增益预测模型进行训练,得到训练完成的目标增益预测模型,目标增益预测模型用于预测对象在参与目标业务后的增益。
[0012]第二方面,本申请还提供了一种增益预测装置。所述装置包括:
[0013]确定模块,用于从预设对象群组中确定实验组和对照组,实验组和对照组的对象
数量相同、且初始特征数据分布一致,实验组中的对象参与了目标业务;
[0014]获取模块,用于获取实验组和对照组中每个对象的初始特征数据和转化结果标签,初始特征数据包括至少两个特征维度下的数据;
[0015]计算模块,用于根据实验组和对照组中每个对象的初始特征数据,计算每个特征维度所对应的净信息价值;
[0016]筛选模块,用于基于每个特征维度所对应的净信息价值,从至少两个特征维度中筛选出目标特征维度,并确定实验组和对照组中每个对象分别在目标特征维度下的目标特征数据;
[0017]转换模块,用于根据转换规则,将实验组和对照组中每个对象的转化结果标签调整为增益标签,增益标签包括第一取值、第二取值和第三取值,第二取值和第一取值互为相反数,第一取值表示实验组中对象的转化结果标签为转化,第二取值表示对照组中对象的转化结果标签为转化,第三取值表示实验组和对照组中对象的转化结果标签均为未转化;
[0018]训练模块,用于从实验组和对照组中分别选取第一对象数量的对象,作为训练对象群组,参与目标业务通过训练对象群组中每个对象的目标特征数据和增益标签,对待训练的增益预测模型进行训练,得到训练完成的目标增益预测模型,目标增益预测模型用于预测对象在参与目标业务后的增益。
[0019]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述的增益预测方法中的步骤。
[0020]上述增益预测方法、装置和计算机设备,通过从预设对象群组中确定实验组和对照组,对获取到的实验组和对照组中每个对象的初始特征数据进行筛选,得到目标特征数据,并基于转换规则将获取到的实验组和对照组中每个对象的转化结果标签调整为增益标签,然后从实验组和对照组中分别选取第一对象数量的对象,作为训练对象群组,通过训练对象群组中每个对象的目标特征数据和增益标签训练增益预测模型,得到目标增益预测模型,以通过目标增益预测模型对具有与目标特征数据分布一致的特征数据的对象进行增益预测,根据增益预测值的大小将只有在有干预的情况下转化的对象和有无干预的情况下均转化的对象区分开,即对象的增益预测值越大,对象属于只有在有干预的情况下转化的对象的可能性越大,从而达到对增益直接建模的目的。因此,相比于现有的间接建立增益预测模型的方法,本申请的方案能够提高对增益预测的准确性。
附图说明
[0021]图1为一个实施例中增益预测方法的应用环境图;
[0022]图2为一个实施例中增益预测方法的流程示意图;
[0023]图3为一个实施例中计算净信息价值步骤的流程示意图;
[0024]图4为一个实施例中预测测试对象群组的实验组的增益步骤的流程示意图;
[0025]图5为一个实施例中增益预测装置的结构框图;
[0026]图6为一个实施例中计算机设备的内部结构图。
具体实施方式
[0027]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0028]本申请实施例提供的增益预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102可单独执行本申请实施例提供的增益预测方法,终端102和服务器104也可协同执行本申请实施例提供的增益预测方法。
[0029]当终端102单独执行增益预测方法时,终端102从预设对象群组中确定实验组和对照组,实验组和对照组的对象数量相同、且初始特征数据分布一致,实验组中的对象参与了目标业务;获取实验组和对照组中每个对象的初始特征数据和转化结果标签,初始特征数据包括至少两个特征维度下的数据;根据实验组和对照组中每个对象的初始特征数据,计算每个特征维度所对应的净信息价值;基于每个特征维度所对应的净信息价值,从至少两个特征维度中筛选出目标特征维度,并确定实验组和对照组中每个对象分别在目标特征维度下的目标特征数据;根据转换规则,将实验组和对照组中每个对象的转化结果本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种增益预测方法,其特征在于,所述方法包括:从预设对象群组中确定实验组和对照组,所述实验组和所述对照组的对象数量相同、且初始特征数据分布一致,所述实验组中的对象参与了目标业务;获取所述实验组和所述对照组中每个对象的初始特征数据和转化结果标签,所述初始特征数据包括至少两个特征维度下的数据;根据所述实验组和所述对照组中每个对象的初始特征数据,计算每个特征维度所对应的净信息价值;基于每个特征维度所对应的净信息价值,从所述至少两个特征维度中筛选出目标特征维度,并确定所述实验组和所述对照组中每个对象分别在所述目标特征维度下的目标特征数据;根据转换规则,将所述实验组和所述对照组中每个对象的转化结果标签调整为增益标签,所述增益标签包括第一取值、第二取值和第三取值,所述第二取值和所述第一取值互为相反数,第一取值表示实验组中对象的转化结果标签为转化,所述第二取值表示对照组中对象的转化结果标签为转化,第三取值表示实验组和对照组中对象的转化结果标签均为未转化;从所述实验组和所述对照组中分别选取第一对象数量的对象,作为训练对象群组,参与目标业务通过所述训练对象群组中每个对象的目标特征数据和增益标签,对待训练的增益预测模型进行训练,得到训练完成的目标增益预测模型,所述目标增益预测模型用于预测对象在参与目标业务后的增益。2.根据权利要求1所述的方法,其特征在于,所述根据所述实验组和所述对照组中每个对象的初始特征数据,计算每个特征维度所对应的净信息价值,包括:对于每个特征维度的任一特征区间,计算实验组和对照组分别在当前特征区间的证据权重,并计算两个证据权重间的差值;确定所述当前特征区间所覆盖到的对象的覆盖数量,并根据所述覆盖数量与所述预设对象群组的总数量间的比值、以及所述两个证据权重间的差值,确定与所述当前特征区间对应的净证据权重;确定与所述实验组对应的第一样本权重系数,与所述对照组对应的第二样本权重系数,并根据所述第一样本权重系数、所述第二样本权重系数、以及与所述当前特征区间对应的净证据权重,计算得到与所述当前特征区间对应净信息价值;对于每个特征维度,分别基于当前特征维度下的各个特征区间所对应的净信息价值,计算得到每个特征维度所对应的净信息价值。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述实验组和所述对照组中每个对象的转化结果标签,确定转化指标,所述转化指标包括转化提升率、转化数量提升量、第一资源提升量和第二资源提升量中的至少一种;基于所述转化指标,评估所述目标业务带来的真实增益;其中,所述转化提升率为实验组转化率和对照组转化率的差值,所述实验组转化率为实验组的转化对象数量与实验组的对象数量的比值,所述对照组转化率为对照组的转化对象数量与对照组的对象数量的比值;所述转化数量提升量为所述转化提升率和所述实验组的转化对象数量的乘积;
所述第一资源提升量为第一乘积与第二乘积的和,所述第一乘积为所述转化数量提升量与实验组的第一价值的乘积,所述第二乘积为第一差值和第二差值的乘积,其中,所述第一差值为所述实验组的转化对象数量与所述转化数量提升量的差值,所述第二差值为所述实验组的第一价值与对照组的第一价值的差值;所述第二资源提升量为第一乘积与第三乘积的和,所述第三乘积为所述第一差值、第一比值和第三差值的乘积,其中,所述第一比值为实验组的第一价值与对照组的第二价值的比值,所述第三差值为实验组的第二价值与对照组的第二价值的差值。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:从所述实验组和所述对照组中分别选取第二对象数量的对象,并确定测试对象群组;获取测试对象群组的实验组中每个对象的目标特征数据和转化结果标签;将所述测试对象群组的实验组中每个对象的目标特征数据输入至所述目标增益预测模型,得到所述测试对象群组的实验组中每个对象分别对应的增益预测值;基于测试对象群组的实验组中每个对象分别对应的增益预测值的大小,将所述测试对象群组的实验组划分为第一集合、第二集合和第三集合;所述第一集合中最小的增益预测值大于所述第二集合中最大的增益预测值,所述第二集合中最小的增益预测值大于所述第三集合中最大的增益预测值;基于目标转化指标和测试对象群组的实验组中每个对象的转化结果标签,计算与所述第一集合对应的第一实际增益结果、与所述第二集合对应的第二实际增益结果、以及与所述第三集合对应的第三实际增益结果中的至少一个实际增益结果;基于所述第一实际增益结果、所述第二实际增益结果和所述第三实际增益结果中的至少一个实际增益结果,对所述目标增益预测模型的预测准确性进行评估。5.根据权利要求4所述的方法,其特征在于,所述目标转化指...

【专利技术属性】
技术研发人员:曾梅花黄舒曼郑逸杰张舸王圣东
申请(专利权)人:厦门航空有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1