数据预测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38969384 阅读:25 留言:0更新日期:2023-09-28 09:32
本申请涉及一种数据预测方法、装置、计算机设备和存储介质。所述方法包括:基于目标交互应用的交互对象、以及交互对象在目标交互应用中所拥有的交互资源,得到交互对象的对象特征;将待上线的目标交互资源的资源特征以及对象特征,输入满足训练终止条件的交互资源新增预测模型,得到交互对象对于目标交互资源发生交互资源新增行为的预测数据;其中,交互资源新增预测模型,包括用于调整正负样本训练权重的损失函数;用于训练交互资源新增预测模型的正样本数量小于负样本数量;正样本用于表征存在交互资源新增行为的交互对象、负样本用于表征不存在交互资源新增行为的交互对象。采用本申请实施例的方法能够提高数据预测的准确性。申请实施例的方法能够提高数据预测的准确性。申请实施例的方法能够提高数据预测的准确性。

【技术实现步骤摘要】
数据预测方法、装置、计算机设备和存储介质


[0001]本申请涉及人工智能
,特别是涉及一种数据预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]互联网用户之间会不断的产生数据交互,例如,交互对象可以在各种交互应用中进行账户创建、管理、升级、购买等行为。为了提高交互应用收益,策划者通常会在活动节日之前设计交互资源产品内容并发布,以供交互对象购买。传统方式中是根据交互应用的策划者的业务经验和部分外网交互对象的反馈数据进行推测,来设计交互资源产品中包含的道具内容,依赖历史销量预测新的交互资源产品的销量。
[0003]然而,这种方式非常依赖于交互应用的策划者的业务经验和交互对象反馈数据的覆盖度,导致交互资源产品的设计和销量预测受到不确定因素的干扰,使得数据预测的准确性不高。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高数据预测的准确性的数据预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种数据预测方法。所述方法包括:
[0006]基于目标交互应用的交互对象、以及所述交互对象在所述目标交互应用中所拥有的交互资源,得到所述交互对象的对象特征;
[0007]将待上线的目标交互资源的资源特征以及所述对象特征,输入满足训练终止条件的交互资源新增预测模型,得到所述交互对象对于所述目标交互资源发生交互资源新增行为的预测数据;
[0008]其中,所述交互资源新增预测模型,包括用于调整正负样本训练权重的损失函数;用于训练所述交互资源新增预测模型的正样本数量小于负样本数量;所述正样本用于表征存在交互资源新增行为的交互对象、所述负样本用于表征不存在交互资源新增行为的交互对象。
[0009]第二方面,本申请还提供了一种数据预测装置。所述装置包括:
[0010]获取模块,用于基于目标交互应用的交互对象、以及所述交互对象在所述目标交互应用中所拥有的交互资源,得到所述交互对象的对象特征;
[0011]预测模块,用于将待上线的目标交互资源的资源特征以及所述对象特征,输入满足训练终止条件的交互资源新增预测模型,得到所述交互对象对于所述目标交互资源发生交互资源新增行为的预测数据;其中,所述交互资源新增预测模型,包括用于调整正负样本训练权重的损失函数;用于训练所述交互资源新增预测模型的正样本数量小于负样本数量;所述正样本用于表征存在交互资源新增行为的交互对象、所述负样本用于表征不存在交互资源新增行为的交互对象。
[0012]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
[0013]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
[0014]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
[0015]上述数据预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,通过基于目标交互应用的交互对象、以及交互对象在目标交互应用中所拥有的交互资源,得到交互对象的对象特征,可以提高获得的对象特征所对应的数据覆盖度。进而,通过将待上线的目标交互资源的资源特征以及对象特征,输入满足训练终止条件的交互资源新增预测模型,得到交互对象对于目标交互资源发生交互资源新增行为的预测数据;其中,交互资源新增预测模型,包括用于调整正负样本训练权重的损失函数;用于训练交互资源新增预测模型的正样本数量小于负样本数量;正样本用于表征存在交互资源新增行为的交互对象、负样本用于表征不存在交互资源新增行为的交互对象。通过设置上述的损失函数,能够平衡正负样本的不均衡情况,而且,可以使得训练时算法更关注于难分类样本,从而提高训练得到的交互资源新增预测模型的预测精度,提高数据预测的准确性。
附图说明
[0016]图1为一个实施例中数据预测方法的应用环境图;
[0017]图2为一个实施例中数据预测方法的流程示意图;
[0018]图3为一个实施例中数据预测方法的架构流程示意图;
[0019]图4为一个实施例中数据预测方法的系统流程示意图;
[0020]图5为一个实施例中交互资源新增预测模型的训练流程示意图;
[0021]图6为一个实施例中影响交互资源新增行为的对象特征的示意图;
[0022]图7为一个具体实施例中目标交互资源的示意图;
[0023]图8为一个具体实施例中交互对象数据的数据内容示意图;
[0024]图9为一个具体实施例中影响交互资源新增行为的目标对象特征的示意图;
[0025]图10为一个实施例中数据预测装置的结构框图;
[0026]图11为一个实施例中计算机设备的内部结构图;
[0027]图12为另一个实施例中计算机设备的内部结构图。
具体实施方式
[0028]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0029]需要首先说明的是,本申请所涉及的目标交互应用、交互对象、交互资源等相关信息和数据,均为经过各方充分授权的信息和数据,且相关信息与数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0030]一个实施例中,本申请提供的数据预测方法,可以应用于如图1所示的应用环境中。该应用环境可以同时涉及终端102和服务器104,在另外一些实施例中,还可以同时涉及终端106。终端102、终端106通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。
[0031]具体地,在终端102和终端106中内置有各交互应用,每个交互对象可以通过其持有的终端102和/或终端106在任意一个交互应用中实现与其他交互对象的数据交互。其中,若同一用户同时持有终端102和终端106、或持有更多终端,该用户在所持有的终端102和终端106中可以是登录相同的账号,也可以是登录不同的账号,以通过该账号与其他用户进行数据交互。
[0032]具体地,可以是在服务器104中训练得到交互资源新增预测模型,而后,服务器104确定目标交互应用,基于目标交互应用的交互对象、以及交互对象在目标交互应用中所拥有的交互资源,得到交互对象的对象特征;服务器104将待上线的目标交互资源的资源特征以及对象特征,输入满足训练终止条件的交互资源新增预测模型,得到交互对象对于目标交互资源发生交互资源新增行为的预测数据;其中,交互资源新增预测模型,包括用于调整正负样本训练权重的损失函数;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据预测方法,其特征在于,所述方法包括:基于目标交互应用的交互对象、以及所述交互对象在所述目标交互应用中所拥有的交互资源,得到所述交互对象的对象特征;将待上线的目标交互资源的资源特征以及所述对象特征,输入满足训练终止条件的交互资源新增预测模型,得到所述交互对象对于所述目标交互资源发生交互资源新增行为的预测数据;其中,所述交互资源新增预测模型,包括用于调整正负样本训练权重的损失函数;用于训练所述交互资源新增预测模型的正样本数量小于负样本数量;所述正样本用于表征存在交互资源新增行为的交互对象、所述负样本用于表征不存在交互资源新增行为的交互对象。2.根据权利要求1所述的方法,其特征在于,所述基于目标交互应用的交互对象、以及所述交互对象在所述目标交互应用中所拥有的交互资源,得到所述交互对象的对象特征,包括:确定待上线的所述目标交互资源在所述目标交互应用的上线时间;获取所述上线时间之前的预设时长内的交互对象数据,所述交互对象数据包括:交互对象在所述目标交互应用中所拥有的交互资源的资源信息、以及所述交互对象的对象信息;对所述交互对象数据进行特征提取,得到所述交互对象的对象特征。3.根据权利要求2所述的方法,其特征在于,所述交互对象数据为校验通过的数据;所述对象信息包括:交互对象基础信息、交互对象社群信息以及交互对象行为信息;所述交互对象数据的校验方式,包括:校验所述交互对象基础信息与所述交互对象在所述目标交互应用中所拥有的交互资源之间的关系,保留符合预设关系的交互对象基础信息;校验所述交互对象基础信息之间的关系,保留存在交集的交互对象基础信息;校验并保留表达符合表达筛选条件的交互对象数据;确定所述交互对象数据与待上线的所述目标交互资源之间的相关性,筛选出符合预设相关性的交互对象数据并保留。4.根据权利要求1所述的方法,其特征在于,所述正负样本训练权重,包括:正负样本在损失函数中的权重大小以及训练过程中难易分类样本的损失权重;所述正样本的权重大于所述负样本的权重,难分类样本的损失权重大于易分类样本的损失权重。5.根据权利要求1所述的方法,其特征在于,所述交互资源新增预测模型包括:分类预测子模型和回归预测子模型;所述将待上线的目标交互资源的资源特征以及所述对象特征,输入满足训练终止条件的交互资源新增预测模型,得到所述交互对象对于所述目标交互资源发生交互资源新增行为的预测数据,包括:根据待上线的所述目标交互资源的资源特征以及所述对象特征,通过所述分类预测子模型,预测出对于所述目标交互资源发生交互资源新增行为的新增交互对象;从所述对象特征中筛选确定所述新增交互对象的新增对象特征;基于所述新增对象特征以及所述资...

【专利技术属性】
技术研发人员:田红
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1