提数任务时长预测模型的训练方法及装置、介质、设备制造方法及图纸

技术编号:36189482 阅读:13 留言:0更新日期:2022-12-31 21:01
本说明书实施例提供了一种提数任务时长预测模型的训练方法及装置、介质、设备。方法包括:获取历史提数任务;根据每一条历史提数任务,生成对应的特征向量;其中,所述特征向量中的每一个元素对应一类提数参数,且每一个元素的值为在该条历史提数任务中该元素在各个广告投放活动中对应的该类提数参数的键值的和;获取每一条历史提数任务对应的实际耗费时长,并将每一条历史提数任务对应的特征向量和对应的实际耗费时长作为一条训练样本;根据多条训练样本进行模型训练,得到提数任务时长预测模型。通过本发明专利技术实施例提供的方法训练得到的提数任务时长预测模型可以准确且稳定的对提数任务的耗费时长进行预测。数任务的耗费时长进行预测。数任务的耗费时长进行预测。

【技术实现步骤摘要】
提数任务时长预测模型的训练方法及装置、介质、设备


[0001]本说明书一个或多个实施例涉及模型训练
,尤其是涉及一种提数任务时长预测模型的训练方法及装置、介质、设备。

技术介绍

[0002]在目前数据泛滥的时代,随着数据产生的渠道不断增多,数据逐渐增多,随之而来的便是针对数据进行数据分析,而数据分析需要进行数据提取。常规的方式是使用sql语言进行数据提取,但是针对于使用者而言,无法感知到该条数据提数任务需要耗费多长的时间才能完成。
[0003]现有的方案是根据经验来进行判断,这种方式具有随机性,准确度低。而且由于每家公司的数据和业务情况不同,需要根据各个公司的数据和业务情况来具体分析,因此不具有普适性。

技术实现思路

[0004]为了解决以上至少一个问题,本说明书实施例描述了一种提数任务时长预测模型的训练方法及装置、介质、设备。
[0005]根据第一方面,本专利技术实施例提供一种提数任务时长预测模型的训练方法,包括:
[0006]获取历史提数任务;其中,所述历史提数任务为在预设历史时间段内从广告投放数据中提取数据的任务,每一条历史提数任务中包括活动集合和至少两类提数参数的键值,所述活动集合中包括至少一个广告投放活动的标识;
[0007]根据每一条历史提数任务,生成对应的特征向量;其中,所述特征向量中的每一个元素对应一类提数参数,且每一个元素的值为在该条历史提数任务中该元素在各个广告投放活动中对应的该类提数参数的键值的和;
[0008]获取每一条历史提数任务对应的实际耗费时长,并将每一条历史提数任务对应的特征向量和对应的实际耗费时长作为一条训练样本;
[0009]根据多条训练样本进行模型训练,得到提数任务时长预测模型。
[0010]根据第二方面,本专利技术实施例提供了一种提数任务时长预测模型的训练装置,包括:
[0011]任务获取模块,用于获取历史提数任务;其中,所述历史提数任务为在预设历史时间段内从广告投放数据中提取数据的任务,每一条历史提数任务中包括活动集合和至少两类提数参数的键值,所述活动集合中包括至少一个广告投放活动的标识;
[0012]向量生成模块,用于根据每一条历史提数任务,生成对应的特征向量;其中,所述特征向量中的每一个元素对应一类提数参数,且每一个元素的值为在该条历史提数任务中该元素在各个广告投放活动中对应的该类提数参数的键值的和;
[0013]耗时获取模块,用于获取每一条历史提数任务对应的实际耗费时长,并将每一条历史提数任务对应的特征向量和对应的实际耗费时长作为一条训练样本;
[0014]模型训练模块,用于根据多条训练样本进行模型训练,得到提数任务时长预测模型。
[0015]根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面提供的方法。
[0016]根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面提供的所述的方法。
[0017]本说明书实施例提供的一种提数任务时长预测模型的训练方法及装置、介质、设备,组合或者各自具有以下技术效果:
[0018](1)本专利技术实施例中,首先获取历史提数任务,然后根据每一条历史提数任务生成对应的特征向量,再获取每一条历史提数任务对应的实际耗费时长,并将每一条历史提数任务对应的特征向量和对应的实际耗费时长作为一条训练样本;最后根据多条训练样本进行模型训练,得到提数任务时长预测模型。通过本专利技术实施例可以训练出提数任务时长预测模型,然后利用该模型进行耗费时长的预测。这种方式相对于现有技术中的经验判断来说,能够更加准确有效且稳定的评估出耗费时长。即便每家公司的数据和业务不同,也可以采用上述方法训练一个适合自己的提数任务时长预测模型。
[0019](2)本专利技术实施例中,构建初始的第一数据表,然后从每一条历史提数任务中提取出每一个广告投放活动中所述至少两类提数参数的键值,并将所述键值导入所述第一数据表中该条历史提数任务的该个广告投放活动对应的行与各类提数参数对应的各个列的交叉位置处,并将所述第一数据表中未导入数据的位置处置为0,以实现第一数据表的填充。然后,针对所述第一数据表中每一条历史提数任务的各个广告投放活动对应的各行数据,计算位于同一列的各个键值之和,以形成特征向量。本专利技术实施例通过这种方式构建特征向量,使得特征向量可以从多个维度反映历史提数任务的特性,实现对历史提数任务的准确表征。
[0020](3)本专利技术实施例中,在使用提数任务时长预测模型时,根据一段时间内的提数任务的预测耗费时长和实际耗费时长之间的差值确定预测误差,进而根据预测误差判断是否满足模型更新条件,在满足模型更新条件时进行模型更新,可见能够实现是否进行模型更新的智能分析。通过对模型进行更新,使得模型具有较高的准确率。
附图说明
[0021]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本说明书一个提数任务时长预测模型的训练方法的流程示意图;
[0023]图2是本说明书一个提数任务时长预测模型的训练装置的结构框图。
具体实施方式
[0024]下面结合附图,对本说明书提供的方案进行描述。
[0025]第一方面,本专利技术实施例提供一种提数任务时长预测模型的训练方法,该方法可
以由任一计算设备执行,参见图1,该方法包括如下步骤S110~S140:
[0026]S110、获取历史提数任务;其中,所述历史提数任务为在预设历史时间段内从广告投放数据中提取数据的任务,每一条历史提数任务中包括活动集合和至少两类提数参数的键值,所述活动集合中包括至少一个广告投放活动的标识;
[0027]可理解的是,提数任务是指进行数据提取的任务,提数任务时长预测模型的作用是对提数任务的耗费时长进行预测,该模型的训练过程依赖于历史提数任务,因此在S110中获取历史提数任务。
[0028]本专利技术实施例的应用场景为广告投放,历史提数任务是指在过去的预设历史时间段内从广告投放数据中提取数据的任务。在该场景下,每一条历史提数任务中包括一个活动集合和多类提数参数的键值。
[0029]其中,活动集合中包括至少一个广告投放活动的标识。例如,一条历史提数任务中的活动集合为{1,2,3},另一条历史提数任务中的活动集合为{1,2,3,4}。前一个活动集合中包括三个广告投放活动,后一个活动集合中包括四个广告投放活动。
[0030]可理解的是,在进行广告投放时,会执行至少一个广告投放活动。例如,针对某个经纬度对应的地理位置中的写字楼进行一个广告投放活动,该广告投放活动的标识为1;针对该本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提数任务时长预测模型的训练方法,其特征在于,包括:获取历史提数任务;其中,所述历史提数任务为在预设历史时间段内从广告投放数据中提取数据的任务,每一条历史提数任务中包括活动集合和至少两类提数参数的键值,所述活动集合中包括至少一个广告投放活动的标识;根据每一条历史提数任务,生成对应的特征向量;其中,所述特征向量中的每一个元素对应一类提数参数,且每一个元素的值为在该条历史提数任务中该元素在各个广告投放活动中对应的该类提数参数的键值的和;获取每一条历史提数任务对应的实际耗费时长,并将每一条历史提数任务对应的特征向量和对应的实际耗费时长作为一条训练样本;根据多条训练样本进行模型训练,得到提数任务时长预测模型。2.根据权利要求1所述的方法,其特征在于,所述根据每一条历史提数任务,生成对应的特征向量之前,所述方法还包括:从获取到的历史提数任务中剔除实际耗费时长超出预设时长的历史提数任务。3.根据权利要求1所述的方法,其特征在于,所述根据每一条历史提数任务,生成对应的特征向量,包括:构建初始的第一数据表;其中,所述第一数据表的第一行标识为各个历史提数任务的标识,所述第一数据表的第二行标识为N1个广告投放活动的标识,每一个第一行标识对应N1个第二行标识;所述第一数据表的列标识为每一个广告投放活动对应的N2类提数参数的标识,N1和N2为正整数,N1为所述活动集合中广告投放活动的预设最大次数,N2为提数参数的预设最多类别数量;从每一条历史提数任务中提取出每一个广告投放活动中所述至少两类提数参数的键值,并将所述键值导入所述第一数据表中该条历史提数任务的该个广告投放活动对应的行与各类提数参数对应的各个列的交叉位置处;在各条历史提数任务的键值均导入完成后,将所述第一数据表中未导入数据的位置处置为0;针对所述第一数据表中每一条历史提数任务的各个广告投放活动对应的各行数据,计算位于同一列的各个键值之和,不同列的键值之和形成该条历史提数任务对应的特征向量。4.根据权利要求1所述的方法,其特征在于,所述根据多条训练样本进行模型训练,得到提数任务时长预测模型,包括:基于梯度增强决策树算法,构建所述提数任务时长预测模型的框架;采用贝叶斯优化模型选取超参数;基于所选取的超参数,根据所述多条训练样本对所述框架进行模型训练,得到所述提数任务时长预测模型。5.根据权利要求1所述的方法,其特征在于,还包括:获取每一条历史提数任务对...

【专利技术属性】
技术研发人员:行康泽王可攀
申请(专利权)人:加和北京信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1