提数任务时长预测模型的训练方法及装置、介质、设备制造方法及图纸

技术编号：36189482 阅读：13 留言：0更新日期：2022-12-31 21:01

本说明书实施例提供了一种提数任务时长预测模型的训练方法及装置、介质、设备。方法包括：获取历史提数任务；根据每一条历史提数任务，生成对应的特征向量；其中，所述特征向量中的每一个元素对应一类提数参数，且每一个元素的值为在该条历史提数任务中该元素在各个广告投放活动中对应的该类提数参数的键值的和；获取每一条历史提数任务对应的实际耗费时长，并将每一条历史提数任务对应的特征向量和对应的实际耗费时长作为一条训练样本；根据多条训练样本进行模型训练，得到提数任务时长预测模型。通过本发明专利技术实施例提供的方法训练得到的提数任务时长预测模型可以准确且稳定的对提数任务的耗费时长进行预测。数任务的耗费时长进行预测。数任务的耗费时长进行预测。

全部详细技术资料下载

【技术实现步骤摘要】
提数任务时长预测模型的训练方法及装置、介质、设备

[0001]本说明书一个或多个实施例涉及模型训练
，尤其是涉及一种提数任务时长预测模型的训练方法及装置、介质、设备。

技术介绍

[0002]在目前数据泛滥的时代，随着数据产生的渠道不断增多，数据逐渐增多，随之而来的便是针对数据进行数据分析，而数据分析需要进行数据提取。常规的方式是使用sql语言进行数据提取，但是针对于使用者而言，无法感知到该条数据提数任务需要耗费多长的时间才能完成。
[0003]现有的方案是根据经验来进行判断，这种方式具有随机性，准确度低。而且由于每家公司的数据和业务情况不同，需要根据各个公司的数据和业务情况来具体分析，因此不具有普适性。

技术实现思路

[0004]为了解决以上至少一个问题，本说明书实施例描述了一种提数任务时长预测模型的训练方法及装置、介质、设备。
[0005]根据第一方面，本专利技术实施例提供一种提数任务时长预测模型的训练方法，包括：
[0006]获取历史提数任务；其中，所述历史提数任务为在预设历史时间段内从广告投放数据中提取数据的任务，每一条历史提数任务中包括活动集合和至少两类提数参数的键值，所述活动集合中包括至少一个广告投放活动的标识；
[0007]根据每一条历史提数任务，生成对应的特征向量；其中，所述特征向量中的每一个元素对应一类提数参数，且每一个元素的值为在该条历史提数任务中该元素在各个广告投放活动中对应的该类提数参数的键值的和；
[0008]获取每一条历史提数任务...

【技术保护点】

【技术特征摘要】
1.一种提数任务时长预测模型的训练方法，其特征在于，包括：获取历史提数任务；其中，所述历史提数任务为在预设历史时间段内从广告投放数据中提取数据的任务，每一条历史提数任务中包括活动集合和至少两类提数参数的键值，所述活动集合中包括至少一个广告投放活动的标识；根据每一条历史提数任务，生成对应的特征向量；其中，所述特征向量中的每一个元素对应一类提数参数，且每一个元素的值为在该条历史提数任务中该元素在各个广告投放活动中对应的该类提数参数的键值的和；获取每一条历史提数任务对应的实际耗费时长，并将每一条历史提数任务对应的特征向量和对应的实际耗费时长作为一条训练样本；根据多条训练样本进行模型训练，得到提数任务时长预测模型。2.根据权利要求1所述的方法，其特征在于，所述根据每一条历史提数任务，生成对应的特征向量之前，所述方法还包括：从获取到的历史提数任务中剔除实际耗费时长超出预设时长的历史提数任务。3.根据权利要求1所述的方法，其特征在于，所述根据每一条历史提数任务，生成对应的特征向量，包括：构建初始的第一数据表；其中，所述第一数据表的第一行标识为各个历史提数任务的标识，所述第一数据表的第二行标识为N1个广告投放活动的标识，每一个第一行标识对应N1个第二行标识；所述第一数据表的列标识为每一个广告投放活动对应的N2类提数参数的标识，N1和N2为正整数，N1为所述活动集合中广告投放活动的预设最大次数，N2为提数参数的预设最多类别数量；从每一条历史提数任务中提取出每一个广告投放活动中所述至少两类提数参数的键值，并将所述键值导入所述第一数据表中该条历史提数任务的该个广告投放活动对应的行与各类提数参数对应的各个列的交叉位置处；在各条历史提数任务的键值均导入完成后，将所述第一数据表中未导入数据的位置处置为0；针对所述第一数据表中每一条历史提数任务的各个广告投放活动对应的各行数据，计算位于同一列的各个键值之和，不同列的键值之和形成该条历史提数任务对应的特征向量。4.根据权利要求1所述的方法，其特征在于，所述根据多条训练样本进行模型训练，得到提数任务时长预测模型，包括：基于梯度增强决策树算法，构建所述提数任务时长预测模型的框架；采用贝叶斯优化模型选取超参数；基于所选取的超参数，根据所述多条训练样本对所述框架进行模型训练，得到所述提数任务时长预测模型。5.根据权利要求1所述的方法，其特征在于，还包括：获取每一条历史提数任务对...

【专利技术属性】
技术研发人员：行康泽，王可攀，
申请(专利权)人：加和北京信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人