一种基于轨迹数据增强程序化广告出价智能优化系统技术方案

技术编号:46585984 阅读:1 留言:0更新日期:2025-10-10 21:22
本发明专利技术涉及数据处理领域,本发明专利技术涉及一种基于轨迹数据增强程序化广告出价智能优化系统。包括模拟竞价模块,用于对原始广告竞价数据进行数据增强,从而获取增强后的广告竞价数据;轨迹数据生成模块,用于将增强后的广告竞价数据整理为可供IQL模型学习的轨迹数据;IQLTrainer模块,用于生成IQL模型的训练参数,结合所述轨迹数据构造IQL模型实例并对IQL模型进行训练,在训练结束后保存最优的模型参数;IQL模型用于依据单次实时竞价的当前状态获取出价策略;训练参数包括预算比例、广告主ID、出价模型名称以及运行参数索引。采用本发明专利技术的系统可以提高出价算法的收敛效率,并降低训练轨迹噪声。

【技术实现步骤摘要】

本专利技术涉及数据处理领域。更具体地,本专利技术涉及一种基于轨迹数据增强程序化广告出价智能优化系统


技术介绍

1、在程序化广告行业中,需求方平台(demand-side platform, dsp)作为广告主投放广告的核心工具,通过实时竞价(rtb)技术将广告精准展示给目标用户,并根据广告效果(如点击率或转化率)从广告主处收取佣金。随着广告市场竞争的加剧,广告主对预算分配精细化的需求日益增加,而dsp平台需通过优化出价算法来在预算约束下最大化广告效果,从而提升收入结构和资源分配效率。

2、程序化广告通过实时竞价(rtb)技术实现广告投放的自动化与精准化,其核心在于在极短的时间窗口内(通常为毫秒级)根据广告请求的实时状态生成最优出价,从而在有限的预算约束下最大化广告主的收益,例如提升点击数、转化率或其他关键绩效指标。在rtb场景中,出价算法需要综合考虑多种因素,包括但不限于预测点击率(pctr)、市场价格波动、用户行为特征以及广告主设定的目标和预算限制。当前,学术界和工业界已经提出了多种出价算法,以应对这一复杂且动态的优化问题,以下是对主要技术本文档来自技高网...

【技术保护点】

1.一种基于轨迹数据增强程序化广告出价智能优化系统,其特征在于,包括:

2.如权利要求1所述的基于轨迹数据增强程序化广告出价智能优化系统,其特征在于,所述轨迹数据生成模块以增强后的广告竞价数据为输入,按照时间步划分构建出由多个数据单元组成的强化学习轨迹,数据单元的格式为(St,At,Rt,St+1,done),其中St表示当前时间步t的状态,At表示当前时间步t的动作,Rt表示当前时间步t的奖励,St+1表示下一时间步t+1的状态,done表示终止标志;状态是一个固定长度的特征向量,全面描述当前时间步的环境、资源约束与历史行为趋势;动作代表当前时间步竞价代理的整体出价倾向;奖...

【技术特征摘要】

1.一种基于轨迹数据增强程序化广告出价智能优化系统,其特征在于,包括:

2.如权利要求1所述的基于轨迹数据增强程序化广告出价智能优化系统,其特征在于,所述轨迹数据生成模块以增强后的广告竞价数据为输入,按照时间步划分构建出由多个数据单元组成的强化学习轨迹,数据单元的格式为(st,at,rt,st+1,done),其中st表示当前时间步t的状态,at表示当前时间步t的动作,rt表示当前时间步t的奖励,st+1表示下一时间步t+1的状态,done表示终止标志;状态是一个固定长度的特征向量,全面描述当前时间步的环境、资源约束与历史行为趋势;动作代表当前时间步竞价代理的整体出价倾向;奖励定义为竞价代理竞得的展示机会的总点击;若当前时间步的当前轨迹达到终止状态,则终止标志的值为0,否则,终止标志的值为1。

3.如权利要求1所述的基于轨迹数据增强程序化广告出价智能优化系统,其特征在于,所述iqltrainer模块包括第一init初始化模块、run训练模块以及evaluate模块,其中,第一init初始化模块用于提供所述训练参数,还用于对数据存储路径、模型参数存储路径、预算信息存储路径等重要信息进行定义;run训练模块用于根据预设的目录地址以及所述训练参数构造iql模型实例并组织训练,在完成训练后,调用evaluate模块评估模型效果;evaluate模块用于模拟当前的iql模型在真实广告竞价场景下的实际表现。

4.如权利要求1所述的基于轨迹数据增强程序化广告出价智能优化系统,其特征在于,还包括testloader模块,testloader模块用于加载和组织广告竞价实验数据的数据管理类,支持训练与测试数据的分离管理,并在模...

【专利技术属性】
技术研发人员:张江枫朱火庚曹晓晓蔡棱贺小博林泽枫
申请(专利权)人:广州钛动科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1