【技术实现步骤摘要】
本专利技术涉及一种基于隐式q学习的广告投放系统,尤其涉及一种基于分桶优先经验回放与辅助回报的隐式q学习的广告投放系统。
技术介绍
1、在广告行业中,构建一个高效的广告投放平台(dsp)至关重要。这个平台的主要目标是准确预测广告的互动效果,如点击率和转化率,以便为广告主提供精确的投放建议。广告主的收益与dsp的预测准确性密切相关。
2、然而,仅仅提高预测的精确度是不够的。尤其需要注意的是,广告投放平台(dsp)上的数据往往具有强烈的不可预测性。例如,如果dsp显示竞标价位数据过高,超过了广告主的预期收益,即使广告位成功获取并取得收益,最终也会导致dsp亏损。因此,面对纷繁复杂的dsp数据,制定一个既明智又有效的数据分析模块预测策略对于dsp平台的成功至关重要。
3、因此,只有对dsp历史数据进行合理化分析模块并做出相对准确和合理的预测并形成优良的数据分析模块策略,dsp才能实现最佳的广告效果。这种数据分析模块策略的制定对于保持平台的稳定运营和提升整体效益至关重要。
4、当前在dsp上针对竞价价格动态数据
...【技术保护点】
1.一种基于隐式Q学习的广告投放系统,该系统用于广告投放平台,其特征在于,所述系统包括初始化模块、更新模块、寄存模块、判断模块、训练模块、决策模块,
2.根据权利要求1所述的系统,其特征在于,所述期望回归损失函数构建公式如下:
3.根据权利要求1所述的系统,其特征在于,所述目标价值损失函数构建公式如下:
4.根据权利要求1所述的系统,其特征在于,所述奖励数据r分为三个奖励项,公式表达为:
5.根据权利要求4所述的系统,其特征在于,参数rvalue、rsmooth、rpotiented分别用如下公式计算:
6.
...【技术特征摘要】
1.一种基于隐式q学习的广告投放系统,该系统用于广告投放平台,其特征在于,所述系统包括初始化模块、更新模块、寄存模块、判断模块、训练模块、决策模块,
2.根据权利要求1所述的系统,其特征在于,所述期望回归损失函数构建公式如下:
3.根据权利要求1所述的系统,其特征在于,所述目标价值损失函数构建公式如下:
4....
【专利技术属性】
技术研发人员:彭梓恒,朱火庚,卢冠勇,林远平,蔡棱,陈琪钛,
申请(专利权)人:广州钛动科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。