温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本申请实施例提供一种训练策略模型的方法、确定广告投放策略的方法和装置,该训练策略模型的方法包括:获取与广告投放相关的样本信息和网络参数;根据第一时刻的状态、第二时刻的状态、第一时刻的广告投放策略、第一时刻的奖赏值和第一网络参数,计算评价网络...该专利属于创新奇智(西安)科技有限公司所有,仅供学习研究参考,未经过创新奇智(西安)科技有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本申请实施例提供一种训练策略模型的方法、确定广告投放策略的方法和装置,该训练策略模型的方法包括:获取与广告投放相关的样本信息和网络参数;根据第一时刻的状态、第二时刻的状态、第一时刻的广告投放策略、第一时刻的奖赏值和第一网络参数,计算评价网络...