用于DSP的出价方法及装置、存储介质、终端制造方法及图纸

技术编号:19825256 阅读:18 留言:0更新日期:2018-12-19 15:57
一种用于DSP的出价方法及装置、存储介质、终端,所述方法包括如下步骤:采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;利用配置有所述回报列表的出价模型对竞价请求进行出价,并统计出价的实际回报;利用所述实际回报对所述回报列表进行实时更新,并将更新后的回报列表配置给所述出价模型,以对新的竞价请求进行出价。本发明专利技术技术方案可以实时准确的调整竞价操作,提高竞价获胜的概率。

【技术实现步骤摘要】
用于DSP的出价方法及装置、存储介质、终端
本专利技术涉及互联网
,尤其涉及一种用于DSP的出价方法及装置、存储介质、终端。
技术介绍
在展示内容投放行业中,例如广告行业或者新闻推送行业,实时竞价(RealTimeBidding,RTB)是近年来逐渐流行的一种采买方式。与传统的合约广告不同,RTB允许广告主或者展示内容提供方对每一个展示机会进行竞价,从而以人群购买取代了广告位购买。需求方平台(DemandSidePlatform,DSP)作为广告主或者展示内容提供方的代理,需要对每个广告请求进行决策是否参与竞价,以及出价多少。进行实时出价的方式有多种,例如每千名受众成本(CostPerThousand,CPM)出价,受限点击成本出价,也称为每点击成本(CostPerClick,CPC)出价,定值出价,随机出价等。在现有技术中,通常利用历史竞价数据来指导竞价操作,但是竞价环境处在不断变化之中,历史竞价数据的指导往往具有滞后性,并不能实时准确的调整竞价操作。
技术实现思路
本专利技术解决的技术问题是如何实时准确的调整竞价操作。为解决上述技术问题,本专利技术实施例提供一种用于DSP的出价方法,包括如下步骤:采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;利用配置有所述回报列表的出价模型对竞价请求进行出价,并统计出价的实际回报;利用所述实际回报对所述回报列表进行实时更新,并将更新后的回报列表配置给所述出价模型,以对新的竞价请求进行出价。可选的,采用预设训练数据对出价模型进行训练,以得到回报列表包括:确定第一参数和第二参数,其中所述回报列表由所述第一参数和第二参数定义,所述第一参数为状态参数,所述第二参数为动作参数;依次将每个第一参数和第二参数构成的参数组合配置到所述出价模型并进行出价,若所述出价大于或等于所述预设训练数据中的成交价,则记录所述出价以及出价之后的点击量,用以计算所述参数组合对应的回报,直至遍历完成多组所述参数组合,或者,所述出价的总和达到出价预算。可选的,所述动作参数为价格调整系数,所述价格调整系数与预估出价基数的乘积即为所述出价,其中,所述预估出价基数在竞价请求发生之前预估得到。可选的,所述动作参数为胜出率,每个胜出率均对应一个所述出价,其中,所述胜出率与所述出价的对应分布图在竞价请求发生之前预估得到。可选的,利用配置有所述回报列表的出价模型对竞价请求进行出价包括:确定所述竞价请求发生时的状态参数,所述状态参数包括时间节点,以及在所述时间节点做出的所述动作参数生效时间段内的出价预算;确定所述状态参数下回报的最大值所对应的动作参数,利用所述动作参数确定所述出价。可选的,所述出价模型为Q-learning算法模型,所述回报列表为Q表。为解决上述技术问题,本专利技术实施例还提供了一种用于DSP的出价装置,包括:训练模块,适于采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;竞价模块,适于利用配置有所述回报列表的出价模型对竞价请求进行出价,并统计出价的实际回报;反馈模块,适于利用所述实际回报对所述回报列表进行实时更新,并将更新后的回报列表配置给所述出价模型,以对新的竞价请求进行出价。可选的,所述训练模块包括:参数确定子模块,适于确定第一参数和第二参数,其中所述回报列表由所述第一参数和第二参数定义,所述第一参数为状态参数,所述第二参数为动作参数;训练执行子模块,适于依次将每个第一参数和第二参数构成的参数组合配置到所述出价模型并进行出价,若所述出价大于或等于所述预设训练数据中的成交价,则记录所述出价以及出价之后的点击量,用以计算所述参数组合对应的回报,直至遍历完成多组所述参数组合,或者,所述出价的总和达到出价预算。可选的,所述动作参数为价格调整系数,所述价格调整系数与预估出价基数的乘积即为所述出价,其中,所述预估出价基数在竞价请求发生之前预估得到。可选的,所述动作参数为胜出率,每个胜出率均对应一个所述出价,其中,所述胜出率与所述出价的对应分布图在竞价请求发生之前预估得到。可选的,所述竞价模块包括:实时参数确定子模块,适于确定所述竞价请求发生时的状态参数,所述状态参数包括时间节点,以及在所述时间节点做出的所述动作参数生效时间段内的出价预算;实时出价子模块,适于确定所述状态参数下回报的最大值所对应的动作参数,利用所述动作参数确定所述出价。可选的,所述出价模型为Q-learning算法模型,所述回报列表为Q表。为解决上述技术问题,本专利技术实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述的用于DSP的出价方法的步骤。为解决上述技术问题,本专利技术实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述的用于DSP的出价方法的步骤。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;利用配置有所述回报列表的出价模型对竞价请求进行出价,并统计出价的实际回报;利用所述实际回报对所述回报列表进行实时更新,并将更新后的回报列表配置给所述出价模型,以对新的竞价请求进行出价。由于回报列表是根据出价的实际回报实时更新的,因此可以实时准确的调整竞价操作,提高竞价获胜的概率。进一步,本专利技术实施例的动作参数可以为价格调整系数或胜出率,所述价格调整系数与预估出价基数的乘积即为所述出价,或者,每个胜出率均对应一个所述出价,其中,所述预估出价基数或胜出率与所述出价的对应分布图在竞价请求发生之前预估得到。由此,在执行竞价操作时,通过竞价模型直接输出价格调整系数或者胜出率,再通过价格调整系数与预估出价基数的乘积便可得到预估出价,或者,通过胜出率与预估出价的分布图得到预估出价,避免了复杂的计算转换过程,提高了出价效率。进一步,本专利技术实施例在训练出价模型时,依次将每个第一参数和第二参数构成的参数组合配置到所述出价模型并进行出价,若所述出价大于或等于所述预设训练数据中的成交价,则记录所述出价以及出价之后的点击量,用以计算所述参数组合对应的回报,直至遍历完成多组所述参数组合,或者,所述出价的总和达到出价预算。由此,可以实现在消耗完预算的情况下,优化每次点击的成本,并可以提高展示效果。附图说明图1是本专利技术实施例一种用于DSP的出价方法的流程图;图2是图1中步骤S11的一种具体实施方式的流程图;图3是本专利技术实施例一种用于DSP的出价装置的结构示意图。具体实施方式本领域技术人员理解,在现有技术中,通常利用历史竞价数据来指导竞价操作,但是竞价环境处在不断变化之中,历史竞价数据的指导往往具有滞后性,并不能实时准确的调整竞价操作。本专利技术技术方案通过采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;随后利用配置有所述回报列表的出价模型对竞价请求进行出价,并统计出价的实际回报;接下来,再利用所述实际回报对所述回报列表进行实时更新,并将更新后的回报列表配置给所述出价模型,以对新的竞价请求进行出价。由此,可以实时准确的调整竞价本文档来自技高网...

【技术保护点】
1.一种用于DSP的出价方法,其特征在于,包括:采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;利用配置有所述回报列表的出价模型对竞价请求进行出价,并统计出价的实际回报;利用所述实际回报对所述回报列表进行实时更新,并将更新后的回报列表配置给所述出价模型,以对新的竞价请求进行出价。

【技术特征摘要】
1.一种用于DSP的出价方法,其特征在于,包括:采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;利用配置有所述回报列表的出价模型对竞价请求进行出价,并统计出价的实际回报;利用所述实际回报对所述回报列表进行实时更新,并将更新后的回报列表配置给所述出价模型,以对新的竞价请求进行出价。2.根据权利要求1所述的用于DSP的出价方法,其特征在于,采用预设训练数据对出价模型进行训练,以得到回报列表包括:确定第一参数和第二参数,其中所述回报列表由所述第一参数和第二参数定义,所述第一参数为状态参数,所述第二参数为动作参数;依次将每个第一参数和第二参数构成的参数组合配置到所述出价模型并进行出价,若所述出价大于或等于所述预设训练数据中的成交价,则记录所述出价以及出价之后的点击量,用以计算所述参数组合对应的回报,直至遍历完成多组所述参数组合,或者,所述出价的总和达到出价预算。3.根据权利要求2所述的用于DSP的出价方法,其特征在于,所述动作参数为价格调整系数,所述价格调整系数与预估出价基数的乘积即为所述出价,其中,所述预估出价基数在竞价请求发生之前预估得到。4.根据权利要求2所述的用于DSP的出价方法,其特征在于,所述动作参数为胜出率,每个胜出率均对应一个所述出价,其中,所述胜出率与所述出价的对应分布图在竞价请求发生之前预估得到。5.根据权利要求2-4任一项所述的用于DSP的出价方法,其特征在于,利用配置有所述回报列表的出价模型对竞价请求进行出价包括:确定所述竞价请求发生时的状态参数,所述状态参数包括时间节点,以及在所述时间节点做出的所述动作参数生效时间段内的出价预算;确定所述状态参数下回报的最大值所对应的动作参数,利用所述动作参数确定所述出价。6.根据权利要求1-4任一项所述的用于DSP的出价方法,其特征在于,所述出价模型为Q-learning算法模型,所述回报列表为Q表。7.一种用于DSP的出价装置,其特征在于,包括:训练模块,适于采用预设训练数据对出价模型进行训练,以得到回报列表,其中,所述预设训练数据为竞价获胜的历史数据;竞价模块,适于利用配置有所述回报...

【专利技术属性】
技术研发人员:汤奇峰方炜超
申请(专利权)人:上海晶赞融宣科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1