用于DSP的出价方法及装置、存储介质、终端制造方法及图纸

技术编号：19825256 阅读：18 留言：0更新日期：2018-12-19 15:57

一种用于DSP的出价方法及装置、存储介质、终端，所述方法包括如下步骤：采用预设训练数据对出价模型进行训练，以得到回报列表，其中，所述预设训练数据为竞价获胜的历史数据；利用配置有所述回报列表的出价模型对竞价请求进行出价，并统计出价的实际回报；利用所述实际回报对所述回报列表进行实时更新，并将更新后的回报列表配置给所述出价模型，以对新的竞价请求进行出价。本发明专利技术技术方案可以实时准确的调整竞价操作，提高竞价获胜的概率。

全部详细技术资料下载

【技术实现步骤摘要】
用于DSP的出价方法及装置、存储介质、终端
本专利技术涉及互联网
，尤其涉及一种用于DSP的出价方法及装置、存储介质、终端。
技术介绍
在展示内容投放行业中，例如广告行业或者新闻推送行业，实时竞价(RealTimeBidding，RTB)是近年来逐渐流行的一种采买方式。与传统的合约广告不同，RTB允许广告主或者展示内容提供方对每一个展示机会进行竞价，从而以人群购买取代了广告位购买。需求方平台(DemandSidePlatform，DSP)作为广告主或者展示内容提供方的代理，需要对每个广告请求进行决策是否参与竞价，以及出价多少。进行实时出价的方式有多种，例如每千名受众成本(CostPerThousand，CPM)出价，受限点击成本出价，也称为每点击成本(CostPerClick，CPC)出价，定值出价，随机出价等。在现有技术中，通常利用历史竞价数据来指导竞价操作，但是竞价环境处在不断变化之中，历史竞价数据的指导往往具有滞后性，并不能实时准确的调整竞价操作。
技术实现思路
本专利技术解决的技术问题是如何实时准确的调整竞价操作。为解决上述技术问题，本专利技术实施例提供一种用于DSP的出价方法，包括如下步骤：采用预设训练数据对出价模型进行训练，以得到回报列表，其中，所述预设训练数据为竞价获胜的历史数据；利用配置有所述回报列表的出价模型对竞价请求进行出价，并统计出价的实际回报；利用所述实际回报对所述回报列表进行实时更新，并将更新后的回报列表配置给所述出价模型，以对新的竞价请求进行出价。可选的，采用预设训练数据对出价模型进行训练，以得到回报列表包括：确定第一参数和第...

【技术保护点】
1.一种用于DSP的出价方法，其特征在于，包括：采用预设训练数据对出价模型进行训练，以得到回报列表，其中，所述预设训练数据为竞价获胜的历史数据；利用配置有所述回报列表的出价模型对竞价请求进行出价，并统计出价的实际回报；利用所述实际回报对所述回报列表进行实时更新，并将更新后的回报列表配置给所述出价模型，以对新的竞价请求进行出价。

【技术特征摘要】
1.一种用于DSP的出价方法，其特征在于，包括：采用预设训练数据对出价模型进行训练，以得到回报列表，其中，所述预设训练数据为竞价获胜的历史数据；利用配置有所述回报列表的出价模型对竞价请求进行出价，并统计出价的实际回报；利用所述实际回报对所述回报列表进行实时更新，并将更新后的回报列表配置给所述出价模型，以对新的竞价请求进行出价。2.根据权利要求1所述的用于DSP的出价方法，其特征在于，采用预设训练数据对出价模型进行训练，以得到回报列表包括：确定第一参数和第二参数，其中所述回报列表由所述第一参数和第二参数定义，所述第一参数为状态参数，所述第二参数为动作参数；依次将每个第一参数和第二参数构成的参数组合配置到所述出价模型并进行出价，若所述出价大于或等于所述预设训练数据中的成交价，则记录所述出价以及出价之后的点击量，用以计算所述参数组合对应的回报，直至遍历完成多组所述参数组合，或者，所述出价的总和达到出价预算。3.根据权利要求2所述的用于DSP的出价方法，其特征在于，所述动作参数为价格调整系数，所述价格调整系数与预估出价基数的乘积即为所述出价，其中，所述预估出价基数在竞价请求发生之前预估得到。4.根据权利要求2所述的用于DSP的出价方法，其特征在于，所述动作参数为胜出率，每个胜出率均对应一个所述出价，其中，所述胜出率与所述出价的对应分布图在竞价请求发生之前预估得到。5.根据权利要求2-4任一项所述的用于DSP的出价方法，其特征在于，利用配置有所述回报列表的出价模型对竞价请求进行出价包括：确定所述竞价请求发生时的状态参数，所述状态参数包括时间节点，以及在所述时间节点做出的所述动作参数生效时间段内的出价预算；确定所述状态参数下回报的最大值所对应的动作参数，利用所述动作参数确定所述出价。6.根据权利要求1-4任一项所述的用于DSP的出价方法，其特征在于，所述出价模型为Q-learning算法模型，所述回报列表为Q表。7.一种用于DSP的出价装置，其特征在于，包括：训练模块，适于采用预设训练数据对出价模型进行训练，以得到回报列表，其中，所述预设训练数据为竞价获胜的历史数据；竞价模块，适于利用配置有所述回报...

【专利技术属性】
技术研发人员：汤奇峰，方炜超，
申请(专利权)人：上海晶赞融宣科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人