基于多维度数据探索的神经网络系统技术方案

技术编号：39971541 阅读：8 留言：0更新日期：2024-01-09 00:49

本发明专利技术提供一种基于多维度数据探索的神经网络系统，利用数据收集模块在数据收集阶段在多维度限定下收集出价、竞价成功率、收益率等数据，并由此形成历史数据输入至模型训练模块，在神经网络模型中实现概率密度的求解，并进而求得与各维度相关的出价胜率，在模型训练的基础上，用户就可以有的放矢基于各种维度准确迅速地判断出出价胜率，从而获得广告投入方面的较高收益。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于多维度数据探索的神经网络系统。

技术介绍

1、在广告领域中，常常需要建立需求方平台(demand-side platform，简称dsp)为广告主服务。dsp平台的主要任务是预测点击率或更深层次的转化事件。只有当dsp能够准确预测广告的点击率时，广告主才能获得回报。然而，仅仅提高点击率预测的准确性还不足够。如果dsp对广告位出价过高，并超过广告主提供的报酬，虽然dsp可能成功竞得广告位和吸引用户，但这将导致dsp亏本，即常说的投入产出比(roi)小于1。因此，制定一个良好的竞价策略对于dsp平台至关重要。

2、现有的竞价方式有以下几种：一、随机出价；二、线性出价；三、最大化每次点击出价(mcpc)。随机出价的方式就是统计过去n天的数据的最高成功竞得出价，随机用一个介于0和最高成功竞价之间的价格，进行出价。线性出价的方式则是统计过去n天的数据的最低成功竞得出价和最高成功竞得出价，对[最低出价，最高出价]，划分为若干区间(例如200个区间)，由此找到一个最优解出价，使得对于每个流量，通过线性最优出价/历史转化率*预估转化率进行出价，保证预算控制下，出价最低，转化最高。而最大化每次点击出价方式则是统计过去n天数据中每天的平均成功竞价价格，获得最大的平均成功竞价价格，并采用这个价格乘以预估转化率(pctr)。以上三种方式都是工业界中采用的竞价方式。其他可能的竞价方式往往都是在上述三种方式基础上进行小修小补。

3、然而，上述竞价方式都存在固有的缺陷。随机出价方式比较简单粗暴，该方式直接根据历史

4、线性出价方式则根据数据环境获取若干区间的局部最优解，然后除以历史转化率得到单位转化率的出价，并乘以当前数据的预估转化率。相比随机出价，线性出价方式较为稳定。然而，该方法过度依赖历史数据，当数据环境发生变化时，局部最优解可能会失效。此外，究竟要选择多少天的历史数据来确定局部最优解往往会比较迷茫，局部最优解对历史数据的依赖性较大。

5、mcpc出价方式统计过去n天的数据的最高成功竞得出价，然后乘以预估转化率得到价格进行出价。相比线性出价，mcpc对历史数据的依赖性较低。然而，由于mcpc竞价的目标是最大化每次点击的费用，广告主可能会设置较高的出价，以确保获得更多的点击量。这可能导致广告主在竞价过程中支付过高的费用，特别是当广告的转化率较低时，广告主可能会亏损。

技术实现思路

1、本专利技术提供一种基于多维度数据探索的神经网络系统，有效克服了现有技术中尤其是上述三种竞价方式存在的固有缺陷。

2、具体而言，本专利技术提供一种基于多维度数据探索的神经网络系统，所述神经网络系统包括数据收集模块和模型训练模块，所述数据收集模块用于广告数据的收集，在数据收集模块中，基于广告投放国家、广告类型、流量渠道、广告标识这四个维度限定的广告环境之下，在总时间t内每隔时段t在需求方平台上对广告位进行出价，其中t＝qt，由此q个时段一共形成q个出价：a1、a2…aq，这q个时段的竞价成功率记为：p1、p2…pq，将每个时段的竞价成功率除以该时段的出价，就能求出每个时段的收益率分别为p1/a1、p2/a2…pq/aq，这q个收益率中选出最大值pi/ai，其中1≤i≤q，由此，在数据收集模块中就形成了多组历史数据，每一组历史数据包括四个维度的数据、以及各维度下的出价、竞价成功率、收益率以及广告周边数据，所述多组历史数据作为模型输入数据输入至模型训练模块；所述模型输入数据分为连续型特征数据和离散型特征数据，在模型训练模块中，所述离散型特征数据进入稀疏特征输入层，接着再进入稠密嵌入层，由此将离散型数据向量化形成离散型数据嵌入向量；连续型特征数据直接进入稠密嵌入层，由此将连续型数据向量化形成连续型数据嵌入向量；离散型数据嵌入向量和连续型数据嵌入向量均进入硬参数共享隐藏层，让离散型数据嵌入向量和连续型数据嵌入向量相互学习，形成联合学习隐向量；所述联合学习向量进入特定任务隐藏层，根据实时竞价任务再进行训练学习，在学习期间，设定历史数据中历史最高出价为amax，历史最低出价为amin，由此将区间[amin，amax]平均分为n个子区间，通过sofmax函数输出当前流量在这n个子区间的出价的概率密度，每个子区间出价的概率密度公式为：

3、

4、p表示概率密度，p(z＝k|x)表示出价大于市场价格k时的概率密度，fz(gi)表示联合学习隐向量gi映射为出价z的概率密度分数的映射函数，fk(gi)表示将联合学习隐向量gi映射为出价z＝k的概率密度分数的映射函数；接着，以每个子区间的最高出价作为真实出价，累计当前出价及低于当前出价的所有出价的概率密度作为当前出价的胜率，其公式如下：

5、

6、其中x表示流量特征，b表示市场价格，z表示出价，w表示胜率，p表示概率密度，w(b|x)表示当出价为b时的胜率，p(z<b|x)表示当市场价格b大于出价z时的概率密度，表示出价z为0到b-1时的概率密度之和。

7、可选地，所述离散型特征数据包括广告投放国家、广告类型、流量渠道、广告标识。

8、可选地，所述连续型特征数据包括广告面积、广告长度、广告位宽度。

9、优选地，在数据收集模块中，设定时段t＝1小时，总时间t＝2周，每小时分配5％的流量进行竞价环境分布探索，设定历史打正的出价为a，那么对于平台所分配的5％的流量，采用[a*pcvr、0.9*a*pcvr、……、0.1*a*pcvr]共10个出价进行探索，其中，pcvr是转化率cvr的预估值，每个小时每个出价累计500个流量后结束当前时段的探索，从而获取当前竞价环境的分布。

10、可选地，区间[amin，amax]平均分为10个子区间。

11、本专利技术所提供的基于多维度数据探索的神经网络系统，利用数据收集模块在多维度限定下收集出价、竞价成功率、收益率等数据，并由此形成历史数据输入至模型训练模块，在神经网络模型中实现概率密度的求解，并进而求得与各维度相关的出价胜率，在模型训练的基础上，用户就可以有的放矢基于各种维度准确迅速地判断出出价胜率，从而获得广告投入方面的较高收益。

本文档来自技高网...

【技术保护点】

1.一种基于多维度数据探索的神经网络系统，其特征在于，所述神经网络系统包括数据收集模块和模型训练模块，

2.根据权利要求1所述的基于多维度数据探索的神经网络系统，其特征在于，所述离散型特征数据包括广告投放国家、广告类型、流量渠道、广告标识。

3.根据权利要求1所述的基于多维度数据探索的神经网络系统，其特征在于，所述连续型特征数据包括广告面积、广告长度、广告位宽度。

4.根据权利要求1所述的基于多维度数据探索的神经网络系统，其特征在于，在数据收集模块中，设定时段t＝1小时，总时间T＝2周，每小时分配5％的流量进行竞价环境分布探索，设定历史打正的出价为A，那么对于平台所分配的5％的流量，采用[A*PCVR、0.9*A*PCVR、……、0.1*A*PCVR]共10个出价进行探索，其中，PCVR是转化率CVR的预估值，每个小时每个出价累计500个流量后结束当前时段的探索，从而获取当前竞价环境的分布。

5.根据权利要求1所述的基于多维度数据探索的神经网络系统，其特征在于，区间[Amin，Amax]平均分为10个子区间。

【技术特征摘要】

1.一种基于多维度数据探索的神经网络系统，其特征在于，所述神经网络系统包括数据收集模块和模型训练模块，

2.根据权利要求1所述的基于多维度数据探索的神经网络系统，其特征在于，所述离散型特征数据包括广告投放国家、广告类型、流量渠道、广告标识。

3.根据权利要求1所述的基于多维度数据探索的神经网络系统，其特征在于，所述连续型特征数据包括广告面积、广告长度、广告位宽度。

4.根据权利要求1所述的基于多维度数据探索的神经网络系统，其特征在于，在数据收集模...

【专利技术属性】
技术研发人员：陈琪钛，沈鑫杰，
申请(专利权)人：广州钛动科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人