一种互联网的数据处理方法和装置制造方法及图纸

技术编号:12166499 阅读:54 留言:0更新日期:2015-10-08 01:31
本发明专利技术公开了一种互联网的数据处理方法,包括:在离线阶段,通过重复迭代的方式获得需求(Demand)结点约束条件的对偶参数、以及供应(Supply)结点约束条件的对偶参数;根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。本发明专利技术还公开了一种互联网的数据处理装置。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种互联网的数据处理方法和装置
技术介绍
目前的互联网信息推送,主要是为实现互联网信息在一段时间内在某些定向条件 下的播放。该个过程可W用二部图来建模,如图1所示,左侧的供应(Supply)端表示各种 定向条件下的播放,不同Supply结点对应不同的权重Si,表示该定向条件i下的预估播放 量(或称播放次数),右侧的需求值emand)端表示信息推送需求(为描述方便,后续简称信 息推送任务或任务),包括预定义的互联网信息、定向条件和播放量等,不同Demand结点对 应不同的权重dj,表示任务j所需求的互联网信息播放次数。Si到dj的连接线表示Si对应 的定向条件符合任务j的dj.中的需求,每个连接线对应权重Xu,可W理解为在某一定向条 件的播放量Si到达时,展示任务j的互联网信息的概率为xy。Xu实质上对应了Supply端 播放量的库存在线分配方案,如何求解Xu是互联网信息推送的关键问题。 定向条件有很多维度,如地域、内容、性别、年龄、时间、场景等,而每个维度又包含 很多属性,如北京、上海属于地域维度下的两个不同的定向属性。该样,不同的定向属性组 合之后的定向条件就会有数十亿种。如果直接全部计算每一个Xu用于线上服务,那么需要 存储维护大量的信息(空间复杂度为图1中Supply端到Demand端的连接线的数量),在实 际的应用中是不可行的。 现有技术将xy的求解分为离线阶段和在线阶段该两个过程。离线阶段,根据预估 出的每个定向条件的库存信息W及任务信息得到如图1所示的二部图模型,根据模型计算 出每个任务对应的参数;在线阶段,当播放量到达时,得到所有符合该定向条件的任务,根 据离线阶段计算出的任务参数推导出每个任务的展示概率。具体的算法过程如下: 离线阶段:[000引 1)对所有的Demand结点按照d/sj进行降序排列得到分配顺序,其中,dj为任务j所需求的互联网信息播放次数,Sj.为所有满足dj.定向条件的Si的预估播放量总和; 。对所有的Supp1y结点,初始化S=i-,即初始化馬为预估播放量; 如按照Demand结点的分配顺序,计算Pj.使得如果P^不 存在,则设置PJ=-;其中,PJ表示Si分配给任务j的播放次数占Si播放总数的比例,每 个Demand结点相对应的Supply结点都使用该比例,Bj表示所有满足Demand结点j定向条 件的Supply结点; 并对所有满足Demand结点定向条件的Supply结点iGBj,更新其焉为 在线阶段:1)当Supply结点i的播放量到达时,得到所有符合该定向条件的任务,并按所述 分配顺序排序; 2)对每个任务j,计算分配顺序排在j之前的任务所对应的概率和P,如果P> 1-PJ,则任务j被展示的概率为1-P,否则任务j被展示的概率为PJ。 上述算法实质上是启发式的贪也算法,通过对任务分配顺序的调节,使得比较难 满足的任务优先分配,按照分配顺序生成每个任务的库存分配方案。当播放到达时,根据分 配方案得到对应任务的展示概率Xu。 然而,现有算法无法保证得到一个相对的最优解,计算Xu的误差越大,会导致互 联网信息推送的效率和准确率越低,无法满足互联网信息的播放需求。因此,如何使计算的 Xy达到相对的最优解,从而保证互联网信息推送的效率和准确率,尽量满足互联网信息的 播放需求,是目前亟待解决的技术问题。
技术实现思路
为解决现有存在的技术问题,本专利技术提供一种互联网的数据处理方法和装置。 本专利技术提供一种互联网的数据处理方法,所述方法包括: 在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、W 及供应Supply结点约束条件的对偶参数;[001引根据所述Demand结点约束条件的对偶参数、W及Supply结点约束条件的对偶参 数,获得每个任务在相应定向条件下的播放概率; 将每个任务中的互联网信息、W及每个任务在相应定向条件下的播放概率,分发 给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得 的所述播放概率播放相应任务中的互联网信息。 上述方案中,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、W 及Supply结点约束条件的对偶参数,包括: 根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的 对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对 偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数 预定次数,输出迭代后的Demand结点约束条件的对偶参数、W及Supply结点约束条件的对 偶参数。 上述方案中,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、W 及Supply结点约束条件的对偶参数,包括: a、对于所有任务j,初始化aJ= 0,aj.表示Demand结点约束条件的对偶参数; b、对于所有定向条件i,计算目i使捐如果无解或者目1<〇,则 设置目i= 0 ;其中,目i表示Supply结点约束条件的对偶参数,r(i)表示所有能够被的定 向条件i满足的Demand结点,0u表示互联网信息的 均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;[002引 c、对于所有任务j,计算aj.使得如果aj>Pj或者无解,则 设置aJ=pj.;其中,Si表示定向条件i下的预估播放量,dj.表示任务j的需求播放量,pj表示补偿代价; 将所述步骤b和C迭代预定次数,得到迭代后输出的Demand结点约束条件的对偶 参数aj.、W及Supply结点约束条件的对偶参数目1。 上述方案中,所述根据Demand结点约束条件的对偶参数、W及Supply结点约束条 件的对偶参数,获得每个任务在相应定向条件下的播放概率,包括:[002引离线阶段,对于所有定向条件i,初始化i严Si表示定向条件i的预估播放量; 对于所有的定向条件i,计算目i使得如果无解或者目i< 0,则 设置目i= 0 ; 对应每个任务j,按照分配顺序执行: 计算弓J使焉如果无解则设置^J=-;对于满足任 务j的所有定向条件i,更新马-min枉馬每-A)}用于下一任务的弓J计算,输出所 有任务的aj.、弓j.;其中,弓j.表示用于计算任务j在相应定向条件下播放概率的第一参数,r(j)表示所有满足任务j的Supply结点;[003引在线阶段,在每个Si到达时,根据Qj.计算出目1,并由弓j.和目i计算得出每个任 务在相应定向条件下的播放概率。 上述方案中,所述分配顺序为: 对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联 网信息播放次数,Sj.表示所有满足dj.定向条件的Si的预估播放量总和。 上述方案中,所述根据aJ计算出目1,并由弓j.和目i计算得出每个任务在相应定 向条件下的播放概率,包括: 输入定向条件i和所有满足定向条件i的任务; 设置馬=1,计算目i使得如果无解或者目i< 0,则设置目i= 0 ; 对于每个满足定向条件i的任务,按照分配顺序计算巧 新馬用于下一个任务的Xy计算;其中,Xu表示任务j在定本文档来自技高网
...

【技术保护点】
一种互联网的数据处理方法,其特征在于,所述方法包括:在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、以及供应Supply结点约束条件的对偶参数;根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:程佳陈戈邹方圆李文杰
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1