用于广告业务中的无效流量信息处理的方法和装置制造方法及图纸

技术编号:26479928 阅读:31 留言:0更新日期:2020-11-25 19:24
本说明书的实施例提供了用于广告业务中的无效流量信息处理的方法、装置、计算设备和机器可读存储介质。该方法包括:确定参与过广告位访问的多个节点,多个节点包括第一类节点和第二类节点;确定多个节点是否为初始无效节点;基于多个节点是否为初始无效节点,分别确定多个节点的来源分数;基于多个节点的来源分数以及多个节点的联系分数,分别确定多个节点的评分,其中:对于第一类节点,每个节点的联系分数是基于该节点与第二类节点中的每个节点的关联度来得到的;对于第二类节点,每个节点的联系分数是基于该节点与第一类节点中的每个节点的关联度来得到的。

【技术实现步骤摘要】
用于广告业务中的无效流量信息处理的方法和装置
本说明书的实施例涉及信息
,具体地,涉及用于广告业务中的无效流量信息处理的方法、装置、计算设备和机器可读存储介质。
技术介绍
从在线广告业务发展的早期,无效流量就开始肆虐于广告平台。无效流量通常意味着用户针对广告的活动并非是真实的,比如点击网页或应用程序(APP)之类的行为可能是伪造和虚构。可见,无效流量不仅浪费广告主的广告成本,而且可能严重影响广告活动的有效性。因此,对于在线广告业务而言,如何识别无效流量是非常关键的。
技术实现思路
考虑到现有技术的上述问题,本说明书的实施例提供了用于广告业务中的无效流量信息处理的方法、装置、计算设备和机器可读存储介质。一方面,本说明书的实施例提供了一种用于广告业务中的无效流量信息处理的方法,包括:确定参与过广告位访问的多个节点,所述多个节点包括第一类节点和第二类节点,所述第一类节点分别代表不同的互联网协议IP地址,所述第二类节点分别代表不同的用户设备;确定所述多个节点是否为初始无效节点;基于所述多个节点是否为初始无效节点,分别确定所述多个节点的来源分数;基于所述多个节点的来源分数以及所述多个节点的联系分数,分别确定所述多个节点的评分,以便用于广告业务中的无效流量识别,其中,每个节点的评分表征该节点为无效流量节点的概率,其中:对于所述第一类节点,每个节点的联系分数是基于该节点与所述第二类节点中的每个节点的关联度来得到的;对于所述第二类节点,每个节点的联系分数是基于该节点与所述第一类节点中的每个节点的关联度来得到的。另一方面,本说明书的实施例提供了一种用于广告业务中的无效流量信息处理的装置,包括:节点确定单元,用于确定参与过广告位访问的多个节点,所述多个节点包括第一类节点和第二类节点,所述第一类节点分别代表不同的互联网协议IP地址,所述第二类节点分别代表不同的用户设备;识别单元,用于确定所述多个节点是否为初始无效节点;分数确定单元,用于基于所述多个节点是否为初始无效节点,分别确定所述多个节点的来源分数;评分确定单元,用于基于所述多个节点的来源分数以及所述多个节点的联系分数,分别确定所述多个节点的评分,以便用于广告业务中的无效流量识别,其中,每个节点的评分表征该节点为无效流量节点的概率,其中:对于所述第一类节点,每个节点的联系分数是基于该节点与所述第二类节点中的每个节点的关联度来得到的;对于所述第二类节点,每个节点的联系分数是基于该节点与所述第一类节点中的每个节点的关联度来得到的。另一方面,本说明书的实施例提供了一种计算设备,包括:至少一个处理器;与所述至少一个处理器进行通信的存储器,其上存储有可执行代码,所述可执行代码在被所述至少一个处理器执行时使得所述至少一个处理器实现上述方法。另一方面,本说明书的实施例提供了一种机器可读存储介质,其存储有可执行代码,所述可执行代码在被执行时使得机器执行上述方法。附图说明通过结合附图对本说明书的实施例的更详细的描述,本说明书的实施例的上述以及其它目的、特征和优势将变得更加明显,其中,在本说明书的实施例中,相同的附图标记通常代表相同的元素。图1是根据本文的实施例的用于广告业务中的无效流量信息处理的方法的示意性流程图。图2是根据本文的实施例的UV值的统计过程的一个示例。图3A是根据本文的实施例的不同类型的节点之间的关联模型的一个示例。图3B是关于第一类节点的联系分数的计算过程的一个示例。图3C是关于第二类节点的联系分数的计算过程的一个示例。图4是根据本文的实施例的用于广告业务中的无效流量信息处理的装置的示意框图。图5是根据一个实施例的用于广告业务中的无效流量信息处理的计算设备的硬件结构图。具体实施方式现在将参考各实施例讨论本文描述的主题。应当理解的是,讨论这些实施例仅是为了使得本领域技术人员能够更好地理解并且实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者例子的限制。可以在不脱离权利要求书的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个实施例可以根据需要,省略、替换或者添加各种过程或组件。如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其它实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其它的定义,无论是明确的还是隐含的,除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。无效流量中的很大一部分属于虚假流量,其意味着针对广告的点击、网页浏览等行为可能是伪造的或虚构的,这不仅可能浪费广告主的广告成本,而且可能严重影响广告活动的有效性。因此,无效流量识别已经成为在线广告行业亟需解决的问题之一。为了便于理解,下面将以涉及实时竞价的在线广告场景为例进行描述。在涉及实时竞价的在线广告场景中,通常通过竞拍“广告位”的方式来决定在该广告位上最终展示的广告。具体而言,媒体可以向需求方平台(Demand-SidePlatform,DSP)发送竞价请求,以便向DSP表明可以针对某个广告位进行竞拍。例如,广告位可以包括网页或移动端应用中的广告位等等。竞价请求可以携带与广告位有关的各种信息,比如访问该广告位的IP地址、用户设备标识等等。此外,DSP可以是各个广告主的代理平台,其具有各个广告主针对广告投放的需求等具体信息。DSP在接收到竞价请求之后,可以基于竞价请求以及广告主的需求,来决定是否参与竞价以及针对竞价所出的价格。这个过程可以是实时发起和执行的,一般能够在毫秒之内完成。在该过程中,为了确保广告活动的有效性,DSP通常还需要证实媒体的竞价请求是否真实有效,也就是进行无效流量识别,从而识别竞价是否是来自一些虚假、伪造甚至恶意的刷量活动。通常,无效流量识别主要是识别参与广告位访问的用户设备和互联网协议(InternetProtocol,IP)地址是否是无效的。目前一种典型的解决方案是建立黑名单,其通常是由广告业内的成员和/或广告协会基于行业内经验整理的并且在彼此之间共享。黑名单可以包括无效的IP地址或用户设备标识的列表。这样,DSP在接收到媒体的竞价请求时,可以将其中的IP地址或用户设备标识与黑名单进行比较。如果相应的IP地址或用户设备标识在该黑名单中,则认为该IP地址或用户设备标识是无效的,进而可以拒绝媒体的竞价请求。然而,目前的黑名单一般都是基于简单的业务规则方式来形成的,因此在无效流量识别时并不准确。此外,用户设备标识和IP地址易于被大量伪造且快速更换,导致此类无效流量识别方式缺乏时效性。对此,本文提出了一种用于广告业务中的无效流量信息处理的技术方案,以便实现高效的无线流量识别。首先,为了便于描述,引入了节点的概念。下文中将使用节点来指代IP地址或用户设备。也就是说,可以存在两种类型的节点,一类本文档来自技高网...

【技术保护点】
1.一种用于广告业务中的无效流量信息处理的方法,包括:/n确定参与过广告位访问的多个节点,所述多个节点包括第一类节点和第二类节点,所述第一类节点分别代表不同的互联网协议IP地址,所述第二类节点分别代表不同的用户设备;/n确定所述多个节点是否为初始无效节点;/n基于所述多个节点是否为初始无效节点,分别确定所述多个节点的来源分数;/n基于所述多个节点的来源分数以及所述多个节点的联系分数,分别确定所述多个节点的评分,以便用于广告业务中的无效流量识别,其中,每个节点的评分表征该节点为无效流量节点的概率,其中:/n对于所述第一类节点,每个节点的联系分数是基于该节点与所述第二类节点中的每个节点的关联度来得到的;/n对于所述第二类节点,每个节点的联系分数是基于该节点与所述第一类节点中的每个节点的关联度来得到的。/n

【技术特征摘要】
1.一种用于广告业务中的无效流量信息处理的方法,包括:
确定参与过广告位访问的多个节点,所述多个节点包括第一类节点和第二类节点,所述第一类节点分别代表不同的互联网协议IP地址,所述第二类节点分别代表不同的用户设备;
确定所述多个节点是否为初始无效节点;
基于所述多个节点是否为初始无效节点,分别确定所述多个节点的来源分数;
基于所述多个节点的来源分数以及所述多个节点的联系分数,分别确定所述多个节点的评分,以便用于广告业务中的无效流量识别,其中,每个节点的评分表征该节点为无效流量节点的概率,其中:
对于所述第一类节点,每个节点的联系分数是基于该节点与所述第二类节点中的每个节点的关联度来得到的;
对于所述第二类节点,每个节点的联系分数是基于该节点与所述第一类节点中的每个节点的关联度来得到的。


2.根据权利要求1所述的方法,其中,确定所述多个节点是否为初始无效节点,包括:
对于所述多个节点中任意的第k节点,k为正整数,
如果所述第k节点在预先定义的无效节点名单中,则确定所述第k节点为初始无效节点;
如果所述第k节点不在所述无效节点名单中,则基于所述第k节点在预定时段内参与广告位访问的独立访问数量,确定所述第k节点是否为初始无效节点。


3.根据权利要求2所述的方法,其中,基于所述第k节点在预定时段内参与广告位访问的独立访问数量,确定所述第k节点是否为初始无效节点,包括:
如果所述第k节点在所述预定时段内的独立访问数量超过预定阈值,则确定所述第k节点为初始无效节点;
如果所述第k节点在所述预定时段内的独立访问数量不超过所述预定阈值,则确定所述第k节点不是初始无效节点。


4.根据权利要求1至3中任一项所述的方法,其中,基于所述多个节点是否为初始无效节点,分别确定所述多个节点的来源分数,包括:
对于所述多个节点中的每个节点,
如果该节点为初始无效节点,则将该节点的来源分数确定为预定值;
如果该节点不是初始无效节点,则将该节点的来源分数设置为0。


5.根据权利要求1至3中任一项所述的方法,其中,
对于所述第一类节点,每个节点的联系分数被表示为所述第二类节点中的各节点的评分的加权求和;
对于所述第二类节点,每个节点的联系分数被表示所述第一类节点中的各节点的评分的加权求和。


6.根据权利要求5所述的方法,其中,所述第一类节点中任意的第i节点的联系分数Ri(a)是通过以下等式来表示的,其中,i为小于或等于M的正整数,M为所述第一类节点的数量:




j为小于或等于N的正整数
其中,Sj表示所述第二类节点中的第j节点的评分,wij表示所述第i节点与所述第j节点之间的关联权重,N为所述第二类节点的数量,j、M和N均为正整数。


7.根据权利要求5所述的方法,其中,所述第二类节点中任意的第j节点的联系分数Sj(a)是通过以下等式来表示的,j为小于或等于N的正整数,N为所述第二类节点的数量:




i为小于或等于M的正整数
其中,Ri表示所述第一类节点中的第i节点的评分,wij表示所述第i节点与所述第j节点之间的关联权重,M为所述第一类节点的数量。


8.根据权利要求1至3中任一项所述的方法,其中,基于所述多个节点的来源分数以及所述多个节点的联系分数,分别确定所述多个节点的评分,包括:
对于所述多个节点中的每个节点,基于预定权重将该节点的来源分数和该节点的联系分数进行加权求和,以得到该节点的评分。


9.根据权利要求1至3中任一项所述的方法,其中,确定参与过广告位访问的多个节点,包括:
基于在预定时段内的广告位访问日志数据来确定所述多个节点,其中,所述多个节点包括所述广告位访问日志数据中记录的节点;或者
基于所述广告位访问日志数据以及预先定义的无效节点名单来确定所述多个节点,其中,所述多个节点包括所述广告位访问日志数据中记录的节点以及来自所述无效节点名单的节点。


10.一种用于广告业务中的无效流量信息处理的装置,包括:
节点确定单元,用于确定参与过广告位访问的多个节点,所述多个节点包括第一...

【专利技术属性】
技术研发人员:苏同李响张炎雷扬帆朱拓
申请(专利权)人:华扬联众数字技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1