一种广告召回的数据处理方法及系统技术方案

技术编号:28150645 阅读:25 留言:0更新日期:2021-04-21 19:42
本申请属于计算机技术领域,具体涉及一种广告召回的数据处理方法及系统。该广告召回的数据处理方法包括:根据广告请求日志构建流量倒排索引,流量倒排索引用于表示广告定向与广告流量之间的映射关系;获取定向树,并根据定向树和流量倒排索引获取定向树的各个节点的覆盖流量;根据节点的覆盖流量将节点划分为流量交集小于或等于流量阈值的多个独立集合,并根据独立集合确定异常召回节点。基于该方法及系统能够实现对无法召回或召回量不足的广告进行诊断得到异常召回节点,有利于广告主、流量方或平台方对召回量不足的广告的异常节点进行归因分析,从而能够便于广告主在后续的广告投放中对定向树进行调整从而得到更为充足的召回量。的召回量。的召回量。

【技术实现步骤摘要】
一种广告召回的数据处理方法及系统


[0001]本申请涉及计算机
,具体涉及一种广告召回的数据处理方法及系统。

技术介绍

[0002]在日常运营中存在广告无法召回或召回量较小问题。相关技术中,可构造白板系统排查广告无法召回问题。白板系统是一个展示广告过程信息的日志系统,排查问题过程需要首先根据不同app选择不同的请求模版,填充所需的用户信息、设备号等参数;然后请求模拟模块根据填充的模版信息构造白板请求,广告系统收到白板请求,在响应中把广告选单各关键环节上报上来的详细日志信息返回给请求模拟模块;最后请求模拟模块把详细日志数据上报给日志解析入库模块,然后日志解析入库模块拿到详细日志进行解析,供前端进行日志查询。
[0003]然而,构造白板系统排查广告无法召回问题具有以下缺陷:白板系统只能诊断广告的召回量为零,也即无法召回的问题;对于广告召回量较小的情况白板系统会认为召回正常,无法诊断出来。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本申请的目的在于提供一种广告召回的数据处理方法及系统,至少在一定程度上克服相关技术中存在的技术问题:对于广告召回量较小的情况无法诊断。
[0006]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0007]根据本申请实施例的一个方面,提供一种广告召回的数据处理方法,包括根据广告请求日志构建流量倒排索引,所述流量倒排索引用于表示广告定向与广告流量之间的映射关系;获取定向树,并根据所述定向树和所述流量倒排索引获取所述定向树的各个节点的覆盖流量;根据所述节点的覆盖流量将所述节点划分为流量交集小于或等于流量阈值的多个独立集合,并根据所述独立集合确定异常召回节点。
[0008]根据本申请实施例的一个方面,提供一种广告召回的数据处理系统,其特征在于,用于执行本申请实施例提供的广告召回的数据处理方法,所述广告召回的数据处理系统包括:流量倒排索引模块,根据广告请求日志构建流量倒排索引,所述流量倒排索引用于表示广告定向与广告流量之间的映射关系;定向树入库模块,用于获取定向树以根据所述定向树和所述流量倒排索引获取所述定向树的各个节点的覆盖流量;故障诊断模块,分别与所述流量倒排索引模块和所述定向树入库模块连接,用于根据所述节点的覆盖流量将所述节点划分为流量交集小于或等于流量阈值的多个独立集
合,并根据所述独立集合确定异常召回节点。
[0009]在本申请的一些实施例中,基于以上技术方案,所述流量倒排索引模块包括:词项生成单元,用于根据所述广告请求日志生成词项字典和词项元信息,所述词项字典包括多列倒排偏移数据,所述词项元信息包括每列所述倒排偏移数据指向的倒排流量数据的倒排数据起始地址,所述倒排流量数据包括广告定向与广告流量之间的映射信息;词项字典寻址单元,根据每个所述节点在所述词项字典中的所属列的列元信息得到词项字典地址,所述词项字典地址为所述多列倒排偏移数据分别对应的存储地址;倒排偏移查询单元,用于根据所述词项字典地址查询所述词项字典以得到所述节点的倒排偏移;起始地址查询单元,用于根据每个所述节点的列元信息查询所述词项元信息以得到所述节点对应的倒排数据起始地址;倒排索引建立单元,用于根据所述倒排数据起始地址和所述倒排偏移建立所述流量倒排索引。
[0010]在本申请的一些实施例中,基于以上技术方案,所述故障诊断模块包括:排序单元,用于将所述节点按照覆盖流量从大到小的顺序排序;集合建立单元,用于将覆盖流量最大的所述节点单独建立为独立集合;交集流量计算单元,用于将不在集合中的覆盖流量最大的所述节点作为测试集合,获取所述测试集合与所有所述独立集合的交集的覆盖流量;第一判断单元,用于在所述测试集合与所有所述独立集合的交集的覆盖流量均小于或等于流量阈值的情况下,将所述测试集合单独建立为另一个独立集合,重复所述将不在集合中的覆盖流量最大的所述节点作为测试集合,获取所述测试集合与所有所述独立集合的交集的覆盖流量的步骤直至所有所述节点均处于所述独立集合中;第二判断单元,用于在所述测试集合与一个或多个所述独立集合的交集的覆盖流量大于所述流量阈值的情况下,将所述测试集合加入到与所述测试集合的交集覆盖流量最大的所述独立集合中,并重复所述将不在集合中的覆盖流量最大的所述节点作为测试集合,获取所述测试集合与所有所述独立集合的交集的覆盖流量的步骤直至所有所述节点均处于所述独立集合中;诊断单元,将覆盖流量最小的一个或多个所述独立集合中的一个或多个所述节点作为异常召回节点。
[0011]在本申请的一些实施例中,基于以上技术方案,所述排序单元包括:第一排序子单元,用于将覆盖流量小于或等于所述流量阈值的所述节点直接建立为独立集合;第二排序子单元,用于将覆盖流量大于所述流量阈值的所述节点按照覆盖流量从大到小的顺序排序。
[0012]在本申请的一些实施例中,基于以上技术方案,所述第二排序子单元包括:分类子单元,用于将将所述节点按照预设属性分类到对应的优先级中;分类排序子单元,用于先将所述节点按照优先级的高低进行排序,将优先级较高的所述节点排序在优先级较低的节点之前,再分别将同一优先级中的所述节点按照覆盖流
量大小排序,将同一优先级中覆盖流量较大的所述节点排序在覆盖流量较小的节点之前。
[0013]在本申请的一些实施例中,基于以上技术方案,所述第二判断单元包括:第一判断子单元,在所述测试集合与一个所述独立集合的交集的覆盖流量大于所述流量阈值的情况下,将所述测试集合加入到该独立集合中;第二判断子单元,在所述测试集合与多个所述独立集合的交集的覆盖流量大于所述流量阈值的情况下,将所述测试集合加入到具有最高优先级的节点的所述独立集合中,或者将所述测试集合加入到具有最高优先级的节点并且与所述测试集合的交集覆盖流量最大的所述独立集合中。
[0014]在本申请的一些实施例中,基于以上技术方案,所述诊断单元还包括:诊断子单元,将节点优先级最低的所述独立集合中的一个或多个节点作为异常召回节点,或者将节点优先级相同但覆盖流量最小的所述独立集合中的一个或多个节点作为异常召回节点。
[0015]在本申请的一些实施例中,基于以上技术方案,所述预设属性包括广告位属性、流量侧属性和广告定向属性;其中:所述广告位属性为与广告规格类型相关的属性,为第一优先级;所述流量规则属性为与广告流量提供方制定的规则相关的属性,为第二优先级;所述广告定向属性为与广告投放个性化定向相关的属性,为第三优先级。
[0016]在本申请的一些实施例中,基于以上技术方案,所述广告召回的数据处理系统还包括:操作建议模块,用于接收故障诊断模块输出的所述异常召回节点,并且输出所述异常召回节点在诊断结果数据库中映射的操作建议,其中,所述诊断结果数据库存储有所述异常召回节点与所述操作建议的映射关系。
[0017]根据本申请实施例的一个方面,提供一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种广告召回的数据处理方法,其特征在于,包括:根据广告请求日志构建流量倒排索引,所述流量倒排索引用于表示广告定向与广告流量之间的映射关系;获取定向树,并根据所述定向树和所述流量倒排索引获取所述定向树的各个节点的覆盖流量;根据所述节点的覆盖流量将所述节点划分为流量交集小于或等于流量阈值的多个独立集合,并根据所述独立集合确定异常召回节点。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述节点的覆盖流量将所述节点划分为流量交集小于或等于流量阈值的多个独立集合,并根据所述独立集合确定异常召回节点包括:将所述节点按照覆盖流量从大到小的顺序排序;将覆盖流量最大的所述节点单独建立为独立集合;将不在集合中的覆盖流量最大的所述节点作为测试集合,获取所述测试集合与所有所述独立集合的交集的覆盖流量;在所述测试集合与所有所述独立集合的交集的覆盖流量均小于或等于流量阈值的情况下,将所述测试集合单独建立为另一个独立集合,重复所述将不在集合中的覆盖流量最大的所述节点作为测试集合,获取所述测试集合与所有所述独立集合的交集的覆盖流量的步骤直至所有所述节点均处于所述独立集合中;在所述测试集合与一个或多个所述独立集合的交集的覆盖流量大于所述流量阈值的情况下,将所述测试集合加入到与所述测试集合的交集覆盖流量最大的所述独立集合中,并重复所述将不在集合中的覆盖流量最大的所述节点作为测试集合,获取所述测试集合与所有所述独立集合的交集的覆盖流量的步骤直至所有所述节点均处于所述独立集合中;将覆盖流量最小的一个或多个所述独立集合中的一个或多个所述节点作为异常召回节点。3.根据权利要求2所述的数据处理方法,其特征在于,所述将所述节点按照覆盖流量从大到小的顺序排序包括:将覆盖流量小于或等于所述流量阈值的所述节点直接建立为独立集合;将覆盖流量大于所述流量阈值的所述节点按照覆盖流量从大到小的顺序排序。4.根据权利要求3所述的数据处理方法,其特征在于,所述将覆盖流量大于所述流量阈值的所述节点按照覆盖流量从大到小的顺序排序包括:将所述节点按照预设属性分类到对应的优先级中;先将所述节点按照优先级的高低进行排序,将优先级较高的所述节点排序在优先级较低的节点之前,再分别将同一优先级中的所述节点按照覆盖流量大小排序,将同一优先级中覆盖流量较大的所述节点排序在覆盖流量较小的节点之前。5.根据权利要求4所述的数据处理方法,其特征在于,所述在所述测试集合与一个或多个所述独立集合的交集的覆盖流量大于所述流量阈值的情况下,将所述测试集合加入到与所述测试集合的交集覆盖流量最大的所述独立集合中包括:在所述测试集合与一个所述独立集合的交集的覆盖流量大于所述流量阈值...

【专利技术属性】
技术研发人员:邵云
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1