一种广告流量反作弊方法、系统、电子设备和存储介质技术方案

技术编号:38436111 阅读:18 留言:0更新日期:2023-08-11 14:21
本申请提供一种广告流量反作弊方法、系统、电子设备和计算机存储介质,所述方法包括:接收输入的每个广告流量请求;获取所述每个广告流量请求的特征数据,对所述每个广告流量请求的特征数据进行预处理,并将预处理后的特征数据输入至所述预先训练完成的深度学习模型进行预测,得到所述每个广告流量请求的作弊得分;基于模型策略和所述每个广告流量请求的作弊得分,确定所述每个广告流量请求的第一识别结果;其中,所述模型策略包含所述深度学习模型对应的过滤策略,所述第一识别结果用于表征所述每个广告流量请求是否为作弊流量请求。所述每个广告流量请求是否为作弊流量请求。所述每个广告流量请求是否为作弊流量请求。

【技术实现步骤摘要】
一种广告流量反作弊方法、系统、电子设备和存储介质


[0001]本申请涉及网络信息
,尤其涉及一种广告流量反作弊方法、系统、电子设备和计算机存储介质。

技术介绍

[0002]广告流量反作弊在方法论上不断完善,形成了事前预警、事中打击、事后对抗的完整体系。在事中打击、事后对抗中,均需要广告的展现和点击行为已经发生,收集所有信息传送到反作弊系统中进行判断,判断为作弊的广告流量则进行标注、拦截、索赔、返款等操作。事前预警指对于历史表现不好的流量来源进行限制和提前封禁准备,出现作弊率高则限制该来源的流量继续生效。
[0003]相关技术中,事前预警是直接对历史表现不好的流量来源进行限制,使得来自该来源的一些正常广告流量也无法生效,存在作弊流量误判的可能性;此外,现有的反作弊系统是在广告流量生效时和生效后,根据流量对应的设备、用户、渠道、历史记录等基础信息、行为信息以及对应统计值,按照各种策略和人工智能(Artificial Intelligence,AI)模型进行作弊判断。然而,对于作弊流量,反作弊生效时广告投放已经发生,目标设备端已展示广告甚至已经发生点击行为,流量来源渠道已可以感知展示和点击的发生;即,不能够在广告请求到达时对广告作弊流量进行及时预判和封禁等问题,为此提出一种广告流量反作弊方法。

技术实现思路

[0004]本申请实施例提供一种广告流量反作弊方法、系统、电子设备和计算机存储介质。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供了一种广告流量反作弊方法,应用于广告流量反作弊系统,所述方法包括:
[0007]接收输入的每个广告流量请求;
[0008]获取所述每个广告流量请求的特征数据,对所述每个广告流量请求的特征数据进行预处理,并将预处理后的特征数据输入至所述预先训练完成的深度学习模型进行预测,得到所述每个广告流量请求的作弊得分;
[0009]基于模型策略和所述每个广告流量请求的作弊得分,确定所述每个广告流量请求的第一识别结果;其中,所述模型策略包含所述深度学习模型对应的过滤策略,所述第一识别结果用于表征所述每个广告流量请求是否为作弊流量请求。
[0010]本申请实施例提供一种广告流量反作弊系统,所述系统包括实时反作弊模块和实时统计模块,其中:
[0011]所述实时统计模块,用于接收输入的每个广告流量请求;
[0012]所述实时反作弊模块,用于获取所述每个广告流量请求的特征数据,对所述每个广告流量请求的特征数据进行预处理,并将预处理后的特征数据输入至所述预先训练完成
的深度学习模型进行预测,得到所述每个广告流量请求的作弊得分;基于模型策略和所述每个广告流量请求的作弊得分,确定所述每个广告流量请求的第一识别结果;其中,所述模型策略包含所述深度学习模型对应的过滤策略,所述第一识别结果用于表征所述每个广告流量请求是否为作弊流量请求。
[0013]本申请实施例提供一种电子设备,所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述一个或多个技术方案提供的广告流量反作弊方法。
[0014]本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被执行后能够实现前述一个或多个技术方案提供的广告流量反作弊方法。
[0015]本申请实施例提供一种广告流量反作弊方法、系统、电子设备和计算机存储介质,所述方法包括:接收输入的每个广告流量请求;获取所述每个广告流量请求的特征数据,对所述每个广告流量请求的特征数据进行预处理,并将预处理后的特征数据输入至所述预先训练完成的深度学习模型进行预测,得到所述每个广告流量请求的作弊得分;基于模型策略和所述每个广告流量请求的作弊得分,确定所述每个广告流量请求的第一识别结果;其中,所述模型策略包含所述深度学习模型对应的过滤策略,所述第一识别结果用于表征所述每个广告流量请求是否为作弊流量请求。
[0016]可以看出,本申请实施例中,对于广告流量反作弊系统接收到的每个广告流量请求,均可以利用深度学习模型对应的模型策略给出广告流量请求是否为作弊流量请求的识别结果;这样,当广告流量反作弊系统将各个广告流量请求的识别结果返回至后续的广告系统时,广告系统便可根据该识别结果,确定是否对广告流量请求进行拦截,若进行拦截,则不进行后续的业务相关操作,例如广告投放等;如此,可以大幅减少作弊流量请求对后续广告系统的影响以及业务相关操作,节省一定的资源消耗。
附图说明
[0017]图1A为本申请实施例的一种广告流量反作弊方法的流程示意图;
[0018]图1B为本申请实施例的一种广告流量反作弊系统与广告系统交互的结构示意图;
[0019]图2为本申请实施例的一种对离散稀疏特征进行处理的流程示意图;
[0020]图3为本申请实施例的一种对单个嵌入层输入输出进行说明的示意图;
[0021]图4A为本申请实施例的一种广告流量反作弊系统的结构示意图;
[0022]图4B为本申请实施例的另一种广告流量反作弊系统的结构示意图。
[0023]图5为本申请实施例的电子设备的结构示意图。
具体实施方式
[0024]下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述。
[0025]以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本申请,并不用于限定本申请。另外,以下所提供的实施例是用于实施本申请的部分实施例,而非提供实施本申请的全部实施例,在不冲突的情况下,本申请记载的技术方案可以任意组合的方式实施。
[0026]需要说明的是,在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者系统不仅包括所明确记载的要素,而且还包括没有明确列出的其他要素,或者是还包括为实施方法或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的方法或者系统中还存在另外的相关要素(例如方法中的步骤或者系统中的单元,例如的单元可以是部分处理器、部分程序或软件等等)。
[0027]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
[0028]目前,对于各个网络平台的站外广告场景,接入流量来源复杂,每日涉及数万级别以上的渠道、媒体以及大量广告位;广告流量反作弊需要从媒体或者广告位等维度及时发现异常并做预警和封禁等处理。
[0029]然而,相关技术中的广告流量反作弊系统难以阻止作弊流量对广告各系统的影响,使得后续本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种广告流量反作弊方法,其特征在于,应用于广告流量反作弊系统,所述方法包括:接收输入的每个广告流量请求;获取所述每个广告流量请求的特征数据,对所述每个广告流量请求的特征数据进行预处理,并将预处理后的特征数据输入至所述预先训练完成的深度学习模型进行预测,得到所述每个广告流量请求的作弊得分;基于模型策略和所述每个广告流量请求的作弊得分,确定所述每个广告流量请求的第一识别结果;其中,所述模型策略包含所述深度学习模型对应的过滤策略,所述第一识别结果用于表征所述每个广告流量请求是否为作弊流量请求。2.根据权利要求1所述的方法,其特征在于,所述深度学习模型是通过以下步骤训练得到的:获取第一历史时间段内的全量样本日志以及第二历史时间段内的增量样本日志;所述全量样本日志和增量样本日志分别存储有多个历史广告流量请求对应的历史日志数据;分别对所述全量样本日志和所述增量样本日志进行打标签处理,得到全量训练集和增量训练集;利用所述全量训练集对初始深度学习模型进行预训练,得到预训练后的深度学习模型;利用所述增量训练集对所述预训练后的深度学习模型进行参数调整处理,得到训练完成的深度学习模型。3.根据权利要求1或2所述的方法,其特征在于,所述基于模型策略和所述每个广告流量请求的作弊得分,确定所述每个广告流量请求的第一识别结果,包括:确定所述模型策略对应的动态阈值;将所述每个广告流量请求的作弊得分和所述动态阈值进行比较,确定所述每个广告流量请求的第一识别结果。4.根据权利要求3所述的方法,其特征在于,所述确定所述模型策略对应的动态阈值,包括:获取第三历史时间段内的校验样本日志;所述校验样本日志存储有多个历史广告流量请求对应的历史日志数据;对所述校验样本日志进行打标签处理,得到校验数据集;利用所述校验数据集对所述训练完成的深度学习模型的预测准确率进行校验,得到校验结果;基于所述校验结果,确定所述模型策略对应的动态阈值。5.根据权利要求1或2所述的方法,其特征在于,所述广告流量反作弊系统还包括至少一个其他过滤策略,所述方法还包括:利用所述至少一个其他过滤策略中各个其他过滤策略对所述每个广告流量请求进行并行识别,得到所述每个广告流量请求的至少一个第二识别结果;根据所述每个广告流量请求的第一识别结果和所述至少一个第二识别结果,确定所述每个广告流量请求的第三识别结果。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:在确定所述每个广告流量请求的第三识别结果后,获取所述广告流量反作弊系统对所
述每个广告流量请求进行处理的目标日志数据;所述目标日志数据包括预处理后的特征数据、请求标识数据和作弊得分;将获取到的所述每个广告流量请求对应的目标日志数据进行存储。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据设定时间段内的广告流量请求的第三识别结果,确定所述设定时间段内的广告流量请求中作弊流量请求的占比;判断所述作弊流量请求的占比是否在设定范围内,得到判断结果;在所述判断结果为否的情况下,生成告警信息。8.根据权利要求1或2所述的方法,其特征在于,所述特征数据包括基础信息特征集、后链路特征集和统计特征集;所述获取所述每个广告流量请求的特征数据,对所述每个广告流量请求的特征数据进行预处理,包括:获取所述每个广告流量请求的基础信息特征集、后链路特征集和统计特征集的特征类型;所述特征类型包括离散型特征和数值型特征的其中一种;采用所述特征类型对应的预处理方式,对所述每个广告流量请求的基础信息特征集、后链路特征集和统计特征集进行预处理。9.根据权利要求7所述的方法,其特征在于,所述特征数据还包括交叉特征集,所述交叉特征集中的每项交叉特征是根据所述基础信息特征集中的至少两项特征进行交叉处理得到的。10.一种广告流量反作弊系统,其特征在于,所述系统包括实时反作弊模块和实时统计模块,其中:所述实时统计模块,用于接收输入的每个广告流量请求;所述实时反作弊...

【专利技术属性】
技术研发人员:宾光祥牛旭东赫阳张建生徐志宏
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1