一种广告流量反作弊方法、系统、电子设备和存储介质技术方案

技术编号：38436111 阅读：18 留言：0更新日期：2023-08-11 14:21

本申请提供一种广告流量反作弊方法、系统、电子设备和计算机存储介质，所述方法包括：接收输入的每个广告流量请求；获取所述每个广告流量请求的特征数据，对所述每个广告流量请求的特征数据进行预处理，并将预处理后的特征数据输入至所述预先训练完成的深度学习模型进行预测，得到所述每个广告流量请求的作弊得分；基于模型策略和所述每个广告流量请求的作弊得分，确定所述每个广告流量请求的第一识别结果；其中，所述模型策略包含所述深度学习模型对应的过滤策略，所述第一识别结果用于表征所述每个广告流量请求是否为作弊流量请求。所述每个广告流量请求是否为作弊流量请求。所述每个广告流量请求是否为作弊流量请求。

全部详细技术资料下载

【技术实现步骤摘要】
一种广告流量反作弊方法、系统、电子设备和存储介质

[0001]本申请涉及网络信息
，尤其涉及一种广告流量反作弊方法、系统、电子设备和计算机存储介质。

技术介绍

[0002]广告流量反作弊在方法论上不断完善，形成了事前预警、事中打击、事后对抗的完整体系。在事中打击、事后对抗中，均需要广告的展现和点击行为已经发生，收集所有信息传送到反作弊系统中进行判断，判断为作弊的广告流量则进行标注、拦截、索赔、返款等操作。事前预警指对于历史表现不好的流量来源进行限制和提前封禁准备，出现作弊率高则限制该来源的流量继续生效。
[0003]相关技术中，事前预警是直接对历史表现不好的流量来源进行限制，使得来自该来源的一些正常广告流量也无法生效，存在作弊流量误判的可能性；此外，现有的反作弊系统是在广告流量生效时和生效后，根据流量对应的设备、用户、渠道、历史记录等基础信息、行为信息以及对应统计值，按照各种策略和人工智能(Artificial Intelligence，AI)模型进行作弊判断。然而，对于作弊流量，反作弊生效时广告投放已经发生，目标设备端已展示广告甚至已经发生点击行为，流量来源渠道已可以感知展示和点击的发生；即，不能够在广告请求到达时对广告作弊流量进行及时预判和封禁等问题，为此提出一种广告流量反作弊方法。

技术实现思路

[0004]本申请实施例提供一种广告流量反作弊方法、系统、电子设备和计算机存储介质。
[0005]本申请实施例的技术方案是这样实现的：
[0006]本申请实施例提供了一种广...

【技术保护点】

【技术特征摘要】
1.一种广告流量反作弊方法，其特征在于，应用于广告流量反作弊系统，所述方法包括：接收输入的每个广告流量请求；获取所述每个广告流量请求的特征数据，对所述每个广告流量请求的特征数据进行预处理，并将预处理后的特征数据输入至所述预先训练完成的深度学习模型进行预测，得到所述每个广告流量请求的作弊得分；基于模型策略和所述每个广告流量请求的作弊得分，确定所述每个广告流量请求的第一识别结果；其中，所述模型策略包含所述深度学习模型对应的过滤策略，所述第一识别结果用于表征所述每个广告流量请求是否为作弊流量请求。2.根据权利要求1所述的方法，其特征在于，所述深度学习模型是通过以下步骤训练得到的：获取第一历史时间段内的全量样本日志以及第二历史时间段内的增量样本日志；所述全量样本日志和增量样本日志分别存储有多个历史广告流量请求对应的历史日志数据；分别对所述全量样本日志和所述增量样本日志进行打标签处理，得到全量训练集和增量训练集；利用所述全量训练集对初始深度学习模型进行预训练，得到预训练后的深度学习模型；利用所述增量训练集对所述预训练后的深度学习模型进行参数调整处理，得到训练完成的深度学习模型。3.根据权利要求1或2所述的方法，其特征在于，所述基于模型策略和所述每个广告流量请求的作弊得分，确定所述每个广告流量请求的第一识别结果，包括：确定所述模型策略对应的动态阈值；将所述每个广告流量请求的作弊得分和所述动态阈值进行比较，确定所述每个广告流量请求的第一识别结果。4.根据权利要求3所述的方法，其特征在于，所述确定所述模型策略对应的动态阈值，包括：获取第三历史时间段内的校验样本日志；所述校验样本日志存储有多个历史广告流量请求对应的历史日志数据；对所述校验样本日志进行打标签处理，得到校验数据集；利用所述校验数据集对所述训练完成的深度学习模型的预测准确率进行校验，得到校验结果；基于所述校验结果，确定所述模型策略对应的动态阈值。5.根据权利要求1或2所述的方法，其特征在于，所述广告流量反作弊系统还包括至少一个其他过滤策略，所述方法还包括：利用所述至少一个其他过滤策略中各个其他过滤策略对所述每个广告流量请求进行并行识别，得到所述每个广告流量请求的至少一个第二识别结果；根据所述每个广告流量请求的第一识别结果和所述至少一个第二识别结果，确定所述每个广告流量请求的第三识别结果。6.根据权利要求5所述的方法，其特征在于，所述方法还包括：在确定所述每个广告流量请求的第三识别结果后，获取所述广告流量反作弊系统对所
述每个广告流量请求进行处理的目标日志数据；所述目标日志数据包括预处理后的特征数据、请求标识数据和作弊得分；将获取到的所述每个广告流量请求对应的目标日志数据进行存储。7.根据权利要求5所述的方法，其特征在于，所述方法还包括：根据设定时间段内的广告流量请求的第三识别结果，确定所述设定时间段内的广告流量请求中作弊流量请求的占比；判断所述作弊流量请求的占比是否在设定范围内，得到判断结果；在所述判断结果为否的情况下，生成告警信息。8.根据权利要求1或2所述的方法，其特征在于，所述特征数据包括基础信息特征集、后链路特征集和统计特征集；所述获取所述每个广告流量请求的特征数据，对所述每个广告流量请求的特征数据进行预处理，包括：获取所述每个广告流量请求的基础信息特征集、后链路特征集和统计特征集的特征类型；所述特征类型包括离散型特征和数值型特征的其中一种；采用所述特征类型对应的预处理方式，对所述每个广告流量请求的基础信息特征集、后链路特征集和统计特征集进行预处理。9.根据权利要求7所述的方法，其特征在于，所述特征数据还包括交叉特征集，所述交叉特征集中的每项交叉特征是根据所述基础信息特征集中的至少两项特征进行交叉处理得到的。10.一种广告流量反作弊系统，其特征在于，所述系统包括实时反作弊模块和实时统计模块，其中：所述实时统计模块，用于接收输入的每个广告流量请求；所述实时反作弊...

【专利技术属性】
技术研发人员：宾光祥，牛旭东，赫阳，张建生，徐志宏，
申请(专利权)人：北京京东世纪贸易有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人