生成作弊预测模型的方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:30051217 阅读:21 留言:0更新日期:2021-09-15 10:53
本公开提供了一种生成作弊预测模型的方法、装置、设备、介质及程序产品,涉及深度学习和知识图谱等人工智能领域。该方法的一实施方式包括:获取目标流量数据集;根据作弊预测模型的第一神经网络,确定目标流量数据集中不作弊对应的第一流量数据;根据作弊预测模型的第二神经网络,对第一流量数据进行作弊检测,得到第一流量数据中作弊对应的第二流量数据;利用目标流量数据集中作弊对应的流量数据和第二流量数据进行训练和对应的真实标签,生成作弊预测模型。弊预测模型。弊预测模型。

【技术实现步骤摘要】
生成作弊预测模型的方法、装置、设备、介质及程序产品


[0001]本公开涉及计算机领域,具体涉及深度学习和知识图谱等人工智能领域,尤其涉及一种生成作弊预测模型的方法、装置、设备、介质及程序产品。

技术介绍

[0002]流量反作弊方法是从正常用户行为、机器爬取、恶意刷点击以及羊毛党等行为中去掉非正常用户行为的数据,从而得到有效的日活跃用户数量(Daily Active User,DAU)、点击等数据为后续进行机器学习建模提供准确数据的过程。
[0003]目前,目前的反作弊方法包括以下几种情况:(1)基于规则的反作弊方法。(2)采用统计的方法。(3)基于聚类的算法。

技术实现思路

[0004]本公开实施例提出了一种生成作弊预测模型的方法、装置、设备、介质及程序产品。
[0005]第一方面,本公开实施例提出了一种生成作弊预测模型的方法,包括:获取目标流量数据集;根据作弊预测模型的第一神经网络,确定目标流量数据集中不作弊对应的第一流量数据;根据作弊预测模型的第二神经网络,对第一流量数据进行作弊检测,得到第一流量数据中作弊对应的第二流量数据;利用目标流量数据集中作弊对应的流量数据和第二流量数据进行训练和对应的真实标签,生成作弊预测模型。
[0006]第二方面,本公开实施例提出了一种生成作弊预测模型的装置,包括:数据获取模块,被配置成获取目标流量数据集;数据确定模块,被配置成根据作弊预测模型的第一神经网络,确定目标流量数据集中不作弊对应的第一流量数据;数据得到模块,被配置成根据作弊预测模型的第二神经网络,对第一流量数据进行作弊检测,得到第一流量数据中作弊对应的第二流量数据;模型训练模块,被配置成利用目标流量数据集中作弊对应的流量数据和第二流量数据进行训练和对应的真实标签,生成作弊预测模型。
[0007]第三方面,本公开实施例提出了一种预测作弊的方法,包括:获取待预测的流量数据集;将待预测的流量数据集输入预先训练的作弊预测模型的第一神经网络中,得到第一预测标签;以及将所述待预测的流量数据集中第一预测标签为不作弊的第一预测流量数据输入预先训练的作弊预测模型的第二神经网络中,得到第二预测标签;根据所述待预测的流量数据集中第一预测标签为作弊的流量数据,以及所述第一预测流量数据中第二预测标签为作弊的流量数据,确定所述待预测的流量数据集的作弊预测结果。
[0008]第四方面,本公开实施例提出了一种预测作弊的装置,包括:数据获取模块,被配置成获取待预测的流量数据集;第一得到模块,被配置成将待预测的流量数据集输入预先训练的作弊预测模型的第一神经网络中,得到第一预测标签;以及第二得到模块,被配置成将所述待预测的流量数据集中第一预测标签为不作弊的第一预测流量数据输入预先训练的作弊预测模型的第二神经网络中,得到第二预测标签;结果得到模块,被配置成根据所述
待预测的流量数据集中第一预测标签为作弊的流量数据,以及所述第一预测流量数据中第二预测标签为作弊的流量数据,确定所述待预测的流量数据集的作弊预测结果
[0009]第五方面,本公开实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面描述的方法。
[0010]第六方面,本公开实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面描述的方法。
[0011]第七方面,本公开实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面或第二方面描述的方法。
[0012]本公开实施例提供的生成作弊预测模型的方法、装置、设备、介质及程序产品提高了作弊预测模型对作弊行为的预测精度。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是本公开可以应用于其中的示例性系统架构图;
[0016]图2是根据本公开的生成作弊预测模型的方法的一个实施例的流程图;
[0017]图3是根据本公开的生成作弊预测模型的方法的一个实施例的流程图;
[0018]图4是正常流量数据和异常流量数据之间的预设的比例对应的示意图;
[0019]图5是根据本公开的生成作弊预测模型的方法的一个实施例的示意图;
[0020]图6是根据本公开的生成作弊预测模型的方法的一个实施例的示意图;
[0021]图7是根据本公开的生成作弊预测模型的方法的一个实施例的示意图;
[0022]图8是根据本公开的生成作弊预测模型的方法的一个实施例的示意图;
[0023]图9是根据本公开的作弊预测的方法的一个实施例的示意图;
[0024]图10是根据本公开的生成作弊预测模型的装置的一个实施例的结构示意图;
[0025]图11是根据本公开的作弊预测的装置的一个实施例的结构示意图;
[0026]图12是用来实现本公开实施例的电子设备的框图。
具体实施方式
[0027]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0028]需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
[0029]图1示出了可以应用本公开的生成作弊预测模型的方法和装置或预测作弊的方法和装置的实施例的示例性系统架构100。
[0030]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0031]用户可以使用终端设备101、102、103通过网络104与服务器105交互,例如流量数据集。终端设备101、102、103上可以安装有各种客户端应用、智能交互应用,例如数据处理应用等等。
[0032]终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,终端设备可以为与用户通过键盘、触摸板、显示屏、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如PC(Personal Comp本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成作弊预测模型的方法,包括:获取目标流量数据集;根据作弊预测模型的第一神经网络,确定所述目标流量数据集中不作弊对应的第一流量数据;根据所述作弊预测模型的第二神经网络,对所述第一流量数据进行作弊检测,得到所述第一流量数据中作弊对应的第二流量数据;利用所述目标流量数据集中作弊对应的流量数据和所述第二流量数据进行训练和对应的真实标签,生成作弊预测模型。2.根据权利要求1所述的方法,其中,所述根据作弊预测模型的第一神经网络,确定所述目标流量数据集中不作弊对应的第一流量数据,包括:将所述目标流量数据集输入作弊预测模型的第一神经网络中,得到所述目标流量数据集对应的预测标签,其中,所述预测标签为作弊或不作弊;将所述目标流量数据集中预测标签为不作弊对应的流量数据确定为第一流量数据。3.根据权利要求1或2所述的方法,所述方法还包括:对所述目标流量数据集进行特征提取,得到对应的特征库;根据特征重要性,从所述特征库中提取预设个特征;所述根据所述作弊预测模型的第二神经网络,对所述第一流量数据进行作弊检测,得到所述第一流量数据中作弊对应的第二流量数据,包括:根据所述作弊预测模型的第二神经网络,对所述第一流量数据中预设个特征对应的流量数据进行作弊检测,得到所述第一流量数据中作弊对应的第二流量数据。4.根据权利要求3所述的方法,其中,若所述第一神经网络为lightgbm网络;所述根据特征重要性,从所述特征库中提取预设个特征,包括:将所述特征库输入所述lightgbm网络中,得到所述特征库中每个特征的特征重要性;根据所述每个特征的特征重要性,从所述特征库中提取预设个特征。5.根据权利要求1

4任一项所述的方法,其中,所述第二神经网络为孤立森林网络。6.根据权利要求3

5任一项所述的方法,其中,所述对所述目标流量数据集进行特征提取,得到对应的特征库,包括:从以下至少一个维度,对所述目标流量数据集进行特征提取,得到对应的特征库:业务维度、渠道来源维度、设备维度、时序维度。7.根据权利要求1

6任一项所述的方法,其中,所述目标流量数据集包括异常流量数据和正常流量数据,其中,所述正常流量数据与异常流量数据之间成预设的比例。8.根据权利要求7所述的方法,其中,所述真实标签可以基于以下步骤确定:基于所述目标流量数据集中作弊对应的流量数据和所述第二流量数据中的异常流量数据对应的知识图谱和正常流量数据对应的知识图谱,确定所述真实标签。9.一种预测作弊的方法,包括:获取待预测的流量数据集;将待预测的流量数据集输入如权利要求1

8任一项所述的作弊预测模型的第一神经网络中,得到第一预测标签;以及将所述待预测的流量数据集中第一预测标签为不作弊的第一预测流量数据输入如权
利要求1

8任一项所述的作弊预测模型的第二神经网络中,得到第二预测标签;根据所述待预测的流量数据集中第一预测标签为作弊的流量数据,以及所述第一预测流量数据中第二预测标签为作弊的流量数据,确定所述待预测的流量数据集的作弊预测结果。10.根据权利要求9所述的方法,所述方法还包括:对所述待预测的流量数据集进行特征提取,得到样本特征库;根据样本特征重要性,从所述样本特征库中提取预设个样本特征。11.根据权利要求10所述的方法,其中,若所述第一神经网络为lightgbm网络;以及所述根据样本特征重要性,从所述样本特征库中提取预设个样本特征,包括:将所述样本特征库中的每个样本特征输入所述lightgbm网络中,得到所述每个样本特征的特征重要性;根据所述每个样本特征的特征重要性,从所述样本特征库中提取预设个样本特征。12.根据权利要求10或11所述的方法,其中,所述将所述待预测的流量数据集中第一预测标签为不作弊的第一预测流量数据输入如权利要求1

8任一项所述的作弊预测模型的第二神经网络中,得到第二预测标签,包括:将所述预设个样本特征输入所述第二神经网络中,得到所述第二预测标签。13.一种生成作弊预测模型的装置,包括:数据获取模块,被配置成获取目标流量数据集;数据确定模块,被配置成根据作弊预测模型的第一神经网络,确定所述目标流量数据集中不作弊对应的第一流量数据;数据得到模块,被配置成根据所述作弊预测模型的第二神经网络,对所...

【专利技术属性】
技术研发人员:谭云飞刘晓庆
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1