【技术实现步骤摘要】
用于识别作弊用户的方法、装置和电子设备
本专利技术涉及互联网
,尤其涉及一种用于识别作弊用户的方法、装置和电子设备。
技术介绍
随着互联网技术的不断发展,互联网上的作弊现象也越来越多。常见的作弊类型包括:曝光作弊,通过刷粉、刷赞、刷销量提高曝光率;转化作弊:在注册、激活、下单等不同场景下通过自动化程序的模拟真人行为等。互联网作弊会严重危害到互联网平台安全性、氛围以及公平性。黑色产业链发现通过互联网坐标获得大量收益,逐渐发展出日益专业化、协作化和规模化的群组作弊的趋势。但目前对于群组作弊还没有较好的识别方法。
技术实现思路
本专利技术实施例提供了一种用于识别作弊用户的方法、装置和电子设备,实现了使用较少的计算量,来对作弊群体进行识别。第一方面,本专利技术实施例提供了一种用于识别作弊用户的方法,该方法包括:基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,其中,所述目标组合属性包括至少一个所述属性;对于每一个目标组合属性,确定该目标组合属性对应的至少一个组合 ...
【技术保护点】
1.一种用于识别作弊用户的方法,其特征在于,包括:/n基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,其中,所述目标组合属性包括至少一个所述属性;/n对于每一个目标组合属性,确定该目标组合属性对应的至少一个组合属性值,以及对于每一个组合属性值,将同时具有该组合属性值中的每一个属性值的不同用户归为同一用户组,其中所述组合属性值包括该目标组合属性中的每一个属性所对应的属性值;/n对于每一用户组,基于该用户组中各用户的历史用户日志所对应的各属性的属性值确定该组用户的相似度,以及确定该组用户相对于所述多个用户的差异程度;/n基于所述相似度与所述差异程 ...
【技术特征摘要】
1.一种用于识别作弊用户的方法,其特征在于,包括:
基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,其中,所述目标组合属性包括至少一个所述属性;
对于每一个目标组合属性,确定该目标组合属性对应的至少一个组合属性值,以及对于每一个组合属性值,将同时具有该组合属性值中的每一个属性值的不同用户归为同一用户组,其中所述组合属性值包括该目标组合属性中的每一个属性所对应的属性值;
对于每一用户组,基于该用户组中各用户的历史用户日志所对应的各属性的属性值确定该组用户的相似度,以及确定该组用户相对于所述多个用户的差异程度;
基于所述相似度与所述差异程度确定该用户组是否为作弊用户组。
2.根据权利要求1所述的方法,其特征在于,所述基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,包括:
从所述多个用户的历史用户日志中,确定出多个属性;
对所述多个属性进行组合以得到多个组合属性,其中,每一个组合属性包括至少一个所述属性;
基于各组合属性分别所对应的组合属性值的数量,确定出至少一个目标组合属性。
3.根据权利要求1所述的方法,其特征在于,所述基于所述相似度与所述差异程度确定该用户组是否为作弊用户组,包括:
基于所述相似度与所述差异程度的乘积确定该用户组的作弊置信度;
响应于所述作弊置信度大于预设作弊置信度阈值,则确定该用户组为作弊用户组。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对于每一个用户,从该用户所属的不同用户组分别对应的作弊置信度中查找作弊置信度的最大值,并将所述作弊置信度的最大值确定为该用户的作弊置信度,以确定该用户是否为作弊用户。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对于每一个用户,将该用户的作弊置信度所对应的用户组中的其他用户作为该用户的关联作弊用户。
6.根据权利要求1-5任一项所述的方法,其特征在于,对于该用户组的历史用户日志中的每一属性,该组用户的相似度与该属性的、所对应的用户数量最大的属性值的占比正相关,其中,所述所对应的用户数量最大的属性值的占比为该属性值对应的用户数量与该用户组中的用户数量之比。
7.根据权利要求1-5任一项所述的方法,其特征在于,
对于每一个用户组,该用户组的相似度与所述多个用户中,同时具有该用户组的目标组合属性值子组的各属性值的用户数量正相关;其中,所述目标组合属性值子组基于如下步骤确定:
从该用户组的各用户的历史用户日志所具有的各个属性的属性值中确定出多个组合属性值子组,其中,所述组合属性值子组中所包括的属性值的数量大于该用户组所对应的组合属性值中的属性值的数量;将在该用户组中所对应的用户的数量大于其他组合属性值子组在该用户组中所对应的用户数量的组合属性值子组确定为该用户组的目标组合属性值子组。
8.根据权利要求1-5任一项所述的方法,其特征在于,对于每一个用户组,该组用户的差异程度与该组用户对应的历史用户日志的每一属性的分布直方图差异正相关;其中
每一个属性的分布直方图差异由如下步骤确定:
确定该用户组的该属性的分布直方图;确定所述多个用户的该属性的分布直方图;基于预设统计方法从所述该用户组的该属性的分布直方图和所述多个用户的该属性的分布直方图中统计出该属性的分布直方图差异。
9.根据权利要求1-5任一项所述的方法,其特征在于,对于每一个用户组的每一属性,该组用户的差异程度与该用户组的该属性的目标属性值的统计出现概率负相关;其中
所述该用户组的该属性的目标属性值的统计出现概率由如下步骤确定:在所述多个用户中,确定该属性下的各属性值所对应的用户数量;对于每一属性值,基于该属性值所对应的用户数量与所述多个用户的数量之比确定该属性值的出现概率;将该属性的目标属性值的出现概率与该属性的多个所述属性值对应的出现概率中各小于所述目标属性值的出现概率的出现概率进行累加,得到目标属性值的统计出现概率;以及
该用户组的目标属性值由如下步骤确定:
对于该用户组各用户的历史用户日志的每一个属性,统计该属性的各属性值分别对应的用户数量;将所对应的用户数量最多的一个属性值作为该用户组的该属性的目标属性值。
10.根据权利要求1-5任一项所述的方法,其特征在于,对于每一用户组,该组用户的相似度S1由如下公式确定:S1=((c1+c2+…+ci+…+cn)/n)log(I)(1);
其中,I是该组用户的总数量;n是该组用户对应的目标组合属性中所包括的属性的总数量,n为大于等于1,且小于等于用户历史日志所对应的属性的总数量的正整数;c1是该组用户对应的目标组合属性中的第1个属性对应的用户数量最大的属性值的占比;c2是该组用户对应的目标组合属性中第2个属性对应的用户数量最大的属性值的占比;ci是该组用户对应的目标组合属性中的第i个属性对应的用户数量最大的属性值的占比;i为大于等于1小于等于n的正整数;cn是该组用户对应的目标组合属性中的第n个属性对应的用户数量最大的属性值的占比;ci大于等于零,小于等于1;S1大于等于零,小于等于1。
11.一种用于识别作弊用户的装置,其特征在于,包括:
目标组合属性确定单元,用于基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,其中,所述目标组合属性包括至少一个所述属性;
用户组确定单元,用于对于每一个目标组合属性,确定该目标组合属性...
【专利技术属性】
技术研发人员:张宇仁,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。