一种判定用户间异常关联的方法、装置和电子设备制造方法及图纸

技术编号:38466816 阅读:9 留言:0更新日期:2023-08-11 14:44
本发明专利技术涉及计算机技术领域,公开了一种判定用户间异常关联的方法、装置和电子设备。判定用户间异常关联的方法包括:按不同维度预划分读取的用户的数据样本;定义用户间的距离计算方式,并生成用户间的距离矩阵;使用所述距离矩阵进行DBSCAN聚类;判定用户间是否异常聚集。可读存储介质,所述可读存储介质上存储有计算机指令;其中,所述计算机指令被处理器执行时,实现所述判定用户间异常关联的方法。上述技术方案按不同维度预划分数据样本,降低每次聚类的数据量,提升运算效率。基于不同的维度,通过自定义的用户间的距离计算方式,能够较准确计算用户间的相似度,快速发现用户间具有异常关联的现象,有效识别异常聚集团伙。有效识别异常聚集团伙。有效识别异常聚集团伙。

【技术实现步骤摘要】
一种判定用户间异常关联的方法、装置和电子设备


[0001]本专利技术涉及计算机
,具体涉及一种判定用户间异常关联的方法、装置和电子设备。

技术介绍

[0002]设备农场指利用云控或是群控软件管理成规模的大批量手机,模拟一切真人操作行为作弊制造大量虚假流量。如,通过设备农场、多开设备等虚假设备批量观看广告造假;通过设备农场、测试机等批量下载直接消耗广告主预算而获得报酬。移动反作弊行业中,针对设备农场、安卓群控等团伙欺诈行为一般通过DBSCAN、DPC等密度聚类算法检测识别。其存在的缺陷有:
[0003]1、算法时间复杂度为O(N2),在应对大量级数据运算时,效率极低。
[0004]2、仅靠单一的距离计算方式计算用户在app上的行为相似度,无法衡量各类作弊场景下用户属性、设备硬件信息间的综合相似度。

技术实现思路

[0005]本申请提供一种判定用户间异常关联的方法、装置和电子设备,以解决现有技术中对用户相似度判定效果不佳的上述技术问题。
[0006]根据本申请的一方面,一种实施例提供了一种判定用户间异常关联的方法,包括:
[0007]按不同维度预划分读取的用户的数据样本;
[0008]定义用户间的距离计算方式,并生成用户间的距离矩阵;
[0009]使用所述距离矩阵进行DBSCAN聚类;
[0010]判定用户间是否异常聚集。
[0011]一种实施例中,所述维度包括ip段、推广渠道、用户所在地区、设备机型或设备分辨率。
[0012]一种实施例中,所述定义用户间的距离计算方式包括:
[0013]针对每个参与聚类的特征采用不同的距离计算方式;
[0014]设定所述距离计算方式不同,则权重不同;
[0015]对多种所述距离计算方式的权重求和;
[0016]其中,所述参与聚类的特征包括用户使用时段、用户点击事件、设备是否为虚拟号段、设备充电状态、设备陀螺仪角度、设备开机时长、设备联网方式、设备消耗流量、设备存储空间、设备root状态或设备基带版本。
[0017]一种实施例中,所述距离计算方式包括欧氏距离、Levenshtein编辑距离或余弦相似度。
[0018]一种实施例中,利用python的pdist()和squareform()函数生成用户间的所述距离矩阵。
[0019]一种实施例中,所述使用距离矩阵进行DBSCAN聚类包括:
[0020]采用距离度量方式metric=

precomputed

,得到每个数据样本的聚类标签labels;
[0021]其中,当labels=

1时,为噪声点。
[0022]一种实施例中,判定用户间异常关联的方法还包括:
[0023]过滤低风险用户;
[0024]其中,所述低风险用户包括实名认证用户、产生付费行为用户和中高端机型用户中的一种或多种组合。
[0025]根据本申请的一方面,一种实施例提供了一种判定用户间异常关联的装置,包括:
[0026]预划分模块,用于按不同维度预划分读取的数据样本;
[0027]用户间距离处理模块,用于定义用户间的距离计算方式,并生成用户间的距离矩阵;
[0028]DBSCAN聚类模块,用于使用所述距离矩阵进行DBSCAN聚类;
[0029]和
[0030]异常聚集判定模块,用于判定用户间是否异常聚集。
[0031]根据本申请的一方面,一种实施例提供了一种电子设备,包括:
[0032]存储器;
[0033]和
[0034]处理器;
[0035]其中,所述存储器用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理器执行以实现如上任意一项所述判定用户间异常关联的方法。
[0036]根据本申请的一方面,一种实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机指令;其中,所述计算机指令被处理器执行时,实现如上任意一项所述判定用户间异常关联的方法。
[0037]本申请的上述实施例按不同维度预划分数据样本,降低每次聚类的数据量,提升运算效率。基于不同的维度,通过自定义的用户间的距离计算方式,能够较准确计算用户间的相似度,快速发现用户间具有异常关联的现象,有效识别异常聚集团伙。
附图说明
[0038]图1是一种实施例中判定用户间异常关联的方法之流程图;
[0039]图2是一种实施例中判定用户间异常关联的方法之流程图;
[0040]图3是一种实施例中判定用户间异常关联的装置之结构示意图。
具体实施方式
[0041]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0042]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范
围。
[0043]需要说明的是,本申请中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0044]应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,本申请中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
[0045]实施例一
[0046]请参考图1,一种实施例提供了一种判定用户间异常关联的方法,包括以下步骤:
[0047]S102、按不同维度预划分读取的用户的数据样本;
[0048]S104、定义用户间的距离计算方式,并生成用户间的距离矩阵;
[0049]S106、使用所述距离矩阵进行DBSCAN聚类;
[0050]S108、判定用户间是否异常聚集。
[0051]一般,所述维度包括ip段、推广渠道、用户所在地区、设备机型或设备分辨率。
[0052]一种实施例中,所述定义用户间的距离计算方式包括以下步骤:
[0053]S1042、针对每个参与聚类的特征采用不同的距离计算方式;
[0054]S1044、设定所述距离计算方式不同,则权重不同;
[0055]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种判定用户间异常关联的方法,其特征在于,包括:按不同维度预划分读取的用户的数据样本;定义用户间的距离计算方式,并生成用户间的距离矩阵;使用所述距离矩阵进行DBSCAN聚类;判定用户间是否异常聚集。2.根据权利要求1所述的一种判定用户间异常关联的方法,其特征在于,所述维度包括ip段、推广渠道、用户所在地区、设备机型或设备分辨率。3.根据权利要求1所述的一种判定用户间异常关联的方法,其特征在于,所述定义用户间的距离计算方式包括:针对每个参与聚类的特征采用不同的距离计算方式;设定所述距离计算方式不同,则权重不同;对多种所述距离计算方式的权重求和;其中,所述参与聚类的特征包括用户使用时段、用户点击事件、设备是否为虚拟号段、设备充电状态、设备陀螺仪角度、设备开机时长、设备联网方式、设备消耗流量、设备存储空间、设备root状态或设备基带版本。4.根据权利要求1或3所述的一种判定用户间异常关联的方法,其特征在于,所述距离计算方式包括欧氏距离、Levenshtein编辑距离或余弦相似度。5.根据权利要求1所述的一种判定用户间异常关联的方法,其特征在于,利用python的pdist()和squareform()函数生成用户间的所述距离矩阵。6.根据权利要求1所述的一种判定用户间异常关联的方法,其特征在于,所述使用距离矩阵进行DBSCAN...

【专利技术属性】
技术研发人员:张宏伟
申请(专利权)人:上海二三四五网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1