一种移动通信中异常用户识别的方法及智能设备技术

技术编号:32872857 阅读:16 留言:0更新日期:2022-04-02 12:03
本发明专利技术实施例公开了一种移动通信中异常用户识别的方法及其智能设备,该方法包括:包括:获得第一用户集合,所述第一用户集合包括多个用户标识;获得所述第一用户集合中的每个用户标识所指示用户的活跃度关联数据;根据所述活跃度关联数据从所述第一用户集合中确定第二用户集合;获得所述第二用户集合中的每个用户标识所指示用户的行为特征数据;以及根据所述行为特征数据从所述第二用户集合中确定第三用户集合。第三用户集合。第三用户集合。

【技术实现步骤摘要】
一种移动通信中异常用户识别的方法及智能设备


[0001]本专利技术涉及移动通信
,尤其涉及一种移动通信中异常用户识别的方法及智能设备。

技术介绍

[0002]在移动通信中,常见的异常用户包括养卡用户。所谓“养卡”是指为谋取不正当利益,利用运营商的政策或管理上的漏洞,通过作弊手段批量制造虚假用户、冒充销售或经营成果的行为。这种行为具有很大的危害性。大量通信资源由此被占用却用于诸如套取终端或营销发展酬金之类的非正常用途,这不仅使得运营商为无法带来收益的卡号持续耗费通信资源,且可能为发展虚假的新增客户的渠道代理商或分公司付出大量的发展酬金,造成直接或间接的经济损失,并且没有有效使用的卡号也为一些非法活动提供了温床,对公众信息安全造成威胁。
[0003]目前,对诸如养卡等异常用户的识别,一般是通过随机进行人工抽检的方式进行,比如运营商的运维人员到一些发卡网点,对近期的用户开卡情况进行人工数据收集和分析,依次来确定相应的发卡网点是否存在异常开卡的情况,从而确定出养卡对应的异常用户。此种方式对异常用户的检测效率低。

技术实现思路

[0004]本申请提供一种移动通信中异常用户识别的方法及智能设备,可以智能地进行异常分析。
[0005]一方面,本专利技术实施例提供了一种移动通信中异常用户识别的方法,该方法包括:获得第一用户集合,第一用户集合包括多个用户标识;获得第一用户集合中的每个用户标识所指示用户的活跃度关联数据;根据活跃度关联数据从第一用户集合中确定第二用户集合;获得第二用户集合中的每个用户标识所指示用户的行为特征数据;以及根据行为特征数据从第二用户集合中确定第三用户集合。
[0006]其中,第一用户集合基于多个目标网点的新增用户数量来获得,所述获得第一用户集合包括:从运营商数据库获得多个目标网点的运营数据,运营数据包括多个目标网点中的每个目标网点在预定时间段内的每日新增用户数量;对于每个目标网点,基于每日新增用户数量确定目标网点是否满足预定条件;以及如果确定目标网点满足预定条件,则将与目标网点对应的多个用户标识确定为第一用户集合。
[0007]其中,基于每日新增用户数量确定目标网点是否满足预定条件包括:基于目标网点在预定时间段内的每日新增用户数量,计算目标网点在预定时间段的第一子时间段内的第一日均新增用户数量以及目标网点在预定时间段的第二子时间段内的第二日均新增用户数量,并且将第一日均新增用户数量与第二日均新增用户数量的比值同第一阈值进行比较;计算目标网点在预定时间段的第三子时间段内的累计新增用户数量,并且将累计新增用户数量同第二阈值进行比较;以及如果比较的结果指示比值大于或等于第一阈值和累计
新增用户数量大于或等于第二阈值中的至少一项,则确定目标网点满足预定条件。
[0008]其中,活跃度关联数据至少包括用户标识所指示用户的通话时长、流量大小和短信数量,所述根据活跃度关联数据从第一用户集合中确定第二用户集合包括:针对第一用户集合中的每个用户标识:计算用户标识所指示用户的通话时长、流量大小和短信数量的加权和;将计算出的加权和与第三阈值进行比较;以及如果计算出的加权和小于或等于第三阈值,则将用户标识记录到第二用户集合中。
[0009]其中,根据活跃度关联数据从第一用户集合中确定第二用户集合还包括:将第二用户集合中的各个用户标识所指示用户的通话时长、流量大小和短信数量分别与低通话时长阈值、低流量大小阈值和低短信数量阈值进行比较;将通话时长小于或等于低通话时长阈值、流量大小小于或等于低流量大小阈值、并且短信数量小于或等于低短信数量阈值的对应的用户标识作为目标用户标识;以及将第二用户集合中的各个目标用户标识删除。
[0010]其中,根据行为特征数据从第二用户集合中确定第三用户集合包括:分析第二用户集合中的每个用户标识所指示用户的行为特征数据,并且根据分析的结果从第二用户集合中确定第三用户集合,其中,分析包括:计算第二用户集合中的每个用户标识所指示用户的行为特征分数,从计算出的每个用户标识所指示用户的行为特征分数中推导出每两个用户标识所指示用户之间的行为特征相似度,并且对于第二用户集合中的选定用户标识,将与选定用户标识所指示用户的行为特征相似度在行为特征相似度阈值范围内的其他用户的用户标识作为选定用户标识的关联用户标识;或者
[0011]提取第二用户集合中的每个用户标识所指示用户的国际移动设备标识IMEI,并且对于第二用户集合中的选定用户标识,将与选定用户标识所指示用户具有相同IMEI的其他用户的用户标识作为关联用户标识。
[0012]其中,根据分析的结果从第二用户集合中确定第三用户集合包括:计算关联用户标识的数量;将计算出的关联用户标识的数量加一的和与预定数量阈值进行比较;如果确定计算出的关联用户标识的数量加一的和大于或等于预定数量阈值,则将选定用户标识及其关联用户标识一起记录到第三用户集合中。
[0013]其中,行为特征数据包括用户标识所指示用户的出账收入、短信数量、通话时长、流量大小、联系号码、用户身份中的一个或多个。
[0014]其中,该方法使用神经网络来实施,并且其中,基于最小化第一用户集合所包括的实际异常用户数量与第一用户集合的总用户数量之间的差值、第二用户集合所包括的实际异常用户数量与第二用户集合的总用户数量之间的差值、以及第三用户集合所包括的实际异常用户数量与第三用户集合的总用户数量之间的差值中的一个或多个,来训练神经网络的各个阈值参数。
[0015]另一方面,本专利技术实施例还提供了一种智能设备,该智能设备包括:处理器和存储装置;该存储装置用于存储计算机程序;该处理器,运行该计算机程序,用于实现如前所述的方法。
[0016]又一方面,本专利技术实施例还提供了一种用于移动通信中异常用户识别的装置,该装置包括:第一筛选模块,用于获得第一用户集合,所述第一用户集合包括多个用户标识;第二筛选模块,用于获得第一用户集合中的每个用户标识所指示用户的活跃度关联数据,并且根据活跃度关联数据从第一用户集合中确定第二用户集合;以及第三筛选模块,用于
获得第二用户集合中的每个用户标识所指示用户的行为特征数据,并且根据行为特征数据从第二用户集合中确定第三用户集合。
[0017]再一方面,本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法。
[0018]本专利技术提供的异常用户识别的方法、设备、装置和存储介质,通过根据用户的活跃度关联数据和行为特征数据(可选地还结合网点的新增用户数据)实现有层次的、灵活的数据筛选/挖掘,能够逐步快速地缩小筛选范围,并且有效、准确且详尽地从海量数据中识别出异常用户。
附图说明
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于移动通信中异常用户识别方法,其特征在于,所述方法包括:获得第一用户集合,所述第一用户集合包括多个用户标识;获得所述第一用户集合中的每个用户标识所指示用户的活跃度关联数据;根据所述活跃度关联数据从所述第一用户集合中确定第二用户集合;获得所述第二用户集合中的每个用户标识所指示用户的行为特征数据;以及根据所述行为特征数据从所述第二用户集合中确定第三用户集合。2.根据权利要求1所述的方法,其中,所述第一用户集合基于多个目标网点的新增用户数量来获得,所述获得所述第一用户集合包括:从运营商数据库获得所述多个目标网点的运营数据,所述运营数据包括所述多个目标网点中的每个目标网点在预定时间段内的每日新增用户数量;对于每个目标网点,基于所述每日新增用户数量确定所述目标网点是否满足预定条件;以及如果确定所述目标网点满足所述预定条件,则将与所述目标网点对应的多个用户标识确定为所述第一用户集合。3.根据权利要求2所述的方法,其中,所述基于所述每日新增用户数量确定所述目标网点是否满足预定条件包括:基于所述目标网点在预定时间段内的每日新增用户数量,计算所述目标网点在所述预定时间段的第一子时间段内的第一日均新增用户数量以及所述目标网点在所述预定时间段的第二子时间段内的第二日均新增用户数量,并且将所述第一日均新增用户数量与所述第二日均新增用户数量的比值同第一阈值进行比较;计算所述目标网点在所述预定时间段的第三子时间段内的累计新增用户数量,并且将所述累计新增用户数量同第二阈值进行比较;以及如果比较的结果指示所述比值大于或等于所述第一阈值和所述累计新增用户数量大于或等于所述第二阈值中的至少一项,则确定所述目标网点满足所述预定条件。4.根据权利要求1所述的方法,其中,所述活跃度关联数据至少包括用户标识所指示用户的通话时长、流量大小和短信数量,所述根据所述活跃度关联数据从所述第一用户集合中确定第二用户集合包括:针对所述第一用户集合中的每个用户标识:计算所述用户标识所指示用户的通话时长、流量大小和短信数量的加权和;将计算出的加权和与第三阈值进行比较;以及如果所述计算出的加权和小于或等于所述第三阈值,则将所述用户标识记录到第二用户集合中。5.根据权利要求4所述的方法,其中,所述根据所述活跃度关联数据从所述第一用户集合中确定第二用户集合还包括:将所述第二用户集合中的各个用户标识所指示用户的通话时长、流量大小和短信数量分别与低通话时长阈值、低流量大小阈值和低短信数量阈值进行比较;将通话...

【专利技术属性】
技术研发人员:肖永根谢林兵
申请(专利权)人:重庆市通信产业服务有限公司中冉信息分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1