识别共享流量用户的方法、装置、设备及介质制造方法及图纸

技术编号:18356975 阅读:32 留言:0更新日期:2018-07-02 11:22
本发明专利技术实施例提供了识别共享流量用户的方法、装置、设备及介质,方法包括:采集目标用户号码特定时间段内的上网信令清单数据;从上网信令清单数据中提取终端信息,终端信息包括终端型号或操作系统版本;对终端信息执行条件判定,满足条件的终端为共享流量用户,条件包括:具有不同终端信息的终端数目为N个,其中N大于等于2;终端在该特定时间段内使用目标用户号码上网,通过测试个人手机热点共享流量上网,观察和分析,发现用户上网信令记录中采集到的浏览器信息能够包含绝大多数客户的手机终端型号,包括连接热点的客户终端型号。结合数据分析统计与文本挖掘字符串匹配算法,识别出开通手机热点共享流量的用户。

【技术实现步骤摘要】
识别共享流量用户的方法、装置、设备及介质
本专利技术涉及通信
,尤其涉及一种识别共享流量用户的方法、装置、设备及介质。
技术介绍
随着移动网络速度和手机终端的快速发展,用户流量需求也越来越高,针对客户流量需求各运营商推出了各种大流量套餐。然而其中很多订购大流量套餐的客户可能会将个人套餐内流量共享给其他客户使用,如何才能识别通过开通手机热点共享流量给他人使用的用户目前并没有很好的相关识别技术方案。
技术实现思路
本专利技术提供了一种识别共享流量用户的方法、装置、设备及介质,通过测试个人手机热点共享流量上网,观察和分析,发现用户上网信令记录中采集到的浏览器信息能够包含绝大多数客户的手机终端型号,包括连接热点的客户终端型号。结合数据分析统计与文本挖掘字符串匹配算法,识别出开通手机热点共享流量的用户。第一方面,本专利技术实施例提供了一种识别共享流量用户的方法,包括:采集目标用户号码特定时间段内的上网信令清单数据;从上网信令清单数据中提取终端信息,终端信息包括终端型号或操作系统版本;对终端信息执行条件判定,满足条件的终端为共享流量用户,条件包括:具有不同终端信息的终端数目为N个,其中N大于等于2;终端在该特定时间段内使用目标用户号码上网。第二方面,本专利技术实施例提供了一种识别共享流量用户的装置,装置包括:采集模块,所述采集模块用于采集目标用户号码特定时间段内的上网信令清单数据;信息提取模块,所述信息提取模块用于从上网信令清单数据中提取终端信息,终端信息包括终端型号或操作系统版本;判定模块,判定模块用于对所述终端信息执行条件判定,满足条件判定的终端为共享流量用户,条件包括:终端为N个且所述终端的终端信息不同,其中N大于等于2;终端在特定时间段内使用目标用户号码上网。第三方面,本专利技术实施例提供了一种识别共享流量用户的设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一个实施例提供的一种识别共享流量用户的方法的流程示意图;图2为本专利技术实施例提供的一种KMP算法说明示意图;图3为本专利技术一个实施例提供的又一种识别共享流量用户的方法流程示意图;图4为本专利技术一个实施例提供的一种识别共享流量用户的装置的结构示意图;图5为本专利技术一个实施例提供的识别共享流量用户的设备的硬件结构示意图。具体实施方式下面将详细描述本专利技术的各个方面的特征和示例性实施例,为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本专利技术,并不被配置为限定本专利技术。对于本领域技术人员来说,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更好的理解。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。图1为本专利技术一个实施例提供的一种识别共享流量用户的方法的流程示意图,如图1所示,该方法包括:S1:采集目标用户号码特定时间段内的上网信令清单数据;S2:从上网信令清单数据中提取终端信息,终端信息包括终端型号或操作系统版本;S3:对终端信息执行条件判定,满足条件的终端为共享流量用户,条件包括:具有不同终端信息的终端数目为N个,其中N大于等于2;终端在特定时间段内使用目标用户号码上网。本专利技术实施例中,通过对http协议的流量内容解析,采集目标用户号码在特定时间段内的上网信令清单数据,这里,特定时间段至少为一小时,通常为一天或多天,采集多天时间内目标用户号码的上网信令清单数据,进而从采集到的上网信令清单数据中来提取终端信息,终端可以包括手机、平板电脑等移动终端设备,或者其他采用数据流量进行上网的终端设备,上网信令清单数据通常包括海量字符串,从海量字符串中需要提取终端信息,终端信息包括终端型号或者操作系统版本的信息,通过终端型号的不同或者操作系统版本的不同来识别采用同一目标用户号码上网的共享流量用户。本专利技术实施例中,对提取出的使用同一目标用户号码上网的终端型号或者操作系统版本执行条件判定,条件包括:具有不同终端信息的终端数目为N个,其中N大于等于2;终端在特定时间段内使用目标用户号码上网。这里不同终端信息可以是指不同的终端型号或者不同的操作系统版本,并且具有不同的终端信息的终端数目至少为两个,并且该至少两个不同的终端在该特定时间段内使用了目标用户号码上网,此时认为目标用户号码存在共享流量用户,且该具有不同终端信息的终端即为共享流量用户。业务受理协议规定,个人流量套餐套餐流量仅限本号码和本号码所安装的手机终端使用,本专利技术提出的识别共享流量用户的方法能够对共享流量用户有效进行识别,便于识别用户通过wifi共享,违规使用流量的行为。业务受理协议规定,家庭流量套餐可以共享使用,本专利技术提出的识别共享流量用户的方法便于识别客户实际共享的交往圈,分析客户的社会关系。并且,能够识别基于无线互联网,通过wifi热点开展的黑客行为、危害国家和公共安全的网络犯罪行为。以上是本专利技术识别共享流量用户的核心专利技术构思,下面将对各个步骤中的具体方法进行详尽的说明。可选的,本专利技术实施例中,采集到特定时间段的上网信令清单数据之后,从上网信令清单数据中提取终端信息,具体方法为:对上网信令清单中的user_agent中含分号和BUILD且分号在BUILD之前的记录进行处理,从左往右取出第一个BUILD与BUILD前第一个分号间的字符串,该字符串即为安卓终端型号;和/或对上网信令清单中的user_agent中含IPHONE和IOS且IPHONE在IOS前的记录进行处理,从左往右取出第一个括号与括号后第二个分号间的字符串,该字符串即为苹果终端的操作系统版本。通常如果识别到安卓终端型号之后可以不再进行操作系统版本的识别,通过确定的终端型号即可以识别不同的共享流量用户,而由于苹果手机保密严格,苹果终端不向外传送终端型号字段,只传一个IPHONE字符和操作系统版本。因此苹果终端通常还需要结合操作系统来判断。由于平均每个高流量客户每天产生5000条左右流量内容清单,市场上的终端型号有数万种,且命名不规范,客观条件使得准确文本挖掘分析存在困难。为了尽可能广泛地识别共享流量客本文档来自技高网...
识别共享流量用户的方法、装置、设备及介质

【技术保护点】
1.一种识别共享流量用户的方法,其特征在于,所述方法包括:采集目标用户号码特定时间段内的上网信令清单数据;从所述上网信令清单数据中提取终端信息,所述终端信息包括终端型号或操作系统版本;对所述终端信息执行条件判定,满足条件的终端为共享流量用户,所述条件包括:具有不同终端信息的终端数目为N个,其中N大于等于2;所述终端在所述特定时间段内使用目标用户号码上网。

【技术特征摘要】
1.一种识别共享流量用户的方法,其特征在于,所述方法包括:采集目标用户号码特定时间段内的上网信令清单数据;从所述上网信令清单数据中提取终端信息,所述终端信息包括终端型号或操作系统版本;对所述终端信息执行条件判定,满足条件的终端为共享流量用户,所述条件包括:具有不同终端信息的终端数目为N个,其中N大于等于2;所述终端在所述特定时间段内使用目标用户号码上网。2.根据权利要求1所述的方法,其特征在于,在所述对所述终端信息执行条件判定之前还包括:对所述目标用户号码进行有无换机行为识别,当在所述特定时间段内,所述目标用户号码发生换机行为,识别换机产生的终端信息,将所述换机产生的终端信息剔除。3.根据权利要求1所述的方法,其特征在于,所述从所述上网信令清单中提取终端信息的步骤中还包括:对从上网信令清单数据中提取的终端信息进行数据清洗。4.根据权利要求3所述的方法,其特征在于,所述数据清洗包括:剔除终端型号中含有NEXUS的记录,和/或剔除单条信令小于10KB的记录,和/或剔除单个终端使用流量小于1MB记录;对剩余数据去重。5.根据权利要求4所述的方法,其特征在于,所述数据清洗还包括:将所述终端信息与运营商的终端信息数据库进行匹配,筛选匹配相同的终端信息。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:采用KMP算法将上网信令清单数据中的终端信息字段与运营商的终端信息数据库进行匹配,筛选匹配相同的终端信息字段。7.根据权利要求1所述的方法,其特征在于,所述不同终端信息的终端数目N的...

【专利技术属性】
技术研发人员:郭书芳赵雨
申请(专利权)人:中国移动通信集团江苏有限公司中国移动通信集团公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1