一种获取流量信息的方法及系统技术方案

技术编号:9768162 阅读:86 留言:0更新日期:2014-03-15 23:02
本发明专利技术公开了一种获取流量信息的方法及系统,包括前置端获取用户的上网详单信息;前置端按照预先设置的过滤策略,过滤上网详单信息以获取用户关键信息并传送给处理端;处理端对获得的用户关键信息进行分析以获取用户的互联网标识并存储。本发明专利技术通过对上网详单信息的过滤,得到了符合某一类特定的互联网服务的流量信息,并将其标识为不同的互联网标识信息。也就是说,通过本发明专利技术方法实现了将上网详单转化为真正可读的互联网标识信息,从而为后续更好地为分析移动网络用户的行为提供了保证。

【技术实现步骤摘要】
一种获取流量信息的方法及系统
本专利技术涉及移动互联网技术,尤指一种获取流量信息的方法及系统。
技术介绍
随着移动互联网的快速发展,智能手机数量的迅猛增长,手机软件也得到了广泛的应用。对于运营商来说,手机软件的大量使用产生了巨大的移动网络流量。移动网络流量的分析对于运营商来说意义重大,可以为营销和广告等业务提供帮助。因此,电信运营商一直致力于建立完善而又健全的移动网络用户档案,在移动网络用户档案中包括有用户的信令信息、通话记录信息、短信记录信息、上网记录信息等流量信息。一方面,这些信息的准确记录能够为用户提供一个使用记录的参考,另一方面,又能为更好的分析用户的行为,提供更加活跃的商业模式(比如后向收费)等提供依据。对于流量的分析,最基本的就是要了解用户所使用的各种互联网标识,比如用户的微博账号、微信账号等,只有获得了这些互联网标识,才能与用户的行为分析联系起来,进而为后续其他分析提供依据。目前,一方面,移动用户的行为与互联网标识往往只是在某个单一的服务中得到存储和分析,没有对整个移动互联网服务进行统一的处理。另一方面,电信运营商在网关GPRS支持节点(GGSN)采用流量分光器,并通过探针技术获取用户的上网详单,在上网详单中包含有用户的Http请求地址等信息。这种方法完成了最基本的数据采集工作,但是,目前是不能将上网详单转化为真正可读的互联网标识信息的。目前能够采集到流量的大小以及流量的服务地址如http://sports, sina.com.cn,却没有互联网标识,而仅仅知道流量的服务地址,是无法精准定位用户的互联网标识的,因此,对于特定的互联网服务如微博、微信等,是无法进行更加精准的定位的,也不能获悉用户的微博内容并进行深入的数据挖掘。从现有在获取移动网络用户的流量信息方案中,仅能获得用户的服务地址,而没有互联网标识,因此,无法对用户所使用的互联网服务进行分类,从而无法实现针对不同特征用户的深入分析以形成个性化的服务方案。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种获取流量信息的方法及系统,能够将上网详单转化为真正可读的互联网标识信息,能为更好地为分析移动网络用户的行为提供保证。为了达到本专利技术目的,本专利技术提供了一种获取流量信息的方法,包括前置端获取用户的上网详单信息,还包括:前置端按照预先设置的过滤策略,过滤上网详单信息以获取用户关键信息并传送给处理端;处理端对获得的用户关键信息进行分析以获取用户的互联网标识并存储。所述过滤策略用于将符合某一类特定的互联网服务的流量信息提取出来;所述过滤上网详单信息以获取用户关键信息并传送给处理端包括:提取符合所述过滤策略的某一类特定的互联网服务的流量信息,并将提取出来的流量信息加上预先协商好的互联网标识信息作为关键信息的一部分;按照预先协商好的数据包格式,打包提取出来的用户关键信息并传送。所述处理端对获得的用户关键信息进行分析以获取用户的互联网标识并存储包括:所述处理端通过监听相应的端口获得所述数据包,按照所述预先协商好的数据包格式对数据包进行解析。获得用户关键信息;根据所述预先协商好的不同的互联网标识信息,获取用户的互联网标识并存储。所述数据包格式为用户数据包协议UDP数据包格式、或文件传输协议FTP文件传输方式。预先设置用于存储用户信息的数据库;所述存储之前,该方法还包括:所述处理端将所述分析获得的用户的互联网标识与数据库中的数据进行比较,如果所述互联网标识已经存在于数据库中,则丢弃该互联网标识;否则再执行将其存入数据库中的步骤。本专利技术还公开一种获取流量信息的系统,至少包括前置端和处理端;其中,前置端,用于获取用户的上网详单信息,按照预先设置的过滤策略,过滤上网详单信息以获取用户关键信息并传送给处理端;处理端,用于对获得的用户关键信息进行分析以获取用户的互联网标识并存储。所述前置端包括采集单元、过滤单元,处理端包括分析单元、存储单元;其中,采集单元,用于获取用户的上网详单信息,输出给过滤单元;过滤单元,其中设置有过滤策略,用于按照过滤策略过滤来自采集单元的上网详单信息以获取用户关键信息,将用户关键信息传送给分析单元;分析单元,用于对来自过滤单元的用户关键信息进行分析,以获取用户的互联网标识并存储到存储单元中。所述过滤单元,具体用于:按照所述过滤策略过滤来自所述采集单元的上网详单信息,以获取用户关键信息;将用户关键信息中的符合某一类特定的互联网服务的流量信息提取出来,并加上预先协商好的互联网标识信息;将用户关键信息按照预先协商好的数据包格式打包后传送给分析单元。所述分析单元具体用于,按照所述预先协商好的数据包格式对接收到的数据包进行解析,获得用户关键信息,并根据所述预先协商好的不同的互联网标识信息,获取用户的互联网标识,将获得的用户的互联网标识存储到所述存储单元中。所述存储单元还用于存储用户信息;所述分析单元,还用于将所述分析获得的用户的互联网标识与所述存储单元中的数据进行比较,在所述互联网标识已经存在与所述存储单元中,则丢弃该互联网标识;否则将其存入所述存储单元中。与现有技术相比,本专利技术包括前置端获取用户的上网详单信息,并按照预先设置的过滤策略,过滤上网详单信息以获取用户关键信息并传送给处理端;处理端对获得的用户关键信息进行分析以获取用户的互联网标识并存储。本专利技术通过对上网详单信息的过滤,得到了符合某一类特定的互联网服务的流量信息,并将其标识为不同的互联网标识信息。也就是说,通过本专利技术方法实现了将上网详单转化为真正可读的互联网标识信息,从而为后续更好地为分析移动网络用户的行为提供了保证。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。【附图说明】附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术获取流量信息的方法的流程图;图2为本专利技术获取流量信息的系统的组成结构示意图。【具体实施方式】为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1为本专利技术获取流量信息的方法的流程图,如图1所示,包括:步骤100:前置端获取用户的上网详单信息。本步骤的具体实现属于现有技术,可以采用在GGSN的Gn 口进行分光的方式进行数据包采集,从而获得用户上网详单。如果网络中有多个GGSN,可分别对应在多个Gn 口进行分光采集,具体实现这里不再赘述。步骤101:前置端按照预先设置的过滤策略,过滤上网详单信息以获取用户关键信息并传送给处理端。本步骤中,过滤策略用于将符合某一类特定的互联网服务如微博、微信等的互联网标识提取出来,并作为用户关键信息的一部分。过滤策略可以是根据流量的服务地址如URL对互联网服务进行分类,比如本文档来自技高网
...
一种获取流量信息的方法及系统

【技术保护点】
一种获取流量信息的方法,包括前置端获取用户的上网详单信息,其特征在于,还包括:前置端按照预先设置的过滤策略,过滤上网详单信息以获取用户关键信息并传送给处理端;处理端对获得的用户关键信息进行分析以获取用户的互联网标识并存储。

【技术特征摘要】
1.一种获取流量信息的方法,包括前置端获取用户的上网详单信息,其特征在于,还包括: 前置端按照预先设置的过滤策略,过滤上网详单信息以获取用户关键信息并传送给处理端; 处理端对获得的用户关键信息进行分析以获取用户的互联网标识并存储。2.根据权利要求1所述的方法,其特征在于,所述过滤策略用于将符合某一类特定的互联网服务的流量信息提取出来; 所述过滤上网详单信息以获取用户关键信息并传送给处理端包括:提取符合所述过滤策略的某一类特定的互联网服务的流量信息,并将提取出来的流量信息加上预先协商好的互联网标识信息作为关键信息的一部分; 按照预先协商好的数据包格式,打包提取出来的用户关键信息并传送。3.根据权利要求2所述的方法,其特征在于,所述处理端对获得的用户关键信息进行分析以获取用户的互联网标识并存储包括: 所述处理端通过监听相应的端口获得所述数据包,按照所述预先协商好的数据包格式对数据包进行解析,获得用户关键信息; 根据所述预先协商好的不同的互联网标识信息,获取用户的互联网标识并存储。4.根据权利要求2或 3所述的方法,其特征在于,所述数据包格式为用户数据包协议UDP数据包格式、或文件传输协议FTP文件传输方式。5.根据权利要求1、2或3所述的方法,其特征在于,预先设置用于存储用户信息的数据库;所述存储之前,该方法还包括: 所述处理端将所述分析获得的用户的互联网标识与数据库中的数据进行比较,如果所述互联网标识已经存在于数据库中,则丢弃该互联网标识;否则再执行将其存入数据库中的步骤。6.一种获取流量信息的系统,其特征在于,至少包括前置端和处理端;其中, 前置端,用于获...

【专利技术属性】
技术研发人员:徐青罗云彬
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1