一种用户网络行为分析方法、装置和系统制造方法及图纸

技术编号:7181255 阅读:198 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种用户网络行为分析方法和系统,该方法包括以下步骤:获取来自不同网络位置的一个以上网关的用户的网络访问信息;对来自各所述网关的网络访问信息进行预处理,以获得各个用户各自的预处理后的网络访问信息;分别基于所得到各个用户各自的预处理后的网络访问信息,分析得到各用户的用户行为信息。本发明专利技术解决了现有技术中无法基于跨网通信的网络报文来分析用户网络行为的难题以及无法对用户访问除本网站外的其他网站的行为进行分析和/或无法对单个用户跨网访问不同的网站的行为进行分析的难题。

【技术实现步骤摘要】

本专利技术涉及网络用户行为分析,尤其涉及网络用户行为的还原,具体地说,涉及一种用户网络行为分析方法和系统。
技术介绍
随着因特网的广泛应用和日益普及,网络用户(以下简称用户)已经数以亿计。通常用户在浏览网站时,会与网站服务器之间发送和接收经由因特网的报文。图1为现有技术中用户与网站服务器进行交互的示意图,用户利用不同类型的用户终端,通过因特网与不同网站服务器进行连接,进行报文交互。对用户浏览网站的行为进行分析越来越受到关注,用户行为分析可定义为根据用户的历史行为,对有关数据进行统计、分析,从而分析出用户的需求或用户可能即将要做的事情。相对应地,可将利用网络报文还原用户行为理解为利用用户的网络报文记录,分析用户行为,并试图还原用户的上网意图。通过用户行为分析,可发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据,也可以更有针对性地提供各种网络服务,例如,可以根据用户行为分析得出用户喜好,在用户浏览网站时弹出针对用户喜好的广告。用户行为分析应该包含以下重点分析数据用户在网站的停留时间、跳出率、回访者、新访问者、回访次数、回访相隔天数;注册用户和非注册用户,分析两者之间的浏览习惯;用户所使用的搜索引擎、关键词、关联关键词和站内关键字;用户选择什么样的入口形式(广告或者网站入口链接)更为有效;用户访问网站流程,用来分析页面结构设计是否合理;用户在页面上的网页热点图分布数据和网页覆盖图数据;用户在不同时段的访问量情况等。一般而言,网站服务器会对访问该网站的用户与该网站服务器之间的网络报文进行日志数据记录,并可以基于所记录的日志数据进行相应的用户行为分析。例如,某搜索引擎网站A会记录用户的查询记录,基于这些记录,网站A可以分析用户的兴趣并建立用户轮廓,当用户在网站A进行进一步的关键字查询时,网站A可以基于用户轮廓,进行结果筛选, 将筛选的结果作为用户最想要的结果返回给用户。网站服务器会记录用户对本服务器的网络报文,从而形成用户在本网站服务器的访问记录,称为用户的局部视图。基于局部视图,网站服务器可以进行相应的用户行为分析。这种用户行为分析是基于某个网站服务器,但显然用户实际并不限于访问这一个网站服务器,因此这种用户行为分析仅为用户的局部行为分析。例如前文所述的,搜索引擎网站可以基于局部视图建立用户轮廓,优化其查询结果。传统的用户行为分析主要基于单个网站服务器的网络报文信息,而在当前情况下,网站数量数以百万计,通常不同的用户因为各自不同的喜好,浏览各种各样的网站,不同用户会访问不同的网站,单个用户的很多行为通过跨网访问多个网站服务器实现,从而导致传统的用户行为分析方式无法有效地适用于现今的复杂状况。因此,现有技术中存在无法有效地解决资源与需求矛盾的缺点。例如1)若各个网站以自身的局部视图进行用户行为分析,将导致用于进行数据分析的大量软硬件资源的重复配置和巨大的人力资源浪费;2)若网站为节省支出,不进行相应的用户行为分析,则可能导致漏掉大多数用户行为分析,进而导致用户友好性降低。此外,用户通常会在一段时间内访问多个网站,而在现有技术中无法获取用户的跨网访问信息,因此无法获取用户访问各个网站服务器的全部网络报文,称为用户的全局视图,进而无法基于全局跨网网络报文信息还原用户行为。
技术实现思路
本专利技术通过布置于各个网络位置的多个网关,可获取通过各个网关的所有用户的通信网络报文,从而能够基于全局用户信息来用户网络访问行为进行分析。为了解决上述技术问题,本专利技术提供了一种用户网络行为分析方法,其特征在于, 包括以下步骤步骤A 获取来自不同网络位置的一个以上网关的用户的网络访问信息;步骤B 对来自各所述网关的网络访问信息进行预处理,以获得各个用户各自的预处理后的网络访问信息;步骤C 分别基于步骤B所得到各个用户各自的预处理后的网络访问信息, 分析得到各用户的用户行为信息。进一步,该方法还包括,由与所述一个以上网关中的一个或多个相连接的收集器或者所述一个以上网关对所述网络访问信息进行过滤,以获得以数据元组为基本信息单位表示的网络访问信息。进一步,该方法还包括,所述数据元组的元素至少包括用户标识,时间点和网络报文。进一步,该方法还包括,所述步骤B和步骤C均通过分布式计算集群实现。进一步,该方法还包括,利用收集器从各所述网关获取所述网络访问信息;以及利用所述分布式计算集群从所述收集器获取来自各所述网关的网络访问信息。进一步,该方法还包括,所述网关和/或所述收集器按照设定规则存储所述网络访问信息,以及所述分布式计算集群根据所述设定规则生成用于下载所述网络访问信息的网络地址。进一步,该方法还包括,在所述步骤C中,将用户在第一预设时段内连续访问一个或多个网站的网络访问信息,作为与该用户的一个网络行为事件所对应的用户行为信息。进一步,该方法还包括,在所述步骤C中,统计用户在第二预设时段内针对各种类型网站的访问频率,作为表征该用户访问各类网站的偏好的用户行为信息。本专利技术还提供一种用户网络行为分析装置,其特征在于,包括以下各单元信息获取单元用于获取来自不同网络位置的一个以上网关的用户的网络访问信息;信息汇总单元用于对来自各所述网关的网络访问信息进行预处理,以获得各个用户各自的预处理后的网络访问信息;行为分析单元用于分别基于信息汇总单元所得到各个用户各自的预处理后的网络访问信息,分析得到各用户的用户行为信息。进一步,该装置还包括,所述用户网络行为分析装置为分布式计算集群,从所述网关或从与所述网关相连接的收集器获取压缩后的来自各所述网关的网络访问信息。进一步,该装置还包括,所述用户网络行为分析装置将用户在第一预设时段内连续访问一个或多个网站的网络访问信息作为与该用户的一个网络行为事件所对应的用户行为信息。本专利技术还提供一种用户网络行为分析系统,其特征在于,包括处于不同网络位置的一个以上的网关;一个以上的收集器,各所述收集器与所述网关中的一个或多个连接, 用于从各所述网关收集用户的网络访问信息,以及根据如前文所述的用户网络行为分析装置,所述用户网络行为分析装置与所述一个以上的收集器连接,基于所得到各个用户各自的网络访问信息,分析得到各用户的用户行为信息。进一步,该系统还包括,所述一个以上的网关根据用户身份标识信息或者用户主机标识信息为每个用户分配一个唯一标识符。与现有技术相比,本专利技术至少具有以下优点现有技术从各自网站出发,只能获取本网站的用户访问信息。本专利技术引入配置在不同网络位置的多个网关设备,可以获取用户的通过多个网关的所有通信网络报文,从而解决了现有技术中无法基于跨网通信的网络报文来分析用户网络行为的难题;本专利技术提出了基于通信网络报文信息来还原用户行为的方法,相比传统基于访问日志来还原用户行为的方法,本专利技术解决了传统的用户行为分析方法中无法对用户访问除本网站外的其他网站的行为进行分析和/或无法对单个用户跨网访问不同的网站的行为进行分析的难题。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的各实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中图1为现有技术中用户与网站服务器进行交互的示意图;图2为根据本专利技术实施例一的用户网络行为分析的流程图;图3为本专利技术实施例一中用户与网站服务本文档来自技高网
...

【技术保护点】
1.一种用户网络行为分析方法,其特征在于,包括以下步骤:步骤A:获取来自不同网络位置的一个以上网关的用户的网络访问信息;步骤B:对来自各所述网关的网络访问信息进行预处理,以获得各个用户各自的预处理后的网络访问信息;步骤C:分别基于步骤B所得到各个用户各自的预处理后的网络访问信息,分析得到各用户的用户行为信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:罗峰黄苏支李娜
申请(专利权)人:北京亿赞普网络技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1