一种网络审计中的数据分析系统及其方法技术方案

技术编号:2836120 阅读:231 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种网络审计中的数据分析系统,其包括依次连接的数据获取模块、统计分析模块及存储模块,所述数据获取模块用于接收网络数据,并从中提取出用户搜索关键字,统计分析模块接收所述搜索关键词并在存储模块中进行比对查找,根据查找结果相应建立或修改所述搜索关键词统计项值。本发明专利技术还提供一种网络审计中的数据分析方法。由于本发明专利技术网络审计中的数据分析系统及其方法通过提取网络审计的上网数据中搜索关键字,并进行统计分析排序,可通过统计分析结果反映人们当前的兴趣趋向和关心的事物,提高网络审计产品的使用价值。

【技术实现步骤摘要】

本专利技术涉及,尤其涉及一种网络审计中的对搜索关键字数据进行分析的系统及其方法。
技术介绍
随着科学技术的发展,互联网络广泛应用于人们的工作和生活,在网络审计里的数据分析方法中一个非常重要的内容就是对人们上网行为规律的归纳和统计。网络用户输入的搜索关键字,即用户向网络搜索引擎输入框输入的字/词或者是几个词的组合,目前网络搜索引擎主要包括WWW.GOOGLE.COM的GOOGLE搜索引擎,WWW.GOOGLE.CN的谷歌中国搜索引擎,WWW.BAIDU.COM的百度搜索引擎,WWW.YAHOO.COM.CN的雅虎中国搜索引擎等。通过对这些搜索关键字的分析,可以看到最近一段时期内人们最关心的事物是什么,通过对这些搜索关键字的分析和统计,可以在一定程度上反应人们当前的兴趣趋向,从而能进一步提高网络审计产品的使用价值。然而,目前现有的网络审计产品还无法针对搜索关键字进行分析和统计。
技术实现思路
为了克服现有网络审计产品无法针对搜索关键字进行分析和统计的不足,本专利技术提供一种网络审计中的数据分析系统,其可反映人们当前的兴趣趋向和关心的事物。本专利技术另一个所要解决的技术问题是提供一种网络审计中的数据分析方法,其可反映人们当前的兴趣趋向和关心的事物。为解决上述技术问题,本专利技术所采用的技术方案是提供一种网络审计中的数据分析系统,所述数据分析系统包括依次连接的数据获取模块、统计分析模块及存储模块,所述数据获取模块用于接收网络数据,并从中提取出用户搜索关键字,统计分析模块接收所述搜索关键词并在存储模块中进行比对查找,根据查找结果相应建立或修改所述搜索关键词统计项值。所述数据分析系统还包括与存储模块连接的统计查看模块,其访问存储模块,并根据所述搜索关键字的统计项值顺序排列搜索关键字。所述存储模块为数据库或者存储文件。所述数据获取模块在提取搜索关键字时,还提取与该搜索关键字对应的搜索引擎类别信息,统计分析模块根据查找结果相应建立或修改所述类别中搜索关键字的统计项值。为解决上述另一个技术问题,本专利技术采用如下技术方案提供一种网络审计中的数据分析方法,所述方法包括以下步骤接收网络审计中的上网数据,从上网数据中提取搜索关键字,将所述搜索关键字与数据库存储数据进行比对查找,根据查找结果相应建立或修改所述搜索关键词统计项值。所述数据分析方法还包括根据统计项值顺序排列搜索关键字的步骤。所述从上网数据中提取搜索关键字时,还提取与该搜索关键字对应的搜索引擎类别信息。所述从上网数据中提取搜索关键字是通过查找不同搜索引擎URL地址中对应搜索关键字的字段的首尾定义字符,即可提取出搜索关键字数据。所述将所述搜索关键字与数据库存储数据进行比对查找的步骤包括先比对查找是否存在所述的搜索引擎类别信息,若无则新生成该类别并把该搜索关键字存储到该类别中,并设置建立该搜索关键字统计项初始值;若有则比对查找该类别中是否存在所述的搜索关键字,若无则把该搜索关键字存储到该类别中,并设置建立该搜索关键字统计项初始值,若有则修改该搜索关键字统计项值。所述数据分析方法还包括根据不同搜索引擎类别信息中的统计项值分别顺序排列搜索关键字的步骤。本专利技术的有益效果在于本专利技术网络审计中的数据分析系统及其方法通过提取网络审计的上网数据中搜索关键字,并进行统计分析排序,可通过统计分析结果反映人们当前的兴趣趋向和关心的事物,提高网络审计产品的使用价值。附图说明图1是本专利技术网络审计中的数据分析系统的网络应用示意图;图2是本专利技术网络审计中的数据分析系统的原理示意图;图3是本专利技术网络审计中的数据分析方法的工作流程示意图;具体实施方式请参阅图1,本专利技术网络审计中的数据分析系统10与网络服务器20连接,数据分析系统10通过网络服务器20提取连接在网络服务器20的多个计算机终端31、32、33、34的网络数据中的搜索关键字,获取到搜索关键字后,对上述关键进行统计排名,按照用户使用搜索关键字的次数由高至低进行排名。因目前人们通常都是通过网页访问搜索引擎的,并且搜索关键字是通过HTTP协议格式的数据传输到搜索引擎,以下即以HTTP协议格式的数据为例说明本专利技术网络审计中的数据分析系统及其方法的实施例。请一并参阅图2,本专利技术网络审计中的数据分析系统10包括依次连接的数据获取模块11、统计分析模块12、存储模块13(本实施例为数据库或存储文件)及统计查看模块14。其中数据获取模块11与网络审计系统(图未示)中的网络数据捕获模块40连接,并接收网络数据捕获模块40发送过来的上网行为数据,然后从这些数据中分析并提取出搜索关键字。本实施例数据获取模块11分析并提取出搜索关键字的方法包括首先,确定获取到的HTTP数据包的提交方式为GET;其次,确定HTTP数据包中包含的URL地址含有WWW.GOOGLE.COM或者www.google.com,WWW.GOOGLE.CN或者www.google.cn,WWW.BAIDU.COM或者www.baidu.com,WWW.YAHOO.COM.CN或者www.yahoo.com.cn等搜索引擎网址的其中之一,再根据包含的字符串对该数据包进行分类,将URL地址含有WWW.GOOGLE.COM或者www.google.com这样的字符串的归为GOOGLE搜索引擎类,将URL地址含有WWW.GOOGLE.CN或者www.google.cn这样的字符串的归为谷歌中国搜索引擎类,将URL地址含有WWW.BAIDU.COM或者www.baidu.com这样的字符串的归为BAIDU/百度搜索引擎类,将URL地址含有WWW.YAHOO.COM.CN或者www.yahoo.com.cn这样的字符串的归为YAHOO/雅虎中国搜索引擎类,并以此类推对包含不同的搜索引擎字符串的数据包进行归类,由此,如果在HTTP数据包里发现搜索关键字,可按照上面的划分的类别对这些关键字进行分类,比如同样的“鲜花”搜索关键字可能是从YAHOO/雅虎中国搜索引擎获取的或者从谷歌中国搜索引擎获取的,通过上述分类以示区别;再次,从HTTP数据包包含的URL地址中提取出搜索关键字,若搜索引擎为BAIDU/百度类,则先提取URL地址中最后一个“/”以后的数据,然后查找这些数据里是否包含“s ”,如果包含则再查找这些数据是否包含“wd=”,如果包含则取出从“wd=”以后到遇到的第一个“&”以前的所有数据,这些数据就是搜索关键字;若搜索引擎为GOOGLE/谷歌类,则先提取URL地址中最后一个“/”以后的数据,然后查找这些数据里是否包含“search ”,如果包含则再查找这些数据是否包含“q=”,如果包含则取出从“q=”以后到遇到的第一个“&”以前的所有数据,这些数据就是搜索关键字;若搜索引擎为YAHOO/雅虎中国搜索类,则先提取URL地址中最后一个“/”以后的数据,然后查找这些数据里是否包含“search ”,如果包含则再查找这些数据是否包含“p=”,如果包含则取出从“p=”以后到遇到的第一个“&”以前的所有数据,这些数据就是搜索关键字。可以理解,通过查找不同搜索引擎URL地址中对应搜索关键字的字段的首尾定义字符,即可提取出搜索关键字数据。通过上述步骤,即可把搜索关键字从HTTP本文档来自技高网...

【技术保护点】
一种网络审计中的数据分析系统,其特征在于:所述数据分析系统包括依次连接的数据获取模块、统计分析模块及存储模块,所述数据获取模块用于接收网络数据,并从中提取出用户搜索关键字,统计分析模块接收所述搜索关键词并在存储模块中进行比对查找,根据查找结果相应建立或修改所述搜索关键词统计项值。

【技术特征摘要】

【专利技术属性】
技术研发人员:阮伟军林飞申屠青春
申请(专利权)人:深圳市中科新业信息科技发展有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1