一种基于通讯网络报文的网站网页评价系统技术方案

技术编号:6964429 阅读:377 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于通讯网络报文的网站网页评价系统,包括:报文分类模块、用户身份识别模块,用于根据分类后的报文及用户身份信息对用户在互联网上的行为进行还原的用户行为还原模块;用于存储行为还原模块还原的用户行为的用户行为库;提取用户行为库中的用户行为根据相关网站、网页进行统计整合的网站网页信息统计整合模块;用于根根网站网页信息统计整合模块处理过的信息从多个维度统计网站网页上各个用户行为的执行次数,从而实现对网站网页的评价的网站网页评价模块。本发明专利技术的基于通讯网络报文的网站网页评价系统的基于报文的分析方式,可以还原出用户对网站网页的各种访问行为,进行统计分析,对网站网页进行评价。

【技术实现步骤摘要】

本专利技术涉及网络用户特征分析领域,尤其涉及一种通过跨网网络报文对用户上网的各种行为进行关联分析、从而得到一个特定人群在特定时间内的上网特征的基于通讯网络报文的网站网页评价系统
技术介绍
随着互联网技术的发展,用户对互联网内容和应用服务的要求已经从海量演进为个性,如何精准的定位用户的行为特性和网站本身的内容特性和提供服务的级别,并将两者有机的结合起来是急需解决的问题和技术难点。目前用来分析用户上网特征的方法主要有以下几种第一,通过在少量用户电脑上装插件、客户端或者cookie,来收集各个网页的访问数据,从而对网站网页的流量、访问用户进行统计分析。这种方法技术门槛低,使用简便,是目前业内较通用的分析方法,该方案的一个最大缺陷是由于收集的用户数据较少,只能做抽样统计分析工作,无法完成深度数据分析。与此同时,由于客户端和cookie两种形式都存安装困难,有效期短的问题,在分析的准确度上存在问题。客户端的安装需要用户的支持和操作,一方面样本库完整性的建立是存在偏差的,同时在样本的数量上也会存在困难。如果强行给用户安装客户端,势必会给用户带来烦恼同时也会引起投诉。Cookie的植入也会因为有效期的问题而产生统计上的缺失。第二,利用网络爬虫技术,抓取网页,分析网页内容和网页之间的链接关系。通过分析网页内容,对网页进行分类、聚类或者关键词抽取。通过分析网页之间的链接关系,来衡量一个网页的重要程度。这种方法存在如下缺陷,首先,无法从用户维度出发,对网页进行分析,也无法对网页的流量特性和网页的目标受众进行评价。其次,需要网络爬虫、网页抽取、中心词抽取及链接分析等技术,需要消耗大量的运算存储资源。
技术实现思路
本专利技术的目的在于提供采用通讯报文分析方法来评价网站的基于通讯网络报文的网站网页评价系统。为了实现上述目的,本专利技术采用的技术方案如下本专利技术的基于通讯网络报文的网站网页评价系统,包括用于将原始报文数据进行归类的报文分类模块;用于通过对原始报文数据进行挖掘、识别用户身份的用户身份识别模块;用于根据报文分类模块分类后的报文及用户身份识别模块识别出的用户身份信息,对用户在互联网上的行为进行还原的用户行为还原模块;用于存储所述行为还原模块还原的用户行为的用户行为库;提取用户行为库中的用户行为根据相关网站、网页进行统计整合的网站网页信息统计整合模块;用于根根网站网页信息统计整合模块处理过的信息从多个维度统计网站网页上各个用户行为的执行次数,从而实现对网站网页的评价的网站网页评价模块。优选的,所述基于通讯网络报文的网站网页评价系统还包括关联分析模块用于提取用户行为库中的用户行为,采用关联分析的方法进行对分析,得出与网站或网页相关联的用户行为;分类模块用于提取关联分析模块提供网站网页关联的用户行为,作为网站网页特征向量的一部分,然后用数学模型对网站进行分类,得出网站网页所属的类别;所述的分类模块将分析得到的网站网页所属类别传递给网站网页信息统计整合模块进行整合,并由网站网页信息统计整合模块将整合后的数据传递给网站网页评价模块,用于其对网站网页进行评价。更优选的,所述基于通讯网络报文的网站网页评价系统还包括聚类模块通过关联分析模块提供的与网站网页关联的用户行为,作为网站网页特征向量的一部分,然后用数学模型对网站进行聚类,找出与目标网站网页相似的网站网页;所述的聚类模块将分析得到的与目标网站网页相似的网站网页传递给网站网页信息统计整合模块进行整合,并由网站网页信息统计整合模块将整合后的数据传递给网站网页评价模块,用于其对网站网页进行评价。优选的,所述基于通讯网络报文的网站网页评价系统还包括搜索关键词提取模块通过提取用户行为库中的搜索点击行为,分析搜索引擎带到某个具体网站的点击行为;分类模块用于将通过搜索关键词提取模块提取的搜索关键词,作为网站网页特征向量的一部分,然后用数学模型对网站进行分类,得出网站网页所属的类别;所述的分类模块将分析得到的网站网页所属类别传递给网站网页信息统计整合模块进行整合,并由网站网页信息统计整合模块将整合后的数据传递给网站网页评价模块,用于其对网站网页进行评价。更优选的,所述基于通讯网络报文的网站网页评价系统还包括聚类模块用于将通过搜索关键词提取模块提取的搜索关键词,作为网站网页特征向量的一部分,然后用数学模型对网站进行聚类,找出与目标网站网页相似的网站网页;所述的聚类模块将分析得到的与目标网站网页相似的网站网页传递给网站网页信息统计整合模块进行整合,并由网站网页信息统计整合模块将整合后的数据传递给网站网页评价模块,用于其对网站网页进行评价。优选的,所述基于通讯网络报文的网站网页评价系统还包括关联分析模块用于提取用户行为库中的用户行为,采用关联分析的方法进行对分析,得出与网站或网页相关联的用户行为,具体包括用户与网站关系信息;搜索关键词提取模块通过提取用户行为库中的搜索点击行为,分析搜索引擎带到某个具体网站的点击行为,得到查询词网站关系信息;分类模块基于所述的查询词网站关系,利用网站分类器对网站进行分类;用户兴趣挖掘模块通过用户与网站关系信息及网站分类信息,对用户进行兴趣分析,得到用户在每个类别上的频次信息,作为用户兴趣的特征数据;所述的用户兴趣挖掘模块,将得到的用户兴趣的特征数据发送给网站网页信息统计这个整合模块进行整合处理,所述的网站网页评价模块调用经整合处理的数据进行网站网页评价。优选的,所述的身份识别模块通过识别报文数据中是否携带的在用户客户端多个网站域下植入的统一的cookie来识别用户身份。优选的,所述的报文分类模块通过将报文数据输入报文分类器,有报文分类器计算得到将报文进行分类,所述的报文分类器中对应设置有报文类型及其对应的报文特征。优选的,所述的关联分析模块根据用户访问网站的日志信息,得到网站-关键词维度、网站-广告维度、网站-网站维度的关联关系。本专利技术的有益效果如下本专利技术的基于通讯网络报文的网站网页评价系统的基于报文的分析方式,可以还原出用户对网站网页的各种访问行为,进行统计分析,对网站网页进行评价。该评价系统有利于站长了解网站用户的群体特征,优化自己的网站。这种分析方式,还可以分析用户访问网站网页以外的行为,有利于站长了解与自己网站网页关系比较密切的其他信息,方便用户来优化自己的网站。附图说明图1为本专利技术的基于通讯网络报文的网站网页评价系统结构框图。 具体实施例方式下面结合附图和具体实施例对本专利技术的技术方案和有益效果进一步进行阐述。本专利技术的系统实施时需要在多个地理位置部署网关,获取通过网关的所有用户的通信网络报文,基于这些报文,进行处理,实现对网站网页的评价,具体的,参见附图1,网关采集到的原始报文被发送到报文分类模块进行分类,一个正常的页面访问通常包含了大量的请求报文,其中包括正常页面报文、广告报文、搜索报文等一系列报,报文分类模块的作用就是将接收的原始报文进行归类,同时,为了更好的了解用户的行为,需要通过用户身份识别模块来对报文数据进行挖掘,识别每份报文发送者的身份,用户行为还原模块根据分类后的报文及识别的用户身份对用户行为进行还原,还原出用户在互连网上的浏览行为、 搜索行为、点击行为、注册行为等等,还原出的行为被存储到用户行为库,供其他的分析模块使用。在本专利技术的一些实施例中本文档来自技高网
...

【技术保护点】
1.基于通讯网络报文的网站网页评价系统,其特征在于,包括:用于将原始报文数据进行归类的报文分类模块;用于通过对原始报文数据进行挖掘、识别用户身份的用户身份识别模块;用于根据报文分类模块分类后的报文及用户身份识别模块识别出的用户身份信息,对用户在互联网上的行为进行还原的用户行为还原模块;用于存储所述行为还原模块还原的用户行为的用户行为库;提取用户行为库中的用户行为根据相关网站、网页进行统计整合的网站网页信息统计整合模块;用于根根网站网页信息统计整合模块处理过的信息从多个维度统计网站网页上各个用户行为的执行次数,从而实现对网站网页的评价的网站网页评价模块。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘书良罗峰黄苏支李娜王琪张玉波阎飞飞刘生姚震环
申请(专利权)人:北京亿赞普网络技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1