网页呈现方法和装置制造方法及图纸

技术编号:4049681 阅读:226 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种网页呈现方法和装置。该方法包括:对网页中的各条链接按照兴趣关联规则计算兴趣度,标示兴趣度高于指定值的链接得到新网页;呈现新网页;其中,通过对用户的历史访问记录进行数据挖掘确定兴趣关联规则。根据本发明专利技术,解决了网页显示慢的问题,提高了用户体验的满意度。

【技术实现步骤摘要】

本专利技术涉及移动通讯领域,尤其涉及一种网页呈现方法和装置
技术介绍
随着3G时代的到来,手机互联网用户的增加,用户对手机浏览器的要求也越来越 高,但是由于手机浏览器受到屏幕大小和硬件配置等限制,手机屏幕只能显示网页上的一 部分信息。并且现在的手机浏览器对于网页的滚动浏览,都是按照网页链接的先后顺序进 行的。如果用户想看到感兴趣的内容,需要不断地拖动滚动条,才能找到用户感兴趣的网页 链接。特别是在浏览一个比较大的网页时,需要的时间将会比较长,而且找到用户感兴趣的 内容将会更费时间,影响了用户的使用,降低了用户体验。
技术实现思路
本专利技术的主要目的在于提供一种网页呈现方法和装置,以至少解决上述的问题。根据本专利技术的一个方面,提供了一种网页呈现方法,包括对网页中的各条链接按 照兴趣关联规则计算兴趣度;标示兴趣度高于指定值的链接得到新网页;呈现新网页;其 中,通过对用户的历史访问记录进行数据挖掘确定兴趣关联规则。根据本专利技术的另一方面,提供了一种网页呈现装置,包括兴趣度计算模块,用于 对网页中的各条链接按照兴趣关联规则计算兴趣度;网页标示模块,用于标示兴趣度高于 指定值的链接得到新网页;呈现模块,用于呈现所述新网页;其中,通过对用户的历史访问 记录进行数据挖掘确定所述兴趣关联规则。通过本专利技术,采用根据用户的历史访问记录确定各个链接的兴趣度,对兴趣度高 的链接进行标示,使用户能够快速浏览到感兴趣的内容,解决了浏览大网页速度慢的问题, 进而达到了提升用户体验的效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中图1是根据本专利技术实施例1的网页呈现方法的流程图;图2是根据本专利技术实施例2的网页呈现方法的流程图;图3是根据本专利技术实施例3的网页呈现装置的结构框图;以及图4是根据本专利技术实施例3的网页呈现装置的具体结构框图。具体实施例方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的 情况下,本申请中的实施例及实施例中的特征可以相互组合。移动终端(例如手机)等设备的显示界面有限,而网页中的内容越来越丰富,导致4不能在设备的显示界面上一次显示整个网页,需要分多页显示。基于此,本专利技术实施例提供 了一种网页呈现方法和装置,以下实施例以在移动终端上实现网页呈现为例进行说明。实施例1图1示出了根据本专利技术实施例的网页呈现方法流程图,该方法包括以下步骤步骤S102,对网页中的各条链接按照兴趣关联规则计算兴趣度,其中,通过对用户 的历史访问记录进行数据挖掘确定兴趣关联规则;上述兴趣关联规则可以在每次用户打开浏览器时进行确定,具体可以采用浏览器 打开后,读取该浏览器缓存中的历史网页数据;对历史网页数据进行数据挖掘,得到兴趣关 联规则。也可以在用户打开浏览器时到指定存储区读取,该指定存储区中兴趣关联规则可 以按照一定的时间进行更新,也可以统计用户打开网页的次数,当打开网页的次数达到设 定次数时进行更新。步骤S104,标示兴趣度高于指定值的链接得到新网页;例如,按照兴趣度对各条链接进行排序;从链接的排序结果中提取出兴趣度高于 指定值的网页链接,用指定颜色标示提取出的网页链接得到新网页。步骤S106,呈现该新网页。相关技术中在呈现网页时,直接按照网页原有的内容进行显示,当设备的屏幕比 较小而网页又比较大时,用户能够浏览到感兴趣的内容将会耗时较长。本实施例在呈现网 页时,根据用户访问的历史记录确定各个链接的兴趣度,对兴趣度高的链接进行标示,使用 户能够快速浏览到感兴趣的内容,提高了用户浏览网页的速度,进而提高了用户体验的满思度。实施例2本实施例提供了一种网页呈现方法,该方法以在手机上实现为例进行说明。参见 图2,该方法包括以下步骤步骤S202,用户打开浏览器,保存手机浏览器缓存中的历史网页数据;例如读取浏览器缓存中的历史网页数据,把历史网页数据保存到相应存储区;步骤S204,对保存的历史网页数据进行数据预处理;本实施例的数据预处理过程可以完成数据分析及数据抽取、数据处理、数据变换。 例如,对WWW数据模型表示的Cache (缓存)中的数据进行处理,主要完成词干抽取、词条切 分等类似的处理;步骤S206,对数据预处理后得到的数据进行数据挖掘,得到该用户的兴趣关联规 则;本实施例数据挖掘过程中使用的挖掘算法如下所述,该数据挖掘过程包括以下阶 段(1)将兴趣词条定义为节点,节点以二元组(t,weight)表示,简记为Node (t),其 中,weight为词条t的权重;weight =新鲜度X频度忧)。新鲜度反映兴趣词条存在时间的长短,最近访问页面中的兴趣词条的新鲜度相对 较高,在预测过程中,越是最近访问的页面中的兴趣词条对预测起的作用越大。新鲜度可以 等于保存该词条的时间,也可以与保存时间具有一定的线性关系。5&为词条在页面中出现的频度,例如,某个词条在一个页面中出现了 8次,该页面 中总的词条数为100(包括重复),则fi = 8/100。其中,兴趣词条可以是娱乐、体育、新闻、天气、咨询和财经等。(2)定义节点之间的联系为兴趣关联规则,用三元组表示,简记为Rule ,其中,support称为关联支持度,表示由 节点NodeUi)转到节点Node (tj)的可能性;(3)数据预处理,对页面集合C中的各页面抽取词干,并进行词干切分,对应地得 到页面Yk的词条集合K (Yk) = {(V ,weight) Iti' eT(汉语词汇),ieN(自然数)};K(Yk)表示在Yk页面中出现的所有的兴趣词条的集合,t/为其中一个词条。缓存(Cache)中的历史网页数据通常采用WWW数据模型表示,根据具体实现还可 能对WWW数据模型的历史网页数据进行数据格式转换,转换为所需要的数据格式。词干的抽取和切分可以参考IEEE(美国电气和电子工程师协会)的数据挖掘在网 页予页取中的应用(application of data mining in Webpre-fetching)。(4)从页面集合C中的各页面Yk中提取该页面的链接点,得到页面的链接点集合 L(Yk) = {lk, i Ilkii为页面Yk中的链接点};链接集合表示Yk页面中所有的可以链接进入的链接点的集合,通过点击Yk页面里 的链接就可以进入下一个页面。(5)提取页面的链接点的同时,获取链接点的链接词干,对链接词干进行切分,得 到页面中链接点lk,i的链接词条集合Q(Ik^string) = {tj" Itj"在Ik^string中,j e N};Q (lk, i. string)表示对Yk中的某个链接lk, i对其链接词干进行切分后得到的词条的 皇A朱口 ο通过以上的数据处理得到了四种集合,分别为页面集合、页面的词条集合、页面 的链接点集合以及页面中链接点的链接词条集合。得到四种集合是为了下面计算兴趣关联 规则,即从一个词条转移到另一个词条的可能性,进而在计 算出从一个页面转移到其中某个链接的可能性。(6)生成兴趣关联规则,兴趣关联规则的集合构成兴趣关联知识库;生成兴趣关联规则的具体过程包括遍历页面集合C,对于页面Yk遍历该页面中的链接集合L(Yk),逐一判断其本文档来自技高网...

【技术保护点】
一种网页呈现方法,其特征在于,包括:对网页中的各条链接按照兴趣关联规则计算兴趣度;标示兴趣度高于指定值的链接得到新网页;呈现所述新网页;其中,通过对用户的历史访问记录进行数据挖掘确定所述兴趣关联规则。

【技术特征摘要】

【专利技术属性】
技术研发人员:阚光远
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1