页面归并方法及装置制造方法及图纸

技术编号:9738696 阅读:111 留言:0更新日期:2014-03-06 17:12
本发明专利技术提供了一种页面归并方法及装置,该方法包括:对浏览过的页面进行排序;根据所述第一规则对排序之后的页面进行第一次编号得到第一编号序列;根据第二规则对排序之后的页面进行第二次编号得到第二编号序列;比较所述第一编号序列和所述第二编号序列确定所述浏览过的页面中的重复刷新的页面;根据所述重复刷新的页面从所述浏览过的页面中进行去重处理。通过本发明专利技术解决了现有技术中在出现连续相同的浏览页面时,去重效率低的问题,进而提高了操作效率。

【技术实现步骤摘要】
页面归并方法及装置
本专利技术涉及网络领域,具体而言,涉及一种页面归并方法及装置。
技术介绍
路径归并:指我们要从用户的页面浏览转化为路径浏览,页面浏览是指用户的每一个页面的访问,路径浏览是指用户浏览网站的路径,即先看了什么再看了什么,中间刷新的重复页面访问会被认为是同一路径。举例说明:用户浏览页面顺序为a—>b->b->b->c->b->b->d,由浏览页面最终归并的路径浏览为:a->b>c->b->d。注:数字代表在此路径上用户的页面浏览数量。关于上面的路径去重,传统的方法一般采用页面浏览数据表,先根据浏览时间在各会话内部进行排序,即会话内的页面访问顺序(AccessOrder),再根据AccessOrder进行页面浏览数据表的自已和自己的表连接,条件为表I的AccessOrder+Ι=表2的AccessOrder,即通过表连接庞大的开销来找到该页面的下一个页面访问,若判断是一样的,则进行去重,当然这样表连接一次,只能对路径重复去重一次,像上面示例的路径访问里,存在连续的3个b页面的访问,故而需要两次重复上面的表连接操作,去掉2个重复的b。可以看出这样通过递归循环计算的方式性能很糟糕,且循环的次数为最大的路径重复页面数减一次。且每次都需要做整个表连接和去重操作。性能很不稳定,且很低效。针对相关技术中的在出现连续相同的浏览页面时,去重效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
针对现有技术中在出现连续相同的浏览页面时,去重效率低的问题,本专利技术提供了页面归并方法及装置,以至少解决上述问题。根据本专利技术的一个方面,提供了一种页面归并方法,包括:对浏览过的页面进行排序;根据所述第一规则对排序之后的页面进行第一次编号得到第一编号序列;根据第二规则对排序之后的页面进行第二次编号得到第二编号序列;比较所述第一编号序列和所述第二编号序列确定所述浏览过的页面中的重复刷新的页面;根据所述重复刷新的页面从所述浏览过的页面中进行去重处理。优选地,根据所述第一规则对排序之后的页面进行第一次编号得到第一编号序列包括:根据用户浏览的时间顺序对所述浏览过的页面进行第一次编号得到所述第一编号序列。优选地,根据所述第二规则对浏览过的页面进行排序包括:根据页面标识对所述浏览过的页面进行所述第二次编号得到所述第二编号序列,其中,根据所述页面标识进行排序包括:按照页面标识出现的次序对页面标识对应页面进行编号,对于同一页面标识对应的多个页面编号完毕之后再对下一出现的页面标识对应的页面进行编号。优选地,比较所述第一编号序列和所述第二编号序列确定所述浏览过的页面中的重复刷新的页面包括:将所述第一编号序列和所述第二编号序列相减,对于同一页面标识的页面存在连续的η个相同的差值,则说明具有η个重复刷新的页面。优选地,根据所述重复刷新的页面从所述浏览过的页面中进行去重处理包括:对于多个重复刷新的页面仅保留一个,并标示出所述多个重复刷新的页面的数量。根据本专利技术的另一方面,提供了一种页面归并装置,包括:排序模块,用于对浏览过的页面进行排序;第一编号模块,用于根据所述第一规则对排序之后的页面进行第一次编号得到第一编号序列;第二编号模块,用于根据第二规则对排序之后的页面进行第二次编号得到第二编号序列;确定模块,用于比较所述第一编号序列和所述第二编号序列确定所述浏览过的页面中的重复刷新的页面;处理模块,用于根据所述重复刷新的页面从所述浏览过的页面中进行去重处理。优选地,所述第一编号模块用于根据用户浏览的时间顺序对所述浏览过的页面进行第一次编号得到所述第一编号序列。优选地,所述第二编号模块用于根据页面标识对所述浏览过的页面进行所述第二次编号得到所述第二编号序列,其中,根据所述页面标识进行排序包括:按照页面标识出现的次序对页面标识对应页面进行编号,对于同一页面标识对应的多个页面编号完毕之后再对下一出现的页面标识对应的页面进行编号。优选地,所述确定模块用于将所述第一编号序列和所述第二编号序列相减,对于同一页面标识的页面存在连续的η个相同的差值,则说明具有η个重复刷新的页面。优选地,所述处理模块用于对于多个重复刷新的页面仅保留一个,并标示出所述多个重复刷新的页面的数量。通过本专利技术,采用对浏览过的页面进行排序,然后根据第一规则对排序之后的页面进行第一次编号得到第一编号序列以及根据第二规则对排序之后的页面进行第二次编号得到第二编号序列,再通过比较第一编号序列和第二编号序列确定所述浏览过的页面中的重复刷新的页面,将重复刷新的页面从浏览过的页面中进行去重处理,解决了现有技术中在出现连续相同的浏览页面时,去重效率低的问题,进而提高了操作效率。【附图说明】此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的页面归并装置的流程图;图2是根据本专利技术实施例的页面归并装置的结构示意图;图3是根据本专利技术优选实施例的页面归并装置的流程图;图4是根据本专利技术优选实施例的页面归并装置的结构示意图。【具体实施方式】下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。在本实施例中,提供了一种页面归并方法,图1是根据本专利技术实施例的页面归并方法的流程图,如图1所示,该方法的步骤包括:步骤S102:对浏览过的页面进行排序。步骤S104:根据第一规则对排序之后的页面进行第一次编号得到第一编号序列。步骤S106:根据第二规则对排序之后的页面进行第二次编号得到第二编号序列。步骤S108:比较第一编号序列和第二编号序列确定浏览过的页面中的重复刷新的页面。步骤SllO:根据所述重复刷新的页面从浏览过的页面中进行去重处理。通过上述实施例的方法,通过两次不同的编号方式进行编号进而通过第一编号序列和第二编号序列的比较可以一次性的找到重复的页面,进而进行去重处理,因此,解决了现有技术中在出现连续相同的浏览页面时去重效率低的问题,进而提高了操作效率。上述步骤S104和步骤S106中的第一规则和第二规则可以有很多种方式,本实施例中提供了两种优选的方式,这种优选实施方式可以单独实施也可以结合使用。下面对这两种优选实施方式进行说明。优选实施方式一,可以根据用户浏览的时间顺序对浏览过的页面进行第一次编号得到第一编号序列。优选实施方式二,可以根据页面标识对浏览过的页面进行第二次编号得到第二编号序列,其中,根据页面标识进行排序包括:按照页面标识出现的次序对页面标识对应页面进行编号,对于同一页面标识对应的多个页面编号完毕之后再对下一出现的页面标识对应的页面进行编号。例如,用户浏览了首先浏览了 a页面,然后浏览了两次b页面,然后浏览了两次c页面,最后浏览了一次b页面,那么,a页面可以编号为O; —共浏览了三次b页面,可以编号为1、2、3,浏览了两次c页面,可以编号为4、5。因此,得到的序列为0、1、2、4、5、3。在上述图1示出的步骤以及上述两种优选的实施方式中,可以采用相减的方式来得到重复刷新的页面。即优选地,上述步骤S108可以包括:将第一编号序列和第二编号本文档来自技高网...
页面归并方法及装置

【技术保护点】
一种页面归并方法,其特征在于,包括:对浏览过的页面进行排序;根据所述第一规则对排序之后的页面进行第一次编号得到第一编号序列;根据第二规则对排序之后的页面进行第二次编号得到第二编号序列;比较所述第一编号序列和所述第二编号序列确定所述浏览过的页面中的重复刷新的页面;根据所述重复刷新的页面从所述浏览过的页面中进行去重处理。

【技术特征摘要】
1.一种页面归并方法,其特征在于,包括: 对浏览过的页面进行排序; 根据所述第一规则对排序之后的页面进行第一次编号得到第一编号序列; 根据第二规则对排序之后的页面进行第二次编号得到第二编号序列; 比较所述第一编号序列和所述第二编号序列确定所述浏览过的页面中的重复刷新的页面; 根据所述重复刷新的页面从所述浏览过的页面中进行去重处理。2.根据权利要求1所述的方法,其特征在于,根据所述第一规则对排序之后的页面进行第一次编号得到第一编号序列包括: 根据用户浏览的时间顺序对所述浏览过的页面进行第一次编号得到所述第一编号序列。3.根据权利要求1或2所述的方法,其特征在于,根据所述第二规则对浏览过的页面进行排序包括: 根据页面标识对所述浏览过的页面进行所述第二次编号得到所述第二编号序列,其中,根据所述页面标识进行排序包括:按照页面标识出现的次序对页面标识对应页面进行编号,对于同一页面标识对应的多个页面编号完毕之后再对下一出现的页面标识对应的页面 进行编号。4.根据权利要求3所述的方法,其特征在于,比较所述第一编号序列和所述第二编号序列确定所述浏览过的页面中的重复刷新的页面包括: 将所述第一编号序列和所述第二编号序列相减,对于同一页面标识的页面存在连续的η个相同的差值,则说明具有η个重复刷新的页面。5.根据权利要求1至4中任一项所述的方法,其特征在于,根据所述重复刷新的页面从所述浏览过的页面中进行去重处理包括: 对于多个重复...

【专利技术属性】
技术研发人员:洪超杨基彬
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1