网页的处理方法/系统、计算机可读存储介质及电子设备技术方案

技术编号:18445057 阅读:30 留言:0更新日期:2018-07-14 10:26
本发明专利技术提供一种网页的处理方法/系统、计算机可读存储介质及电子设备,网页的处理方法包括:统计用户在使用网页过程中在网页间跳转的跳转记录;根据所述跳转记录,计算用户从当前网页跳转至下一跳网页的跳转概率;根据所述跳转概率,则对所述下一跳网页执行相应的处理操作。本发明专利技术通过统计分析用户使用习惯,智能预测并进行网页预处理,以分析出用户习惯,预测该用户接下来导航打开别的链接的可能性,针对性的根据预测可能性,进行网页预处理,从而提升用户体验。

Webpage processing method / system, computer readable storage medium and electronic equipment

The invention provides a method / system for a web page, a computer readable storage medium and an electronic device. The method of processing a web page includes: statistical users are counting the jump records that jump between web pages in the process of using a web page; and the jump probability of a user's jump from the current web page to the next hop page is calculated according to the jump record; According to the jump probability, the corresponding processing operation of the next hop web page is performed. Through statistical analysis of users' usage habits, intelligent prediction and preprocessing of web pages, the invention can analyze the user's habits, predict the possibility of the user's next navigation to open other links, and preprocess the web page according to the prediction possibility, thus improving the user experience.

【技术实现步骤摘要】
网页的处理方法/系统、计算机可读存储介质及电子设备
本专利技术属于网页处理
,涉及一种处理方法和系统,特别是涉及一种网页的处理方法/系统、计算机可读存储介质及电子设备。
技术介绍
浏览器能够快速打开网页始终是用户的强需求。随着用户终端设备性能的提升、网络性能的提升、渲染技术的优化提升,浏览器加载网页的速度也在逐步提升着,同时,在策略方面,也会有一些用空间换取时间的方法。以谷歌浏览器为代表,应用了一些诸如DNS预解析、TCP预连接、网页预渲染等先进技术,试图在用户真正触发导航之前,提前在后台做一些预处理工作,用空间换时间,以期减少用户等待时间,提升速度。但是,这项技术的推广使用受限于一个瓶颈因素:如何预测用户下一步期望访问的页面是什么,从而针对性的做这些预处理工作。毕竟这些预处理是需要耗费一定的网络资源、内存空间和计算成本的,所以有效的预测准确率支持是该技术能够应用的前提。目前已有的一些预测策略包括:1、用户在地址栏输入地址时,根据历史输入内容,预测接下来会输入的网址,进行自动匹配并且触发网页预处理。2、网站开发者在网页中加入"dns-prefech"的标记,指导浏览器进行预处理。用户访问网页的途径中,除了地址栏输入网址访问外,通过页面<a>标签链接点击的方式占用很大比例,因此,上述策略1具有很大的局限性。策略2中网站开发者进行的工作只能针对一些“普适”的情景,无法针对每个用户的使用习惯进行智能控制。如何有效利用用户的使用习惯而做出精准的预处理,将会是一个颇有意义的挑战。因此,如何提供一种网页的处理方法/系统、计算机可读存储介质及电子设备,以解决现有技术无法有效利用用户的使用习惯,导致预测局限,预测精准性差等缺陷,实已成为本领域技术人员亟待解决的技术问题。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种网页的处理方法/系统、计算机可读存储介质及电子设备,用于解决现有技术无法有效利用用户的使用习惯,导致预测局限,预测精准性差的问题。为实现上述目的及其他相关目的,本专利技术一方面提供一种网页的处理方法,包括:统计用户在使用网页过程中在网页间跳转的跳转记录;根据所述跳转记录,计算用户从当前网页跳转至下一跳网页的跳转概率;根据所述跳转概率,则对所述下一跳网页执行相应的处理操作。于本专利技术的一实施例中,所述统计用户在使用网页过程中在网页间跳转的跳转记录的步骤包括:捕捉用户在使用网页过程中的使用行为,并通过一有向图统计所述跳转记录;其中,所述有向图中包括顶点,有向边及有向边的权重;所述顶点表示一网页,用以记录用户访问的统一资源定位符,统一资源定位符作为所述顶点的唯一标识;所述有向边用于标记用户由一顶点通过标签跳转到另一顶点;所述权重用于记录用户由一顶点通过标签跳转到另一顶点的跳转次数。于本专利技术的一实施例中,所述统计用户在使用网页过程中在网页间跳转的跳转记录的步骤还包括:当用户待访问所述网页时,通过所述统一资源定位符在所述有向图中查找,若所述有向图中不存在待访问的网页时,在所述有向图中新增顶点,并记录其初始化访问次数为1;若所述有向图中存在待访问的网页时,将该顶点的访问次数加1。于本专利技术的一实施例中,所述统计用户在使用网页过程中在网页间跳转的跳转记录的步骤还包括:当用户从一顶点跳转到另一顶点时,若所述有向图中不存在从一顶点跳转到另一顶点的有向边,则在所述有向图中新增该有向边,并初始化该有向边的权重为1;若所述有向图中存在从一顶点跳转到另一顶点的有向边,将该有向边的权重加1。在统计用户在使用网页过程中在网页间跳转的跳转记录的步骤之后,所述网页的处理方法还包括:判断用户在网页区停留的时间是否达到一预定时间间隔,若是,则读取所述跳转记录,根据所述跳转记录,计算用户从当前网页跳转至下一跳网页的跳转概率;若否,则取消相应的处理操作。于本专利技术的一实施例中,在统计用户在使用网页过程中在网页间跳转的跳转记录的步骤之后,所述网页的处理方法还包括:判断用户离开网页区的时间是否达到另一预定时间间隔,若是,则取消相应的处理操作。于本专利技术的一实施例中,用户从当前网页跳转至下一跳网页的跳转概率的计算公式为:从当前网页跳转至下一跳网页的跳转概率=用户由用于表示当前网页的顶点通过标签跳转到用于表示下一跳网页的另一顶点的有向边的权重/所述所述用于表示当前网页的顶点的访问次数。于本专利技术的一实施例中,所述根据所述跳转概率,则对所述下一跳网页执行相应的处理操作的步骤包括:根据所述跳转概率及用于表示下一跳网页的另一顶点标识的所述统一资源定位符进对下一跳网页进行相应级别的预处理;查看统一资源定位符是否在已完成的预处理列表中,若是,则表示该预处理为有效的,预测命中下一跳网页,对下一跳网页进行加速;若否,则预测未命中下一跳网页,进行下一跳网页的页面加载请求和页面渲染,并清理预处理占用的内存资源。于本专利技术的一实施例中,所述对下一跳网页进行相应级别的预处理的步骤包括:DNS预解析、TCP预连接以及网页预渲染;DNS预解析对应第一概率阈值;TCP预连接对应第二概率阈值;网页预渲染对应第三概率阈值;若所计算的跳转概率大于所述第一概率阈值,则对所述下一跳网页进行DNS预解析;若所计算的跳转概率大于所述第二概率阈值,则对所述下一跳网页进行TCP预连接;若所计算的跳转概率大于所述第三概率阈值,则对所述下一跳网页进行网页预渲染;若所计算的跳转概率小于所述第一概率阈值、所述第二概率阈值或所述第三概率阈值,则取消预处理。本专利技术另一方面提供一种网页的处理系统,包括:统计模块,用于统计用户在使用网页过程中在网页间跳转的跳转记录;计算模块,用于根据所述跳转记录,计算用户从当前网页跳转至下一跳网页的跳转概率;处理模块,用于根据所述跳转概率,则对所述下一跳网页执行相应的处理操作。于本专利技术的一实施例中,所述网页的处理系统还包括与所述统计模块耦合的控制模块;所述控制模块用于判断用户在网页区停留的时间是否达到一预定时间间隔,若是,则通知所述计算模块读取所述跳转记录,根据所述跳转记录,计算用户从当前网页通过统一资源定位符跳转至下一跳网页的跳转概率;若否,则通知所述处理模块取消相应的处理操作;所述控制模块还用于判断用户离开网页区的时间是否达到另一预定时间间隔,若是,则通知所述处理模块取消相应的处理操作。于本专利技术的一实施例中,所述处理模块包括网页预处理单元;所述网页预处理单元用于根据所述跳转概率及用于标识下一跳网页的另一顶点的所述统一资源定位符对下一跳网页进行相应级别的预处理;若所述计算模块计算的跳转概率大于预存的第一概率阈值,则所述控制模块通知所述网页预处理单元对所述下一跳网页进行DNS预解析;若所述计算模块计算的跳转概率大于预存的第二概率阈值,则所述控制模块通知所述网页预处理单元对所述下一跳网页进行TCP预连接;若所述计算模块计算的跳转概率大于预存的第三概率阈值,则所述控制模块通知所述网页预处理单元对所述下一跳网页进行网页预渲染;若所述计算模块计算的跳转概率小于预存的第一概率阈值、所述第二概率阈值或所述第三概率阈值,则所述控制模块通知所述网页预处理单元取消预处理。于本专利技术的一实施例中,所述处理模块还包括网页处理单元和预处理管理单元;所述网页处理单元本文档来自技高网
...

【技术保护点】
1.一种网页的处理方法,其特征在于,包括:统计用户在使用网页过程中在网页间跳转的跳转记录;根据所述跳转记录,计算用户从当前网页跳转至下一跳网页的跳转概率;根据所述跳转概率,则对所述下一跳网页执行相应的处理操作。

【技术特征摘要】
1.一种网页的处理方法,其特征在于,包括:统计用户在使用网页过程中在网页间跳转的跳转记录;根据所述跳转记录,计算用户从当前网页跳转至下一跳网页的跳转概率;根据所述跳转概率,则对所述下一跳网页执行相应的处理操作。2.根据权利要求1所述的网页的处理方法,其特征在于,所述统计用户在使用网页过程中在网页间跳转的跳转记录的步骤包括:捕捉用户在使用网页过程中的使用行为,并通过一有向图统计所述跳转记录;其中,所述有向图中包括顶点,有向边及有向边的权重;所述顶点表示一网页,用以记录用户访问的统一资源定位符,统一资源定位符作为所述顶点的唯一标识;所述有向边用于标记用户由一顶点通过标签跳转到另一顶点;所述权重用于记录用户由一顶点通过标签跳转到另一顶点的跳转次数。3.根据权利要求2所述的网页的处理方法,其特征在于,所述统计用户在使用网页过程中在网页间跳转的跳转记录的步骤还包括:当用户待访问所述网页时,通过所述统一资源定位符在所述有向图中查找,若所述有向图中不存在待访问的网页时,在所述有向图中新增顶点,并记录其初始化访问次数为1;若所述有向图中存在待访问的网页时,将该顶点的访问次数加1。4.根据权利要求2所述的网页的处理方法,其特征在于,所述统计用户在使用网页过程中在网页间跳转的跳转记录的步骤还包括:当用户从一顶点跳转到另一顶点时,若所述有向图中不存在从一顶点跳转到另一顶点的有向边,则在所述有向图中新增该有向边,并初始化该有向边的权重为1;若所述有向图中存在从一顶点跳转到另一顶点的有向边,将该有向边的权重加1。5.根据权利要求2所述的网页的处理方法,其特征在于,在统计用户在使用网页过程中在网页间跳转的跳转记录的步骤之后,所述网页的处理方法还包括:判断用户在网页区停留的时间是否达到一预定时间间隔,若是,则读取所述跳转记录,根据所述跳转记录,计算用户从当前网页跳转至下一跳网页的跳转概率;若否,则取消相应的处理操作。6.根据权利要求5所述的网页的处理方法,其特征在于,在统计用户在使用网页过程中在网页间跳转的跳转记录的步骤之后,所述网页的处理方法还包括:判断用户离开网页区的时间是否达到另一预定时间间隔,若是,则取消相应的处理操作。7.根据权利要求2所述的网页的处理方法,其特征在于,用户从当前网页跳转至下一跳网页的跳转概率的计算公式为:从当前网页跳转至下一跳网页的跳转概率=用户由用于表示当前网页的顶点通过标签跳转到用于表示下一跳网页的另一顶点的有向边的权重/所述所述用于表示当前网页的顶点的访问次数。8.根据权利要求6所述的网页的处理方法,其特征在于,所述根据所述跳转概率,则对所述下一跳网页执行相应的处理操作的步骤包括:根据所述跳转概率及用于表示下一跳网页的另一顶点标识的所述统一资源定位符进对下一跳网页进行相应级别的预处理;查看统一资源定位符是否在已完成的预处理列表中,若是,则表示该预处理为有效的,预测命中下一跳网页,对下一跳网页进行加速;若否,则预测未命中下一跳网页,进行下一跳网页的页面加载请求和页面渲染,并清理预处理占用的内存资源。9.根据权利要求7所述的网页的处理方法,其特征在于,所述对下一跳网页进行相应级别的预处理的步骤包括:DNS预解析、TCP预连接以及网页预渲染;DNS预解析对应第一概率阈值;TCP预连接对应第二概率阈值;网页预渲染对应第三概率阈值;若所...

【专利技术属性】
技术研发人员:李明树何梅胡昆万齐旭
申请(专利权)人:中国科学院上海高等研究院
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1