【技术实现步骤摘要】
本专利技术涉及网页浏览
,具体而言,涉及一种网页页面的预读取方法、装置及智能终端设备。
技术介绍
随着互联网的普及、计算机作为家庭以及工作的必备产品之一,人们使用计算机上的浏览器访问互联网日趋频繁;尤其随着例如智能手机和平板电脑的智能终端产品的迅速普及,用户使用终端浏览器访问互联网成为日常行为。在用户使用浏览器打开网页的过程中,如果当前的网络环境受限,或者终端设备的运行速度受限,就会影响网页的打开速度,造成用户等待,用户上网的体验感很差。影响网页打开速度的主要原因是下载网页内容的时间过长。目前,一般采用对可能需要的网页进行预读取的方法来满足用户快速打开网页的需要。该方法主要是在用户浏览当前网页页面的过程中,服务器端获取用户下一步可能需要的网页,在用户未浏览这些网页之前先将这些网页的网址及其资源加载到本地缓存中;当用户访问其中某个网页时直接从本地缓存中读取相关数据来展示给用户阅览,避免了等待下载网页的过程,缩短用户进行网页访问操作后的网页响应时间。现有的网页预读取方法常见以下两种:第一、在用户浏览连续内容的某一个网页时预读取该网页上包含的链接到相邻网页的一个或多个关键字,例如“下一页”、“nextpage”等,然后依次取链接的网页内容并放入本地缓存中。第二、从服务器端获取网页列表,然后依次读取该网页列表中各网页内容并放入本地缓存中。由上可知,现有的第一种网页预读取方法只能适用于特定网页,即只对一个较长的内容被拆分成用超链接链起来的多个网页有效,而对于大量不存在页码顺序的其它网页,如新闻网页等,这种方法将无法预读取到用户后续可能访问的网页,因此并不能加 ...
【技术保护点】
一种网页页面的预读取方法,其特征在于,包括:获取一个或多个用户在第一时间段内对第一多个网页页面的访问信息;确定从第一多个网页页面中的第一网页页面点击进入第二网页页面的点击路径及其点击次数;基于上述步骤得到的数据信息确定点击路径的第一置信度;基于所述第一置信度将多条点击路径制成网页页面的第一预读取列表;从第一预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相应待浏览的目标网页数据。
【技术特征摘要】
1.一种网页页面的预读取方法,其特征在于,包括:获取一个或多个用户在第一时间段内对第一多个网页页面的访问信息;确定从第一多个网页页面中的第一网页页面点击进入第二网页页面的点击路径及其点击次数;基于上述步骤得到的数据信息确定点击路径的第一置信度;基于所述第一置信度将多条点击路径制成网页页面的第一预读取列表;从第一预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相应待浏览的目标网页数据。2.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在获取一个或多个用户在第一时间段内对第一多个网页页面的访问信息的过程中对每个网页页面的数据进行数据清洗的预处理的步骤。3.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在确定从第一多个网页页面中的第一网页页面点击进入第二网页页面的点击路径及其点击次数的步骤中,先以每个网页页面被访问的时间顺序方式将获取的对第一多个网页页面的访问信息制成第一网页页面访问序列表,按一定时间间隔将所述第一网页页面访问序列表中的多个网页页面分成多个页面块,确定每个页面块中从第一网页页面点击进入第二网页页面的点击路径及其点击次数,其中用在每个页面块内的点击路径上的第一和第二网页页面之间的第一衰减系数乘以该点击路径在该页面块内发生的点击次数得到经衰减处理的点击次数,将所有页面块内的相同点击路径的经衰减处理的点击次数线性相加,得到该点击路径的最终点击次数。4.根据权利要求3所述的网页页面的预读取方法,其特征在于,还包括:计算第一衰减系数的方法为:exp(-A*(D-1)),其中A是常数,D是排序距离。5.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在确定点击路径的第一置信度的过程中或之前筛选掉点击路径的点击次数低于第一点击阈值的点击路径。6.根据权利要求1-5之一所述的网页页面的预读取方法,其特征在于,还包括:确定点击路径的第一置信度的方法为:NPMI(a,b)=logx(p(a,b)/(p(a)*p(b))/-logx(p(a,b));式中:NPMI(a,b)表示从第一网页页面a点击进入第二网页页面b的点击路径a->b的第一置信度,x为底数变量,p(a,b)表示点击路径a->b的最终点击次数/页面块的总数量,p(a)表示第一页面a所在页面块的数量/页面块的总数量,和p(b)表示第二页面b所在页面块的数量/页面块的总数量。7.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在制成网页页面的第一预读取列表之前,先筛选掉第一置信度低于第一置信度阈值的点击路径。8.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:基于所述第一置信度将多条点击路径制成网页页面的第一预读取列表的步骤中,以第一置信度值大小进行有序排列的方式将多条点击路径制成网页页面的第一预读取列表。9.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在从第一预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相应待浏览的目标网页数据的步骤中,当在第一预读取列表中查询到从当前浏览的网页能够点击进入多个目标网页的多条点击路径时,选择最大第一置信度的点击路径来预读取相
\t应待浏览的目标网页数据,或者按第一置信度的降序方式预读取多个相应待浏览的目标网页数据。10.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:当第一预读取列表中不存在从当前浏览的网页点击进入目标网页的点击路径时,不触发预读取操作。11.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在从第一预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相应待浏览的目标网页数据的步骤之前,制作第二预读取列表并从第二预读取列表中查询当前浏览的网页页面的点击路径,当第二预读取列表中存在该点击路径时预读取相应待浏览的目标网页数据;当第二预读取列表中不存在该点击路径时执行从第一预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相应待浏览的目标网页数据的步骤,该制作第二预读取列表的方法包括:获取每个用户在涵盖了第一时间段的第二时间段内对第二多个网页页面的访问信息;确定从第二多个网页页面中的每个页面点击进入另一个页面的点击路径及其点击次数,和分析确定每条点击路径的路径点击率以及从每个页面点击进入多个不同页面的多条点击路径的路径点击率的熵;根据所述点击路径的点击次数和所述路径点击率的熵确定每条点击路径的第二置信度;基于所述第二置信度将多条点击路径制成网页页面的第二预读取列表。12.根据权利要求11所述的网页页面的预读取方法,其特征在于,还包括:在获取每个用户在涵盖了第一时间段的第二时间段
\t内对第二多个网页页面的访问信息的过程中对每个网页页面的数据进行数据清洗的步骤。13.根据权利要求11所述的网页页面的预读取方法,其特征在于,还包括:第二时间段的时长大于或等于第一时间段的时长且该第一时间段在该第二时间段...
【专利技术属性】
技术研发人员:梁捷,蒋喻新,姚文清,吴伙成,许延伟,梁延俊,芦焱,仇家伟,
申请(专利权)人:广州市动景计算机科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。