The invention provides a pre reading method, device and intelligent terminal device for web pages. The prereading method includes: obtaining the access information of each user to a number of web pages within one time period, determining the similarity between the 22 users of the multiple users, determining 1 or more similar users according to the size of the similarity degree, and using the most similar user to calculate the recommendation probability of the click path. The pre read list is generated, and the click path of the web page that is currently browsing is querying from the preread list, so as to preread the corresponding data of the target page to be browsed. The beneficial effect of the technical scheme provided by the invention is to pre read and remove the web data in advance to the user. The hit probability and coverage rate of the pre read are greatly improved, and the high accuracy and high efficiency of the preread are ensured. After reading the high probability of the web page data and storing it to the local cache, the user opens the web page. The speed of the page improves the user experience.
【技术实现步骤摘要】
一种网页页面的预读取方法、装置及智能终端设备
本专利技术涉及网页浏览
,具体而言,涉及一种网页页面的预读取方法、装置及智能终端设备。
技术介绍
随着互联网的普及、计算机作为家庭以及工作的必备产品之一,人们使用计算机上的浏览器访问互联网日趋频繁;尤其随着例如智能手机和平板电脑的智能终端产品的迅速普及,用户使用终端浏览器访问互联网成为日常行为。在用户使用浏览器打开网页的过程中,如果当前的网络环境受限,或者终端设备的运行速度受限,就会影响网页的打开速度,造成用户等待,用户上网的体验感很差。影响网页打开速度的主要原因是下载网页内容的时间过长。目前,一般采用对可能需要的网页进行预读取的方法来满足用户快速打开网页的需要。该方法主要是在用户浏览当前网页页面的过程中,服务器端获取用户下一步可能需要的网页,在用户未浏览这些网页之前先将这些网页的网址及其资源加载到本地缓存中;当用户访问其中某个网页时直接从本地缓存中读取相关数据来展示给用户阅览,避免了等待下载网页的过程,缩短用户进行网页访问操作后的网页响应时间。现有的网页预读取方法常见以下两种:第一、在用户浏览连续内容的某一个网页时预读取该网页上包含的链接到相邻网页的一个或多个关键字,例如“下一页”、“nextpage”等,然后依次取链接的网页内容并放入本地缓存中。第二、从服务器端获取网页列表,然后依次读取该网页列表中各网页内容并放入本地缓存中。由上可知,现有的第一种网页预读取方法只能适用于特定网页,即只对一个较长的内容被拆分成用超链接链起来的多个网页有效,而对于大量不存在页码顺序的其它网页,如新闻网页等,这种方法将无法 ...
【技术保护点】
1.一种网页页面的预读取方法,其特征在于,包括:获取多个用户中的每一个用户在一个时间段内对多个网页页面的访问信息;确定该多个用户中两两用户之间的相似度;按相似度的大小确定1个或多个最相似用户;利用最相似用户计算点击路径的推荐概率并且生成预读取列表,其中,在利用最相似用户计算点击路径的推荐概率的步骤中,统计1个最相似用户在所述时间段内从第一网页点击进入第二网页的次数,并用该统计出的次数与该最相似用户的相似度的乘积作为该最相似用户从第一网页点击进入第二网页的点击路径的推荐概率;在有多个最相似用户时,以此方式计算其他多个最相似用户从第一网页点击进入第二网页的点击路径的推荐概率;然后将计算出的多个最相似用户的推荐概率相加求和,从而得到从第一网页点击进入第二网页的点击路径的最终推荐概率;以此方式,计算出1个或多个最相似用户在所述时间段内访问的多条点击路径的推荐概率;从预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相应待浏览的目标网页数据。
【技术特征摘要】
1.一种网页页面的预读取方法,其特征在于,包括:获取多个用户中的每一个用户在一个时间段内对多个网页页面的访问信息;确定该多个用户中两两用户之间的相似度;按相似度的大小确定1个或多个最相似用户;利用最相似用户计算点击路径的推荐概率并且生成预读取列表,其中,在利用最相似用户计算点击路径的推荐概率的步骤中,统计1个最相似用户在所述时间段内从第一网页点击进入第二网页的次数,并用该统计出的次数与该最相似用户的相似度的乘积作为该最相似用户从第一网页点击进入第二网页的点击路径的推荐概率;在有多个最相似用户时,以此方式计算其他多个最相似用户从第一网页点击进入第二网页的点击路径的推荐概率;然后将计算出的多个最相似用户的推荐概率相加求和,从而得到从第一网页点击进入第二网页的点击路径的最终推荐概率;以此方式,计算出1个或多个最相似用户在所述时间段内访问的多条点击路径的推荐概率;从预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相应待浏览的目标网页数据。2.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在获取多个用户中的每一个用户在一个时间段内对多个网页页面的访问信息的过程中对每个页面的数据进行数据清洗的预处理的步骤。3.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在确定该多个用户中两两用户之间的相似度的步骤中,使用余弦相似度的方法来确定相似度。4.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在确定两两用户之间的相似度的过程中,先筛选掉访问不同网页的页面数低于页面数访问阈值的用户。5.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:以多个用户访问的相同网页作为共同特征,建立倒排表,然后使用余弦相似度的方法来确定倒排表中两两用户之间的相似度。6.根据权利要求5所述的网页页面的预读取方法,其特征在于,还包括:当倒排表中的用户数量超过用户阈值时,筛选掉该倒排表。7.根据权利要求3所述的网页页面的预读取方法,其特征在于,还包括:利用威尔逊区间公式对网页的访问量做置信区间计算,取区间下限作为网页的访问量的最终值。8.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在按相似度的大小确定1个或多个最相似用户的步骤中,通过筛选掉相似度低于相似度阈值的相似用户,来确定1个或多个最相似用户。9.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在利用最相似用户计算点击路径的推荐概率的过程中,筛选掉点击次数低于点击次数阈值的点击路径。10.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在利用最相似用户计算点击路径的推荐概率的过程中,利用威尔逊区间公式对网页的访问次数做置信区间计算,取区间下限作为网页的访问次数的最终值。11.根据权利要求1所述的网页页面的预读取方法,其特征在于,还包括:在生成预读取列表的过程中,多条点击路径在预读取列表中以推荐概率的大...
【专利技术属性】
技术研发人员:梁捷,
申请(专利权)人:广州市动景计算机科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。