基于预读取的资源预置方法和装置制造方法及图纸

技术编号:9546462 阅读:114 留言:0更新日期:2014-01-08 22:30
本发明专利技术公开了一种基于预读取的资源预置方法和装置,其中的方法主要包括:获取各站点下的资源的标识,所述标识唯一表示一个资源;根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。本发明专利技术提供的上述技术方案大幅度提升了用户访问常用网络资源的速度,从而进一步提升了用户的网络访问体验。

【技术实现步骤摘要】
基于预读取的资源预置方法和装置
本专利技术涉及网络访问技术,具体涉及基于预读取的资源预置方法和装置。
技术介绍
用户在使用浏览器(如搜狗高速浏览器)进行网络访问过程中,往往会因为网站的服务器处理能力、用户的网络带宽以及所访问网页内容的大小等多种因素,而导致该网站网页的打开速度较慢,从而影响了用户的上网体验。现有的一种提高网站访问速度的方法为:服务器对用户访问网站的热点部分进行计算,以预测出热点资源,服务器获取热点资源对应的页面内容,并将该页面内容推送给终端设备,终端设备本地缓存该页面内容,如终端设备将该页面内容缓存在本地内存中;这样,当用户真正去访问服务器提前推送来的页面内容时,终端设备只需从本地缓存中读取相应的页面内容即可。从用户角度而言,上述方法提高了网站网页的打开速度,从而提高了用户的网络访问体验。由于上述方法是终端设备提前从服务器处获取了相应的信息,因此,上述方法可以称为预读取方法。专利技术人在实现本专利技术过程中发现,随着互联网技术的迅速发展,网络访问量随之不断的增加,预读取技术也就显的越来越重要了。而针对预读取技术而言,如何为用户提前提供其真正所需的网络资源,并不断提升用户的网络访问速度和体验,是一个需要持续关注的课题。
技术实现思路
本专利技术的目的在于,克服现有的预读取方法所存在的技术问题,提供一种基于预读取的资源预置方法和装置,所要解决的技术问题是,进一步提升用户的网络访问速度。本专利技术的目的以及解决其技术问题可以采用以下的技术方案来实现。依据本专利技术提出的一种基于预读取的资源预置方法,其中,所述方法包括:获取各站点下的资源的标识,所述标识唯一表示一个资源;根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。可选的,上述基于预读取的资源预置方法,其中,所述根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理包括:针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包;针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包;且所述根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包包括:根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发所述公用资源包和为其选取的站点资源包。可选的,上述基于预读取的资源预置方法,其中,所述获取各站点下的资源的标识的步骤包括:获取客户端进行网络访问的客户端日志,并根据所述客户端日志获取各站点下的各资源的URL。可选的,上述基于预读取的资源预置方法,其中,所述对各资源对应的原始文件进行筛选处理的步骤包括:滤除原始文件中包含有cookie设置信息的资源;和/或,滤除原始文件中的内容变化率超过预定变化率阈值的资源;和/或,滤除原始文件异常的资源。可选的,上述基于预读取的资源预置方法,其中,所述方法在打包的步骤之前还包括:依据资源的权重值从筛选后的资源中选取相应的资源;且所述筛选处理后的资源为从筛选后的资源中选取的资源。可选的,上述基于预读取的资源预置方法,其中,所述资源的权重值是根据资源使用户重视的程度而设定的。可选的,上述基于预读取的资源预置方法,其中,所述资源的权重值根据Weight(resurl)=Uv(resurl)/Size(resurl)计算获得;其中,we迎ht(resur1)为资源的权重值,resurl为资源的URL,uv(resur1)为资源在过去预定时长的时间窗内的用户使用量,size(resur1)为资源的大小。可选的,上述基于预读取的资源预置方法,其中,所述站点资源包的打包操作包括:针对一个站点而言,根据站点专属引用的资源的权重值从该站点专属引用的资源中选取第一预定数量的站点专属引用的资源,并对选取出的第一预定数量的站点专属引用的资源进行打包;其中,所述第一预定数量根据客户端设定的下发包的大小以及所述选取的站点专属引用的资源的大小确定。可选的,上述基于预读取的资源预置方法,其中,所述方法还包括:根据资源的权重值从筛选处理后的资源中选取第二预定数量的资源,并将选取的第二预定数量的资源打包为通用包;向用户下发所述通用包;其中,所述第二预定数量根据客户端设定的下发包的大小以及所述选取的资源的大小确定。可选的,上述基于预读取的资源预置方法,其中,所述根据用户的网络访问特征为各用户分别选取站点资源包的步骤包括:获取用户访问过的站点信息,并针对用户访问过的站点,根据Max{∑(p(sitei))}且∑size(sitei)+size(common)<Size(threshold)选取需要向用户下发的站点资源包;其中,sitei为用户访问过的第i个站点,p(sitei)为用户访问过的第i个站点的访问权重,size(sitei)为用户访问过的第i个站点对应的站点资源包的大小,size(common)为通用包的大小,size(thresh0ld)为客户端设定的下发包的大小。可选的,上述基于预读取的资源预置方法,其中,所述下发的步骤还包括:根据前一次向用户下发的资源包的缓存时间向用户再次下发相应类型的资源包。依据本专利技术实施例提供的一种基于预读取的资源预置装置,其中,该装置包括:获取模块,用于获取各站点下的资源的标识,所述标识唯一表示一个资源;筛选模块,用于根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;打包模块,用于根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;下发模块,用于根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。可选的,上述基于预读取的资源预置装置,其中,所述打包模块具体包括:公用资源打包子模块,用于针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包;站点资源打包子模块,用于针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包;且所述下发模块具体用于:根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发所述公用资源包和为其选取的站点资源包。可选的,上述基于预读取的资源预置方法,其中,所述获取模块具体用于:获取客户端进行网络访问的客户端日志,并根据所述客户端日志获取各站点下的各资源的URL。可选的,上述基于预读取的资源预置方法,其中,所述筛选模块具体用于:滤除原始文件中包含有cookie设置信息的资源;和/或,滤除原始文件中的内容变化率超过预定变化率阈值的资源;和/或,滤除原始文件异常的资源。可选的,上述基于预读取的资源预置方法,其中,所述装置还包括:选取模块,与筛选模块和打包模块分别连接,用于依据资源的权重值从筛选后的资源中选取相应的资源;且所述筛选处理后的资源为从筛选后的资源中选取的资源。可选的,上述基于预读取的资源预置方法,其中,所述资源的权重值是根据资源使用户重视的程度而设定的。可选的,上述基于预读取的资源预置方法,其中,所述资源的权重值根据Weight(resurl)=Uv(resurl)/Size(resurl)计算获得本文档来自技高网...
基于预读取的资源预置方法和装置

【技术保护点】
一种基于预读取的资源预置方法,其特征在于,该方法包括:获取各站点下的资源的标识,所述标识唯一表示一个资源;根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。

【技术特征摘要】
1.一种基于预读取的资源预置方法,其特征在于,该方法包括:获取各站点下的资源的标识,所述标识唯一表示一个资源;根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包;其中,所述根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理包括:针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包;针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包。2.如权利要求1所述的方法,其特征在于,所述根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包包括:根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发所述公用资源包和为其选取的站点资源包。3.如权利要求1所述的方法,其特征在于,所述获取各站点下的资源的标识的步骤包括:获取客户端进行网络访问的客户端日志,并根据所述客户端日志获取各站点下的各资源的URL。4.如权利要求1所述的方法,其特征在于,所述对各资源对应的原始文件进行筛选处理的步骤包括:滤除原始文件中包含有cookie设置信息的资源;和/或滤除原始文件中的内容变化率超过预定变化率阈值的资源;和/或滤除原始文件异常的资源。5.如权利要求1所述的方法,其特征在于,所述对各资源对应的原始文件进行筛选处理,还包括:依据资源的权重值从优质资源中选取相应的资源,所述优质资源为从所述原始资源中滤除属于预定类型的资源之后所获得的资源;且所述筛选处理后的资源为从基于所述权重值从所述优质资源所筛选出的资源中选取的资源。6.如权利要求5所述的方法,其特征在于,所述资源的权重值是根据资源使用户重视的程度而设定的。7.如权利要求6所述的方法,其特征在于:所述资源的权重值根据Weight(resurl)=Uv(resurl)/Size(resurl)计算获得;其中,Weight(resurl)为资源的权重值,resurl为资源的URL,Uv(resurl)为资源在过去预定时长的时间窗内的用户使用量,Size(resurl)为资源的大小。8.如权利要求2所述的方法,其特征在于,所述站点资源包的打包操作包括:针对一个站点而言,根据站点专属引用的资源的权重值从该站点专属引用的资源中选取第一预定数量的站点专属引用的资源,并对选取出的第一预定数量的站点专属引用的资源进行打包;其中,所述第一预定数量根据客户端设定的下发包的大小以及所述选取的站点专属引用的资源的大小确定。9.如权利要求2所述的方法,其特征在于,所述方法还包括:根据资源的权重值从筛选处理后的资源中选取第二预定数量的资源,并将选取的第二预定数量的资源打包为通用包;向用户下发所述通用包;其中,所述第二预定数量根据客户端设定的下发包的大小以及所述选取的资源的大小确定。10.如权利要求2至9中任一权利要求所述的方法,其特征在于,所述根据用户的网络访问特征为各用户分别选取站点资源包的步骤包括:获取用户访问过的站点信息,并针对用户访问过的站点,根据Max{Σ(p(sitei))}且Σsize(sitei)+size(common)<Size(threshold)选取需要向用户下发的站点资源包;其中,sitei为用户访问过的第i个站点,p(sitei)为用户访问过的第i个站点的访问权重,size(sitei)为用户访问过的第i个站点对应的站点资源包的大小,size(common)为通用包的大小,Size(threshold)为客户端设定的下发包的大小。11.如权利要求1至9中任一权利要求所述的方法,其中,所述下发的步骤还包括:针对向用户下发的数据包设置缓存时间,在前一次向用户下发的资源包的缓...

【专利技术属性】
技术研发人员:崔华郭奇汤传喜李俊强
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1