一种网页资源下载方法、系统和装置制造方法及图纸

技术编号:9867847 阅读:90 留言:0更新日期:2014-04-03 04:30
本申请公开了一种网页资源下载方法、系统和装置。该方法包括:客户端下载网页主资源,对下载的网页主资源进行解析,将解析到的网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,将该一个下载请求发给代理服务器;代理服务器从该一个下载请求中解析出一个以上的网页子资源的下载信息,根据解析出的每个网页子资源的下载信息分别发送下载请求,将下载的网页子资源返回给所述客户端。应用本发明专利技术能够提高网页加载速度或网页资源的下载速度。

【技术实现步骤摘要】
一种网页资源下载方法、系统和装置
本申请涉及互联网
,尤其涉及一种网页资源下载方法、系统和设备。
技术介绍
浏览器要加载网页,首先要下载并解析网页资源。目前的网页资源包括网页主资源和网页子资源,其中的网页主资源是网页源代码,网页子资源是网页中除网页主资源以外的其他资源,例如图片、流媒体、JavaScript脚本和CSS脚本等。目前,浏览器加载网页时,先下载网页主资源,然后解析网页主资源。当解析到网页主资源中外链的JavaScript脚本或CSS脚本时,停止解析网页主资源并开始下载外链的JavaScript脚本或CSS脚本,直至该外链的JavaScript脚本或CSS脚本下载完毕并且解析和执行完该JavaScript脚本或CSS脚本后,再继续解析网页主资源。当解析到网页主资源中除了外链的JavaScript脚本和CSS脚本以外的其他子资源时,每解析到一个所述其他子资源,则发送下载该其他子资源的请求,并继续解析网页主资源。可见,目前的网页子资源可以分为两类,一类是需要等待的网页子资源,当解析到需要等待的网页子资源时,需要等待该网页子资源下载完毕并解析和执行完毕后,才能继续解析网页主资源,另一类是不需要等待的网页子资源,每解析到一个不需要等待的网页子资源时,则发送下载该不需要等待的子资源的请求,并且继续解析主资源。目前,需要等待的网页子资源包括外链的JavaScript脚本和CSS脚本,不需要等待的网页子资源包括除了外链的JavaScript脚本和CSS脚本以外的其他网页子资源。对上述技术方案进行分析可见,浏览器在加载网页时,当从网页主资源中解析到需要等待的网页子资源时,由于需要等待该网页子资源下载并且解析和执行完毕后,才能继续解析网页主资源,因此导致网页加载速度较慢。当网页主资源中存在不需要等待的网页子资源时,由于每解析到一个不需要等待的网页子资源,都需要发送一次网页子资源下载请求,而每次对网页子资源下载请求的处理都需要建立一个HTTP连接,如果网页中存在N个子资源,就要在浏览器客户端和服务器之间建立N个HTTP连接,由于每个HTTP连接都需要建立Socket连接、发送请求、等待回应,在建立每个Socket连接上额外花费的时间较多,特别是在无线网络环境下,需要1.2秒到12秒的时间才能建立一个Socket连接,因此导致网页子资源下载时间较长。
技术实现思路
本申请提供了一种网页资源下载方法、系统和装置,能够提高网页加载速度或网页资源的下载速度。—种网页资源下载方法,该方法包括:客户端下载网页主资源,对下载的网页主资源进行解析,将解析到的网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,将该一个下载请求发给代理服务器;代理服务器从该一个下载请求中解析出一个以上的网页子资源的下载信息,根据解析出的每个网页子资源的下载信息分别发送下载请求,将下载的网页子资源返回给所述客户端。一种网页资源下载方法,该方法包括:代理服务器接收网页主资源下载请求,下载网页主资源,从网页主资源中解析出需要等待的网页子资源的统一资源标识符(URL)地址信息,将需要等待的网页子资源的URL地址信息和网页主资源打包在一个应答包中返回给浏览器客户端,其中,网页子资源的URL地址信息在应答包中位于网页主资源的前面;客户端接收所述应答包,从所述应答包中解析出网页子资源的URL地址信息,根据所述网页子资源的URL地址信息发送网页子资源下载请求,从所述应答包中解析出网页主资源;其中,所述需要等待的网页子资源,是在该网页子资源下载并解析和执行成功后才能继续解析网页主资源的网页子资源。一种网页资源下载系统,该系统包括客户端和代理服务器;所述客户端,用于下载网页主资源,对下载的网页主资源进行解析,将解析到的网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,将该一个下载请求发给代理服务器;所述代理服务器,用于从该一个下载请求中解析出一个以上的网页子资源的下载信息,根据解析出的每个网页子资源的下载信息分别发送下载请求,将下载的网页子资源返回给所述客户端。一种网页资源下载系统,该系统包括客户端和代理服务器;所述客户端,用于发送网页主资源下载请求,接收应答包,从应答包中解析出网页子资源的URL地址信息,根据所述网页子资源的URL地址信息发送网页子资源下载请求,从所述应答包中解析出网页主资源;所述代理服务器,用于接收网页主资源下载请求,下载网页主资源,从网页主资源中解析出需要等待的网页子资源的URL地址信息,将需要等待的网页子资源的URL地址信息和网页主资源打包在一个应答包中返回给浏览器客户端,其中,网页子资源的URL地址信息在应答包中位于网页主资源的前面;其中,所述需要等待的网页子资源,是在该网页子资源下载并解析和执行成功后才能继续解析网页主资源的网页子资源。一种客户端,该客户端包括解析模块和网络模块;所述解析模块,用于对下载的网页主资源进行解析,将解析到的网页子资源的下载信息发给所述网络模块;所述网络模块,用于将网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,将该一个下载请求发给代理服务器,接收代理服务器返回的网页子资源。一种客户端,该客户端包括网络模块和解析模块;所述网络模块,用于向代理服务器发送网页主资源下载请求;所述解析模块,用于接收代理服务器针对所述网页主资源下载请求返回的应答包,对该应答包进行解析,当从应答包中解析出网页子资源的URL地址信息时,根据解析出的URL地址信息发送网页子资源下载请求,并继续从应答包中解析出网页主资源,其中,所述应答包中携带有需要等待的网页子资源的URL地址信息和网页主资源,网页子资源的URL地址信息在应答包中位于网页主资源的前面;其中,所述需要等待的网页子资源,是在该网页子资源下载并解析和执行成功后才能继续解析网页主资源的网页子资源。一种代理服务器,该代理服务器包括解析模块和网络模块;所述网络模块,用于接收客户端发来的下载请求,根据解析模块解析出的每个网页子资源的下载信息分别向资源服务器发送下载请求,将下载的网页子资源发回给所述客户端;所述解析模块,用于从客户端发来的下载请求中解析出一个以上的网页子资源的下载信息时,将每个网页子资源的下载信息发给所述网络模块。一种代理服务器,该代理服务器包括解析模块和网络模块;所述网络模块,用于接收客户端发来的网页主资源下载请求,下载网页主资源,将网页主资源和从网页主资源中解析出的需要等待的网页子资源的URL地址信息打包在一个应答包中发给所述客户端;所述解析模块,用于从所述网络模块下载的网页主资源中解析出需要等待的网页子资源的URL地址信息;其中,所述需要等待的网页子资源,是在该网页子资源下载并解析和执行成功后才能继续解析网页主资源的网页子资源。由上述方案可本文档来自技高网
...

【技术保护点】
一种网页资源下载方法,其特征在于,该方法包括:客户端下载网页主资源,对下载的网页主资源进行解析,将解析到的网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,将该一个下载请求发给代理服务器;代理服务器从该一个下载请求中解析出一个以上的网页子资源的下载信息,根据解析出的每个网页子资源的下载信息分别发送下载请求,将下载的网页子资源返回给所述客户端。

【技术特征摘要】
1.一种网页资源下载方法,其特征在于,该方法包括: 客户端下载网页主资源,对下载的网页主资源进行解析,将解析到的网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,将该一个下载请求发给代理服务器; 代理服务器从该一个下载请求中解析出一个以上的网页子资源的下载信息,根据解析出的每个网页子资源的下载信息分别发送下载请求,将下载的网页子资源返回给所述客户端。2.根据权利要求1所述的方法,其特征在于,将解析到的网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中包括: 判断解析到的网页子资源当前是否正在下载,如果没有正在下载,则将该网页子资源的下载信息加入到等待发送队列中,判断等待发送队列中的网页子资源个数是否达到预设值,如果是,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,否贝U,判断等待发送队列的等待时间是否达到预设值,如果是,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,否则继续保持所述等待发送队列处于等待状态。3.根据权利要求1所述的方法,其特征在于,将下载的网页子资源返回给所述客户端包括: 将下载的两个以上的网页子资源打包在一个应答包中发给客户端; 所述客户端接收所述应答包,从所述应答包中解析出两个以上的网页子资源。4.根据权利要求1所述的方法,其特征在于,客户端下载网页主资源包括: 客户端向代理服务器发送网页主资源下载请求,接收代理服务器返回的应答包,该应答包中携带有网页子资源的统一资源标识符(URL)地址信息和网页主资源,其中,网页子资源的URL地址信息在应答包中位于网页主资源的前面; 其中,代理服务器接收网页主资源下载请求,下载网页主资源,从网页主资源中解析出需要等待的网页子资源的URL地址信息,将需要等待的网页子资源的URL地址信息和网页主资源打包在一个应答包中发给所述客户端,所述需要等待的网页子资源是在该网页子资源下载并解析和执行成功后才能继续解析网页主资源的网页子资源; 对下载的网页主资源进行解析之前,该方法还包括: 客户端解析该应答包,当从应答包中解析出网页子资源的URL地址信息时,根据解析出的URL地址信息发送网页子资源下载请求,并继续从应答包中解析出网页主资源。5.根据权利要求4所述的方法,其特征在于,根据解析出的URL地址信息发送网页子资源下载请求包括: 将两个以上的网页子资源的URL地址信息打包在一个网页子资源下载请求中发给代理服务器; 代理服务器从所述网页子资源下载请求中解析出所述两个以上的网页子资源的URL地址信息,根据解析出的每个网页子资源的URL地址信息分别发送网页子资源下载请求,将下载的网页子资源发给客户端。6.根据权利要求1至5任一权利要求所述的方法,其特征在于,所述打包包括: 将打包对象分别以标签长度取值(TLV)的格式打包在数据包的包体中。7.—种网页资源下载方法,其特征在于,该方法包括: 代理服务器接收网页主资源下载请求,下载网页主资源,从网页主资源中解析出需要等待的网页子资源的统一资源标识符(URL)地址信息,将需要等待的网页子资源的URL地址信息和网页主资源打包在一个应答包中返回给客户端,其中,网页子资源的URL地址信息在应答包中位于网页主资源的前面; 客户端接收所述应答包,从所述应答包中解析出网页子资源的URL地址信息,根据所述网页子资源的URL地址信息发送网页子资源下载请求,从所述应答包中解析出网页主资源; 其中,所述需要等待的网页子资源,是在该网页子资源下载并解析和执行成功后才能继续解析网页主资源的网页子资源。8.根据权利要求1所述的方法,其特征在于,所述发送网页子资源下载请求包括: 将两个以上的网页子资源的URL地址信息打包在一个网页子资源下载请求中发给代理服务器; 代理服务器从所述网页子资源下载请求中解析出所述两个以上的网页子资源的URL地址信息,根据解析出的每个网页子资源的URL地址信息分别发送网页子资源下载请求,将下载的网页子资源发给`客户端。9.根据权利要求7或8所述的方法,其特征在于,所述需要等待的网页子资源包括外链的JavaScript脚本或CSS脚本。10.一种网页资源下载系统,其特征在于,该系统包括客户端和代理服务器; 所述客户端,用于下载网页主资源,对下载的网页主资源进行解析,将解析到的网页子资源的下载信息加入到等待发送队列中,在等待发送队列中的网页子资源个数达到预设值或等待发送队列的等待时间达到预设值时,将等待发送队列中的所有网页子资源的下载信息打包在一个下载请求中,将该一个下载请求发给代理服务器; 所述代理服务器,用于从该一个下载请求中解析出一...

【专利技术属性】
技术研发人员:沈锦龙刘杉林燕描罗坤
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1