下载网站静态网页的系统及方法技术方案

技术编号:3493053 阅读:836 留言:0更新日期:2012-04-11 18:40
一种下载网站静态网页的系统,包括至少一台目标网站服务器、一台内部服务器,一台与该目标网站服务器和内部服务器相连的应用服务器及与该应用服务器和内部服务器相连的数据库,该应用服务器包括:写入模块,用于将所需下载的网址写入脚本文件;解析模块,用于解析该脚本文件获取该网站网页内容及解析该网页内容以获取目标内容;转换模块,用于将目标内容中的相对链接转换成绝对链接;下载模块,用于将图片下载并保存到内部服务器;储存模块,用于将网页的绝对链接保存到数据库,同时生成该绝对链接的标识符;替换模块,用于以所述图片及网页在内部服务器中的链接取代其绝对链接。利用本发明专利技术可将网站内容按照其组织方式和结构完整的下载到本地。

【技术实现步骤摘要】

【技术保护点】
一种下载网站静态网页的系统,包括至少一台应用服务器、一台与所述应用服务器相连的目标网站服务器、一台与所述应用服务器相连的内部服务器及与所述应用服务器和内部服务器相连的数据库,其特征在于,所述应用服务器包括:    写入模块,用于根据客户提供的网页下载清单将所需下载的网页的网址写入脚本文件;    解析模块,用于解析该脚本文件,从目标网站服务器获取所述网页内容,并将所述网页链接保存到数据库及解析所述网页内容以获取目标内容;    转换模块,用于将目标内容中所有图片的相对链接转换成绝对链接及将目标内容中所有网页链接的相对链接转换成绝对链接;    下载模块,用于通过所述图片的绝对链接将目标内容中所有图片下载并保存到内部服务器;    储存模块,用于将目标内容中所有网页的绝对链接保存到数据库,同时生成所述网页绝对链接的标识符并将该标识符保存到数据库;及    替换模块,用于以目标内容中所有图片在内部服务器中的链接取代所述图片的绝对链接及用于将所述网页绝对链接的标识符与网页请求语言写入该网页在内部服务器中的链接,并以该写入标识符与网页请求语言的链接取代所述网页的绝对链接。

【技术特征摘要】

【专利技术属性】
技术研发人员:李忠一叶建发卢秋桦姜志强
申请(专利权)人:鸿富锦精密工业深圳有限公司鸿海精密工业股份有限公司
类型:发明
国别省市:94[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1