网页下载的方法和装置制造方法及图纸

技术编号:6066791 阅读:193 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了网页下载的方法和装置。所述方法包括:选取步骤,从多个网页中选取至少一个列表页面;模板生成步骤,根据所述至少一个列表页面中的一个或多个来生成列表页面模板;下载更新步骤,利用所述列表页面模板和所述至少一个列表页面来下载和/或更新所述至少一个列表页面中所包含的主题的主题页面。根据本发明专利技术的网页下载的方法和装置,可以针对具有多个结构相似的网页的网站进行高效、自动的网页下载。

Method and device for downloading web pages

The invention provides a method and a device for downloading web pages. The method comprises the steps of: selecting, from a plurality of page select at least one list page; template generation step, according to one or more page template to generate a list of the at least one list page; download the update step, using the list page template and the at least one page to list download and / or update the at least one list page contained in the theme page. According to the method and the device for downloading the pages of the present invention, efficient and automatic web downloading can be directed at a web site with a plurality of structurally similar pages.

【技术实现步骤摘要】

本专利技术总体上涉及计算机领域,尤其涉及一种网页下载的方法和装置。更具体地, 本专利技术涉及一种针对具有多个结构相似的网页的网站进行网页下载的方法和装置。
技术介绍
随着因特网和电子技术的飞速发展,人们不再受地域的限制,可以方便的在网上交换各种各样的信息。在大量用户的参与之下,网站(比如论坛、博客、产品目录网站等)的网页中存在大量的有用信息,这些信息不仅对于个人而且对于企业都有很好的使用价值。为了获得这些有用信息,需要下载网站中所包括的多个网页以进行进一步的分析提取。在现有技术中,通常是对网站的URL (Uniform Resource Locator,统一资源定位符)进行深度扩展,来逐层次地下载网页,最终完成网站的网页的下载。这种处理没有针对性,经常需要人工干预,因而处理过程需要较长的时间,效率不高。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详本文档来自技高网...

【技术保护点】
1.一种网页下载的方法,包括:选取步骤,从多个网页中选取至少一个列表页面;模板生成步骤,根据所述至少一个列表页面中的一个或多个来生成列表页面模板;以及下载更新步骤,利用所述列表页面模板和所述至少一个列表页面来下载和/或更新所述至少一个列表页面中所包含的主题的主题页面。

【技术特征摘要】

【专利技术属性】
技术研发人员:王新文王主龙孟遥于浩
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1