基于专业搜索引擎的爬虫策略获取图书信息的方法技术

技术编号:11421533 阅读:61 留言:0更新日期:2015-05-06 23:16
本发明专利技术公开了一种基于专业搜索引擎的爬虫策略获取图书信息的方法,其特征在于包括如下步骤:1)图书信息收索服务器通过有线或无线的方式连接到各图书网站上;2)图书信息收索服务器中存储有对应网站的数字许可证书;3)图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略略对图书网站中的更新图书信息进行搜索,图书信息收索服务器便对更新的图书信息进行下载,下载的更新图书信息经过防火墙和数据过滤器后存入图书信息收索服务器本地存储器中;4)图书信息收索服务器对存储如本地存储器的图书信息进行编译,然后发送到图书源数据库中。本发明专利技术提供的方法具有:使用方便、处理速度、技术实现容易等特点。

【技术实现步骤摘要】

【技术保护点】
一种基于专业搜索引擎的爬虫策略获取图书信息的方法,其特征在于包括如下步骤:1)图书信息收索服务器通过有线或无线的方式连接到各图书网站上;2)图书信息收索服务器中存储有对应网站的数字许可证书,在图书信息收索服务器登陆到上述网站后,自动匹配数字证书供网站校验;3)图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略略对图书网站中的更新图书信息进行搜索,一旦搜索到图书更新信息后,图书信息收索服务器便对更新的图书信息进行下载,下载的更新图书信息经过防火墙和数据过滤器后存入图书信息收索服务器本地存储器中;4)图书信息收索服务器对存储如本地存储器的图书信息进行编译,然后发送到图书源数据库中。

【技术特征摘要】

【专利技术属性】
技术研发人员:张宇
申请(专利权)人:大连易维立方技术有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1