基于专业搜索引擎的爬虫策略更新图书信息的方法技术

技术编号:11423312 阅读:94 留言:0更新日期:2015-05-07 01:35
本发明专利技术公开了一种基于专业搜索引擎的爬虫策略更新图书信息的方法,包括如下步骤:图书信息收索服务器通过有线或无线的方式连接到各图书网站上;图书信息收索服务器中存储有对应网站的数字许可证书,在图书信息收索服务器登陆到上述网站后,自动匹配数字证书供网站校验;图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略对图书网站中的更新图书信息进行搜索,一旦搜索到图书更新信息后,图书信息收索服务器便对更新的图书信息进行下载;图书资源服务器对图书信息收索服务器发送过来的图书信息进行处理,图书资源服务器将编辑好的图书信息推送到客户的智能移动终端上。本发明专利技术提供的方法具有:使用方便、处理速度、技术实现容易等特点。

【技术实现步骤摘要】

【技术保护点】
一种基于专业搜索引擎的爬虫策略更新图书信息的方法,其特征在于包括如下步骤:1)图书信息收索服务器通过有线或无线的方式连接到各图书网站上;2)图书信息收索服务器中存储有对应网站的数字许可证书,在图书信息收索服务器登陆到上述网站后,自动匹配数字证书供网站校验;3)图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略对图书网站中的更新图书信息进行搜索,一旦搜索到图书更新信息后,图书信息收索服务器便对更新的图书信息进行下载;4)图书信息收索服务器将图书信息发送到图书源数据服务器中,图书资源服务器对图书信息收索服务器发送过来的图书信息进行处理,采用基于元数据的web信息提取方法对图书的文字信...

【技术特征摘要】

【专利技术属性】
技术研发人员:张宇
申请(专利权)人:大连易维立方技术有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1