资讯搜索系统及方法技术方案

技术编号:2839241 阅读:274 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种资讯搜索系统,其包括至少一台主机,该主机包括:读取模块,用于读取搜索条件;解析模块,用于将该搜索条件解析成基于可扩展标志查询语言的搜索条件;格式转换模块,用于将基于可扩展标志查询语言的搜索条件转换成可扩展标识语言的指令;指令队列控制模块,用于初始化一个指令队列,对格式转换后的指令进行定义,并根据定义的属性将其放入指令队列中进行排配;及搜索模块,用于根据读取模块从上述的指令队列头部所读取的指令至各网站搜索及下载包括需搜索的资讯的网页。利用本发明专利技术,在不同网站搜索相关资讯时,不需重新开发、编译相关程序,并可节省搜索时间及人力成本的消耗。

【技术实现步骤摘要】

本专利技术涉及一种。
技术介绍
对获得相关信息并筛选不想要的信息的有效和实用装置的需要在增涨,特别是由于互联网的创立。由于全球网站的数量在指数级地增长和其中包含的绝对信息量特别加剧了该需求。计算机网络中的搜索引擎是搜索网页及网站的工具。在搜索因特网上可供使用的信息的尝试中,已经产生大量软件搜索引擎,用户借助这些搜索引擎在其个人计算机上从键盘输入由适当的关键词构成的搜索条件。搜索条件发送到应用服务器,该应用服务器具有与该应用服务器有关的搜索引擎。搜索引擎接收搜索条件,然后用其通过网址的数据库和网点上存储的文本扫描这些关键词。此后,把扫描的结果从应用服务器传回到客户端并在客户端的屏幕上显示。目前常用的搜索引擎,通常是采用C++、Java等语言开发,该类搜索引擎功能比较单一,可配置性较差,在不同网站搜索相关资讯时,常需要重新开发、编译相关程序,耗费更多的人力及时间。为减少人力成本、便于用户快速搜索相关资讯,有必要提供一种,该可以弥补上述搜索引擎的缺陷。
技术实现思路
鉴于上述内容,有必要提供一种资讯搜索系统,其可将用户输入的搜索条件解析为其它格式的指令,以便至不同网站进行相关网页的搜索及下载,并且对下载的网页进行解析,而无需重新开发、编译程序。鉴于上述内容,还有必要提供一种资讯搜索方法,其可将用户输入的搜索条件解析为其它格式的指令,以便至不同网站进行相关网页的搜索及下载,并且对下载的网页进行解析,而无需重新开发、编译程序。本专利技术的较佳实施方式提供一种资讯搜索系统,该系统包括至少一台主机,该主机包括读取模块,用于读取搜索条件;解析模块,用于将该搜索条件解析成基于可扩展标志查询语言的搜索条件;格式转换模块,用于将基于可扩展标志查询语言的搜索条件转换成可扩展标识语言的指令;指令队列控制模块,用于初始化一个指令队列,对格式转换后的指令进行定义,并根据定义的属性将其放入指令队列中进行排配;及搜索模块,用于根据读取模块从上述的指令队列头部所读取的指令至各网站搜索及下载包括需搜索的资讯的网页。本专利技术的较佳实施方式还提供一种资讯搜索方法,该方法包括如下步骤读取客户端输入的搜索条件;将该搜索条件解析成基于可扩展标志查询语言的搜索条件;将该基于可扩展标志查询语言的搜索条件转换成可扩展标识语言格式的指令;初始化一个指令队列;定义该指令,并根据定义的属性对该指令进行排配;从指令队列的头部读取一条指令;及执行该读取的指令,至各网站搜索及下载网页,执行后的指令将从指令队列中删除。相较现有技术,所述的,可将搜索条件转换为其它格式的指令至不同网站搜索相关网页,而不需重新开发、编译相关程序,并可节省搜索时间及人力成本的消耗。附图说明图1是本专利技术资讯搜索系统较佳实施方式的硬件架构图。图2是本专利技术资讯搜索系统较佳实施方式的客户端功能模块图。图3是本专利技术资讯搜索系统较佳实施方式的主机功能模块图。图4是本专利技术资讯搜索方法较佳实施方式的具体实施流程图。具体实施方式如图1所示,是本专利技术资讯搜索系统较佳实施方式的硬件架构图。该资讯搜索系统包括至少一台主机1,该主机1可与至少一个客户端2(图中只画出一个客户端2)连接,并可通过连接4与一个数据库3连接,此外,主机1还可通过网络6与至少一台应用服务器5相连(图中只画出一台应用服务器5)。主机1用于接收用户从客户端2所输入的搜索条件,对该搜索条件进行处理后透过网络6发送至应用服务器5搜索相关资讯,并将获取的搜索结果进行处理后输出至客户端2。此外,还用于根据用户的搜索条件从数据库3中查找或调取相关资讯,并将该资讯输出至客户端2。数据库3用于存储各类资讯,可根据用户需要更新资讯类型或内容,例如,数据库3可存储各国专利信息。应用服务器5用于依据主机1所发送的处理后的指令至各网站搜索相关资讯,并将搜索结果回馈至主机1。网络6可以为企业内部网(Intranet)、互联网(Internet)或其它类型网络。连接4是一种数据库连接,如开放式数据库连接(Open Database Connectivity,ODBC),或者Java数据库连接(Java Database Connectivity,JDBC)。如图2所示,是本专利技术资讯搜索系统较佳实施方式的客户端功能模块图。该客户端2提供一个交互式用户界面,其包括两个功能模块,分别是输入模块20及输出模块22。其中,用户通过输入模块20输入搜索条件,例如需搜索资讯的若干关键字,该搜索条件可通过应用服务器5至各网站搜索并下载用户所需资讯,也可通过连接4至数据库3搜索相关资讯。输入模块20还可用于设定搜索的URL(Uniform Resource Locator,在Internet的WWW服务程序上用于指定信息位置的表示方法)地址,则主机1将只在指定网站上搜索相关资讯,以限制其搜索范围。此外,该输入模块20还将用户所输入的搜索条件传送至主机1,该主机1对该搜索条件进行处理及进行相关资讯搜索并通过输出模块22将搜索结果返回至客户端2,以供用户查看该搜索结果。如图3所示,是本专利技术资讯搜索系统较佳实施方式的主机功能模块图。该主机1用于解析用户输入的搜索条件及进行相关搜索,并将搜索结果返回至客户端2,其包括五个功能模块,分别是读取模块11、解析模块13、格式转换模块15、指令队列控制模块17及搜索模块19。其中,读取模块11用于读取输入模块20所传送的搜索条件,例如若干关键字。解析模块13用于将读取模块11所读取的搜索条件解析成基于Xquery的搜索条件。其中,Xquery(Extensible Markup Language Query,可扩展标志查询语言)是一个从XML(Extensible Markup Language,可扩展标志语言)格式的文档中获取数据的查询语言,其程序或脚本是表达式以及一些可选的函数及定义的组合体,其具有表达XML值所必须的数据类型。用户在Xquery程序中加入表达式动态产生HTML(Hypertext Markup Language,超文本链接标示语言)内容,还可以在表达式中加入XML/HTML的代码作为变量或参数的值。XQuery为需要访问、挑选、集成和转换一个或多个XML集合的应用程序提供了类似于SQL(Structured Query Language,结构化查询语言)的查询能力。例如,若用户仅需要通过新浪网站搜索与富士康科技集团或鸿海公司相关的技术类新闻,则可设定关键词为′Foxconn OR″Hon Hai并设定URL地址为http://tech.sina.com.cn/tele,然后输入模块20将该搜索条件传送至读取模块11,读取模块11读取该搜索条件后,解析模块13将该搜索条件解析成基于Xquery的搜索条件,如下述语句let $keyword:=′Foxconn OR″Hon Haireturn<command><url><address>http://tech.sina.com.cn/tele</address><parsescript>sina_extract.xq</parse本文档来自技高网...

【技术保护点】
一种资讯搜索系统,包括至少一台主机,其特征在于,该主机包括:读取模块,用于读取搜索条件;解析模块,用于将该搜索条件解析成基于可扩展标志查询语言的搜索条件;格式转换模块,用于将基于可扩展标志查询语言的搜索条件转换成可扩展标识语言的指令;指令队列控制模块,用于初始化一个指令队列,对格式转换后的指令进行定义,并根据定义的属性将其放入指令队列中进行排配;及搜索模块,用于根据读取模块从上述的指令队列头部所读取的指令至各网站搜索及下载包括需搜索的资讯的网页。

【技术特征摘要】

【专利技术属性】
技术研发人员:李良普李忠一叶建发
申请(专利权)人:鸿富锦精密工业深圳有限公司鸿海精密工业股份有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1