用于搜索网络的系统和方法技术方案

技术编号:2872954 阅读:121 留言:0更新日期:2012-04-11 18:40
一种用于为了基于网络的涉及搜索查询的诸如多媒体和流式传输媒体的内容而搜索网络的系统,该系统包括用于格式化一个搜索查询的适配器(12),一个包括搜索结果的第一数据库(18),一个第二数据库,它包括涉及从可搜索元数据产生的搜索结果的可返回的元数据,一个搜索处理器(14)以及包括一个搜索引擎固有的数据库的至少一个搜索引擎核心(20)。搜索引擎(14)调整所述第一数据库(18)和所述第二数据库(16)的搜索,并且将格式化的搜索查询提供到搜索引擎核心(20)。搜索处理器(14)还提供和接收搜索结果去往和来自所述第一数据库(18)和所述第二数据库(16),并且将搜索结果提供给所述适配器(12)。所述系统将预定量的先前搜索结果存储在第一数据库(18)中,以便从数据库(18)中检索对于一个当前搜索的搜索结果,避免通过包括可搜索元数据的搜索引擎核心(20)进行搜索。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术的
总体上涉及计算机相关的信息搜索和检索,并且更具体而言,本专利技术涉及用于搜索基于网络的内容的健壮的系统和方法。下面介绍理解本专利技术的背景。用户可获得的过量的多媒体和流式传输媒体文件是对于因特网(也称作万维网或者web)的普及有贡献的一个方面。不过,找到隐藏在web上的数百万文件中的特定多媒体或者流式传输媒体文件通常是极其困难的任务。在web上可获得的信息内容的量和种类可能继续以相当快的速度增加。与web的高度分散特性组合的这一增加在定位特定信息内容中产生了困难。流式传输媒体指被经由因特网或者其它网络环境递送到用户计算机并且在整个文件的递送被完成之前就开始在用户计算机上播放的音频、视频、多媒体、文本和交互式数据文件。流式传输媒体的一个优点是流式传输媒体文件在整个文件被下载之前就开始播放,从而为用户节省了通常与下载整个文件相关联的长等待时间。数字记录的音乐、电影、预告片、新闻报道、无线电广播和实况事件都对于web上的流式传输内容的增加有贡献。此外,诸如电缆、DSL和T1的不太贵的高带宽连接正在为因特网用户提供对于来自新闻组织、好莱坞摄影棚、独立制片人、记录单以及甚至家庭用户的流式传输媒体内容的更迅速、更可靠的访问。用户通常通过搜索引擎来搜索因特网上的特定信息。一个搜索引擎包括一组可以在诸如局域网(LAN)的网络或因特网以及万维网中的一个网站访问的程序。称作“机器人”或者“蜘蛛”的一个程序在搜索文档(例如网页)和其它程序中预先遍历一个网络,并且建立在文档中发现的关键字的大索引文件。典型地,用户明确表达一个包括一个或多个搜索项的查询,并且将该查询提交给搜索引擎的另一个程序。在响应中,搜索引擎检查其本身的索引文件并且显示一个与所述搜索查询相匹配的文档列表,通常作为超级链接。然后,用户可以激活超级链接之一以便看到包含在文档中的信息。不过,传统的搜索引擎有缺点。例如,许多典型的搜索引擎被用于只发现文本信息。特别是,它们不适合用于包含在结构化数据库(例如关系数据库)中的索引信息、话音相关的信息、音频相关的信息、多媒体和流式传输媒体等。而且,混合来自不兼容数据源的数据对于传统的搜索引擎是困难的。此外,许多传统的搜索引擎系统既不够健壮也不足够可升级来为用户提供搜索结果,并且不管搜索结果而迅速更新其数据库。许多搜索引擎系统包括驻留在特定处理器上的软件单元,其中软件单元不是可移植的。也就是说,软件单元不能被根据需要而下载到另一个处理器上。而且,许多软件单元都是提供商特定的,其中搜索引擎系统不能容纳另一个提供商的提供类似功能的软件。在软件单元可以安装在几个处理器上来并行处理大量数据的情况下,许多系统是不可升级的,这是因为所使用的处理器的数量不能被根据需要而增加或者减少。因此,需要一种没有上述缺陷和缺点的搜索系统。本专利技术描述了一种用于为了基于网络的涉及搜索查询的内容而搜索网络的系统,它包括用于格式化一个搜索查询的适配器。所述系统还包括一个含有先前的搜索结果的第一数据库以及用于存储当前搜索结果的第二数据库。还包括至少一个搜索引擎,用于为了涉及搜索查询的内容而搜索搜索引擎内在的数据库,还包括一个搜索处理器。搜索处理器调整第一数据库的搜索和所述至少一个搜索引擎,并且将已格式化的搜索查询提供给所述至少一个搜索引擎。搜索处理器还提供和接收搜索结果去往和来自第一数据库和第二数据库,并且将搜索结果提供给适配器。一种用于为了基于网络的涉及搜索查询的内容而搜索网络的方法包括接收搜索查询、格式化搜索查询以及为了基于网络的涉及搜索查询的内容而搜索数据库。所述数据库包括先前的搜索结果。如果在数据库中没有找到基于网络的涉及搜索查询的内容,则已格式化的搜索查询被提供给至少一个搜索引擎。搜索结果被从数据库或者至少一个搜索引擎中检索,并且检索到的搜索结果被格式化。 附图说明图1是互连计算机系统网络的系统的程式化示意图;图2是根据本专利技术的搜索系统的功能框图;图3是根据本专利技术的包括多个搜索处理器的搜索系统的功能框图;以及图4是根据本专利技术用于搜索基于网络的内容的方法的流程图。因特网是世界范围内的计算机网络系统,也就是其中一个计算机的用户能够从任何其它计算机获取信息并且与其它计算机的用户通信的一组网络。因特网最被广泛使用的部分是万维网(通常缩写为“WWW”或者称作“web”)。web的一个显著特征是其对于超文本的使用,它是交叉参考的方法。在大多数网站中,某些字或者短语以不同于周围文本的颜色而出现。这个文本通常还被加上下划线。有时候,有“可点击”的按钮、图像或者图像的部分。使用web提供对于成百万页信息的访问。利用诸如NETSCAPE NAVIGATOR和MICROSOFT INTERNETEXPLORERE的web浏览器进行web“冲浪”。一个特定网站的外观会依赖于所使用的特定浏览器而稍微变化。最近的浏览器的版本具有提供动画、虚拟现实、声音和音乐的“插件程序”。本专利技术是一种系统和方法,用于在计算机网络上通过使用元数据的搜索系统来检索基于网络的内容,包括媒体文件和涉及媒体文件的数据。如这里所使用的,术语“媒体文件”包括音频、视频、文本、多媒体数据文件和流式传输媒体文件。多媒体文件包括文本、图像、视频和音频数据的任何组合。流式传输媒体包括音频、视频、多媒体、文本和交互式数据文件,它们被通过因特网或其它通信网递送到用户计算机并且在整个文件的递送被完成之前就开始在用户计算机/设备上播放。流式传输媒体的一个优点是流式传输媒体文件在整个文件被下载之前就开始播放,为用户节省了通常与下载整个文件相关的长等待时间。数字记录的音乐、电影、预告片、新闻报道、无线电广播和实况事件都对于web上的流式传输内容中的增加有贡献。此外,通过使用诸如电缆、DSL、T1线路的高带宽连接和无线网络(例如基于2.5G或者3G的蜂窝网络)减少通信网络的成本为用户提供对于来自新闻组织、好莱坞摄影棚、独立制片人、记录单以及甚至家庭用户本身的流式传输媒体内容的更快、更可靠的访问。流式传输媒体的例子包括歌曲、政治演讲、新闻广播、电影预告片、实况广播、无线电广播、金融会议呼叫、实况音乐会、web-cam电影胶片以及其它特殊事件。流式传输媒体被以各种格式编码,包括REALAUDIO、REALVIDEO、,REALMEDIA、,APPLE QUICKTIME、MICROSOFT WINDOWSMEDIA FORMAT、QUICKTIME、MPEG-2 LAYER IIIAUDIO以及MP3。典型地,媒体文件被利用表示与特殊格式的兼容性的扩展名(后缀)来设计。例如,以扩展名.ram、.rm、rpm之一结尾的媒体文件(例如音频和视频文件)与REALMEDIA格式兼容。下表中列出了文件扩展名及其兼容格式的一些例子。可以在http//www.bowers.cc/extensions 2.htm上找到媒体类型、扩展名和兼容格式的更详尽的列表。表1 作为描述数据的元数据字面上指“关于数据的数据”。元数据是包括描述其它数据(例如媒体文件)的内容或者属性的信息的数据。例如,题为“Dublin Core Metadata for Resource Discovery(用于资源本文档来自技高网...

【技术保护点】
一种用于为了基于网络的涉及搜索查询的内容而搜索网络的方法,该方法包括步骤:接收所述搜索查询;格式化所述搜索查询;为了所述基于网络的涉及所述搜索查询的内容而搜索数据库,该数据库包括先前的搜索结果;如果在所述数据库中没有找到基于 网络的涉及所述搜索查询的内容,则将所述被格式化的搜索查询提供给至少一个搜索引擎;从所述数据库和所述至少一个搜索引擎之一中检索搜索结果;并且格式化所述检索到的搜索结果。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:CA波特JD雷希霍尔德EC雷姆
申请(专利权)人:汤姆森许可公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1