【技术实现步骤摘要】
本专利
总体上涉及到有关计算机的信息搜索和检索,具体而言,涉及到片段式搜索网上的内容。作为理解本专利技术的背景,因特网(也称为万维网或者Web)在其普及方面作出的贡献使得用户可以利用的多媒体和流媒体文件供过于求。然而,查找淹没于Web上的数以万计的文件之中的具体多媒体或流媒体文件却常常是一件极其困难的任务。可从Web上获得的信息内容的容量和种类可能在以相当可观的速度持续增加。这样的增长结合Web的高度分散性使得在定位特定信息内容方面会产生相当大的困难。流媒体是指这样的音频、视频、多媒体、文本以及交互式数据文件,它们通过因特网或者其它网络环境传送到用户的计算机,并在整个文件都传送完毕之前就开始在用户的计算机上播放。流媒体的一个优点在于在整个文件都被下载之前,流媒体文件就开始播放,从而免去用户长久等待,这种长久等待通常是与下载整个文件相关联的。以数字方式记录的音乐、电影、预告片、新闻报道、无线广播以及事件实况都有助于增加Web上的流内容。此外,不怎么昂贵的高带宽连接(诸如电缆、DSL以及Tl)使因特网用户能更加快速、更加可靠地访问新闻机构、好莱坞电影制片商、独立生产商、记录标记、甚至家庭用户的流媒体内容。用户通常使用搜索引擎搜索因特网上的具体信息。搜索引擎包括一组在网络(例如局域网(LAN)或者因特网以及万维网)中的网络站点上可被访问的程序。一种被称为“机器人”或“蜘蛛”的程序在搜索文档(例如网页)以及其它程序时预先遍历网络,并建立在所述文档中发现的关键字的大型索引文件。典型地,用户形成包含一个或多个搜索词的查询,并将该查询提交给搜索引擎的另一个程 ...
【技术保护点】
一种用于搜索网络中的目标内容的方法,所述网络包括网页,所述方法包括如下步骤:将每个遇到的网页分解为片段;以及搜索每个片段中与所述目标内容有关的内容。
【技术特征摘要】
1.一种用于搜索网络中的目标内容的方法,所述网络包括网页,所述方法包括如下步骤将每个遇到的网页分解为片段;以及搜索每个片段中与所述目标内容有关的内容。2.权利要求1的方法,其中所述搜索步骤是递归执行的以便进一步搜索每个所述片段中的与所述目标内容有关的内容。3.权利要求1的方法,其中所述分解步骤包括如下步骤将在每一网页中所包含的文本内容与预定的和动态地确定的文本模式中的至少之一进行比较;为在与一种模式相匹配的每个网页上所包含的文本内容的每个模式生成相应的片段;将在每一相应片段中所包含的文本内容与预定的和动态地确定的文本模式中的至少之一进行递归地比较;以及为在与一种模式相匹配的每个片段中所包含的文本内容的每个模式生成相应的片段。4.权利要求3的方法,还包括如下步骤形成重构的链接,其中,重构的链接包括在一个片段中所包含的匹配的模式和匹配的模式的一部分中的至少之一。5.权利要求3的方法,其中所述模式包括与在流媒体、多媒体、与流媒体有关的元数据、与多媒体有关的元数据以及其它网页中的至少一个有关的文本数据。6.权利要求1的方法,还包括如下步骤组合所述搜索每一片段的结果,所述结果包括至统一资源指示符(URI)的至少一个链接,其中,所述组合步骤包括添加、删除以及识别在至少一个URI中所包含的词中的至少之一。7.一种用于搜索网络中的目标内容的计算机系统,所述网络包括网页,所述计算机系统包括至少一台计算机,在所述系统中的所有计算机都是能通信的方式相互连接的,其中所述至少一台计算机中的每一台均包括在其中存储的至少一个程序,所述至少一个程序用于实现所述至少一台计算机中的每一台计算机之间的通信,所述至少一个程序中的每一个均结合另一个运行以使所述至少一台计算机执行如下步骤将每个遇到的网页分解为片段(218);以及搜索每个片段中与所述目标内容有关的内容。8.权利要求7的计算机系统,其中所述搜索步骤是由所述至少一台计算机递归地执行的,以便进一步搜索每个所述片段中的与所述目标内容有关的内容。9.权利要求7的计算机系统,其中所述至少一个程序使所述至少一台计算机执行如下步骤将在每一网页中所包含的文本内容与预定的和动态地确定的文本模式中的至少之一进行比较(220);为在与一种模式相匹配的每个网页上所包含的文本内容的每个模式生成相应的片段;将在每一相应片段中所包含的文本内容与预定的和动态地确定的文本模式中的至少之一进行递归比较;以及为在与一种模式相匹配的每个片段中所包含的文本内容的每个模式生成相应的片段。10.权利要求9的计算机系统,其中所述至少一个程序使所述至少一台计算机执行如下步骤形成重构的链接,其中,重构的链接包括在一个片段中所包含的匹配的模式和匹配的模式的一部分中的至少之一。11.权利要求9的计算机系统,其中所述模式包括与在流媒体、多媒体、与流媒体有关的元数据、与多媒体有关的元数据以及其它网页中的至少一个有关的文本数据。12.权利要求7的计算机系统,其中所述至少一个程序使所述至少一台计算机执行如下步骤组合所述搜索每一片段的结果,所述结果包括至统一资源指示符(URI)的至少一个链接,其中,所述组合步骤包括添加、删除以及识别在至少一个URI中所包含的词中的至少之一。13.一种在其上包括了用于使...
【专利技术属性】
技术研发人员:PT桑农,BS米勒,SCC李,JL科拉,
申请(专利权)人:汤姆森许可公司,
类型:发明
国别省市:FR[法国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。