通过无线通信网络来有针对性地分发搜索索引片段制造技术

技术编号:5382771 阅读:244 留言:0更新日期:2012-04-11 18:40
一种用于标识索引中与发自无线数据处理设备的之前的搜索请求相关的各部分并将该索引的这些部分传送到该无线数据处理设备以用于本地搜索的系统和方法。具体而言,一种根据本发明专利技术的一个实施例的方法,包括:收集关于位于网络上的多个内容的信息;在标识到新内容时自动生成并持续更新该多个内容的索引;分析发自无线数据处理设备的搜索请求;基于该分析,标识索引中与搜索请求相关的各部分;将该索引的这些部分传送到该无线数据处理设备;以及使用存储在该无线数据处理设备上的索引的这些部分来执行后续搜索请求。

【技术实现步骤摘要】
【国外来华专利技术】通过无线通信网络来有针对性地分发搜索索引片段专利技术背景 专利
本专利技术一般涉及数据处理系统领域。更具体而言,本专利技术涉及用于生成搜索索引 并通过无线通信网络来分发这些搜索索引的改进的体系结构。相关技术描述“搜索引擎”是被设计成帮助定位存储在计算机系统或诸如万维网等计算机系统 的网络上的数据的信息检索系统。搜索引擎允许用户请求满足特定准则的内容并生成匹配 这些准则的项目列表。该列表通常参考搜索结果的某一相关性度量来排序。如附图说明图1所示,搜索引擎130使用搜索“索引” 120来快速且高效地操作。在操作时, 索引生成逻辑Iio使用从web服务器100-102 (或其他类型的服务器)收集的信息来持续 更新索引120。索引生成逻辑110的一种公知形式是“web爬寻器”(也被称为“web蜘蛛” 或“web机器人”),它是以系统的、自动化方式浏览万维网并且从网页中提取文本和元数据 以生成索引120的程序或自动化脚本。“倒排索弓丨”是当今诸如Yahoo 和Google 等许多流行的搜索引擎所使用的特殊 形式的索引120。如图2所示,倒排索引是根据表示从网页中提取的文本串和其他形式的信 息(例如,XML标签、多媒体内容)的“令牌”200来构建的。倒排索引中的每一个令牌条目 都包括其中出现该令牌的网页的列表。例如,在图2中,网页1、4和6包括令牌“夏威夷”; 网页1、11和14包括令牌“假期”;而网页22、29、32和40包括令牌“MP3”。这些网页条目 可在每一个令牌下基于网页的相关性来排序(例如,从最相关到最不相关)。倒排索引显著地提高了搜索引擎130执行搜索的速度。例如,搜索引擎130仅仅 标识与搜索相关的令牌并提供与这些令牌相关联的网页,而不是在每一个单独的网页中搜 索客户机140、141所提交的指定文本串或一组文本串。在连接到因特网的计算机和便携式数据处理设备的数量持续增长的情况下,当前 搜索引擎需要大量计算能力。因此,需要用于使用索引来执行搜索的更高效的策略。概述描述了一种用于标识索引中与发自无线数据处理设备的之前的搜索请求相关的 各部分并将该索引的这些部分传送到该无线数据处理设备以用于本地搜索的系统和方法。 具体而言,一种根据本专利技术的一个实施例的方法,包括收集关于位于网络上的多个内容的 信息;在标识到新内容时自动生成并持续更新关于该多个内容的索引;分析发自无线数据 处理设备的搜索请求;基于该分析,标识索引中与搜索请求相关的各部分;将该索引的这 些部分传送到该无线数据处理设备;以及使用存储在该无线数据处理设备上的索引的这些 部分来执行后续搜索请求。附图简述从结合以下附图的以下详细描述中可以获得对本专利技术的更好的理解,附图中图1示出了现有技术搜索引擎和索引的体系结构。图2示出了在示例性倒排索引中排列令牌的方式。图3示出了本专利技术的一个实施例中所采用的服务。图4示出了用于将索引片段分发给数据处理设备的系统体系结构的一个实施例。图5示出了根据本专利技术的一个实施例的分发给示例性数据处理设备的索引片段。图6示出了其中生成关于不同类型的数据的索引片段的本专利技术的一个实施例。优选实施例的详细描述贯穿本说明书,出于说明目的阐述了众多具体细节以便提供对本专利技术的全面理 解。然而,对本领域技术人员将显而易见的是,没有这些具体细节也可实践本专利技术。在其它 情况下,以框图形式示出了公知的结构和设备以避免使本专利技术的基本原理含糊难懂。数据处理服务的实施例本专利技术的各实施例可以在无线设备310上实现,该无线设备310与数据处理服务 300进行通信,如图3所大致描述地。服务300和数据处理设备310的实施例在例如2002 年9 月 30 日提交的题为 SYSTEM AND METHOD FOR INTEGRATING PERSONAL INFORMATION MANAGEMENT ANDMESSAGING APPLICATIONS(用于集成个人信息管理和消息收发应用程序 的系统和方法)的共同待审的第10/262,298号申请中描述,而在数据处理设备310上动 态管理在场和联系信息的实施例在2003年6月30日提交的题为SYSTEMAND METHOD FOR DYNAMICALLY MANAGING PRESENCE ANDC0NTACT INFORMATION (用于动态管理在场和联系信 息的系统和方法)的共同待审的第10/611,019号申请中描述(下文中将这些申请称为“共 同待审的申请”),这些申请被转让给本申请的受让人并通过引用结合于此。现在将描述服务300的某些特征,之后是对用于通过无线网络来分发有针对性的 搜索索引的系统和方法的详细描述。然而,应当理解,共同待审的申请中所描述的特定数据 处理设备和系统体系结构对于实现本专利技术的基本原理并非必需。在一个实施例中,服务300将标准应用程序和数据转换成每一个无线通信设备 310都能够正确地解释的格式。因此,如图3所示,服务300的一个实施例包括用于处理来 自通信设备310的对因特网内容的请求340的内容转换逻辑320。更具体而言,服务300担 当数据处理设备310的代理,代表无线通信设备310将因特网请求340、341转发给适当的 因特网站点330,从因特网站点330接收标准格式的响应,并将响应324转换成无线通信设 备310能够处理的格式(例如,字节码)。例如,转换逻辑320可包括用于解释HTML代码并将该代码转换成能够在无线通信 设备310上处理/呈现的格式的呈现模块(未示出)。如现有应用中所描述的,在一个实 施例中,设备专用格式包括字节码/小程序,其在一个实施例中是Java字节码/小程序的 形式。然而,转换逻辑320可取决于所使用的无线通信设备310的具体类型(例如,具有解 释器模块的设备或者没有该模块的设备)来生成各种其他类型的已解释和/或未解释的代 码。因为服务300的一个实施例维护每一个数据处理设备310的能力/配置的密切知 识(例如,屏幕尺寸、图形/音频能力、可用存储器、处理能力、用户偏好...等),所以它可 准确地重构所请求的数据,而在同时最小化向设备310传送内容所需的带宽。例如,转换逻 辑320可对所请求的内容执行预缩放和色深度调整以使得将在数据处理设备310的显示器 内适当地呈现该内容。在进行这些计算时,该转换可将数据处理设备310上可用的存储器和处理能力计算在内。另外,转换逻辑320可使用各种压缩技术来压缩所请求的内容,并由 此节省网络带宽。用于通过无线网络来分发有针对性的搜索索引的系统和方法的新实施例服务100的一个实施例监视从每一个数据处理设备提交的搜索并且作为响应,基 于之前的搜索的主题来生成完整搜索索引的子集(此处被称为“索引片段”)。该服务然后 将索引片段传送到每一个数据处理设备,在那里这些索引片段可用于本地地执行搜索,由 此节省了服务100上的网络带宽和数据处理资源。如图4所示,在本专利技术的一个实施例中,服务300包括搜索引擎410,该搜索引擎 在现有搜索系统中使用索引420来执行搜索。另外,如在现有系统中,服务包括索引生成逻 辑411,该逻辑用于使用从因特网(或其他网络)上的web服务器100-102 (或其他服务器 类型)中标识的新内容来持续更新索本文档来自技高网...

【技术保护点】
一种计算机实现的方法,包括:收集关于位于网络上的多个内容的信息;在标识到新内容时自动生成并持续更新关于所述多个内容的索引;分析发自无线数据处理设备的搜索请求;基于所述分析,标识所述索引中与所述搜索请求相关的各部分;从所述索引中提取所述索引的所标识的各部分;将所述索引的所述各部分传送到所述无线数据处理设备;并且其中所述索引的所述各部分可在所述无线数据处理设备上用于执行后续搜索请求。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:TJ桑德斯
申请(专利权)人:丹吉尔股份有限公司
类型:发明
国别省市:US[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1