当前位置: 首页 > 专利查询>微软公司专利>正文

智能容器索引与搜索制造技术

技术编号:2827802 阅读:188 留言:0更新日期:2012-04-11 18:40
一种用于索引文件容器的内容的计算机实现的方法,所述方法包括以下步骤:    访问文件容器内的项;以及    为所述文件容器内的每个项:    确定所述项是否是一目标文件的文件引用;    响应于所述项目是文件引用,确定所述文件引用的目标文件是否位于索引范围内;    响应于所述目标文件位于所述范围内,索引所述文件引用的外在特性;以及    响应于所述目标文件位于所述范围之外,索引所述目标文件的内在和外在特性以及内容。

【技术实现步骤摘要】
【国外来华专利技术】背景实际上每台计算机的一个必需部分是用来存储计算机程序及相关联数据的文件系统。近些年的技术发展能够搜索文件系统,从而允许用户容易地定位任何文件。在数据文件的情况下,用户不仅可以基于文件名来搜索,还可以基于文件的属性(例如,作者、创建日期)甚至是文件内的文本内容(例如,文档中的单词、电子邮件中的单词)来进行搜索。在某种程度上,搜索能力业已随着索引技术的发展而增强,索引是以改善执行搜索所花费的时间的方式方式对一个或多个文件系统的内容进行编目的过程。这些索引通常与因特网搜索引擎(例如,MSN搜索、谷歌(Google))相关联,而这些搜索引擎对巨大的万维网内容地带进行编目。但是索引也降临到了台式计算机上,从而增强了对本地文件系统的搜索。在对计算机内容进行编目时,搜索索引程序可能会遇到文件容器。文件容器的类型可以包括压缩和/或存档文件(例如zip、存储柜(CAB)、磁带档案(TAR))和其它相关联文件引用集合。文件引用可用作仅仅指向本地或远程文件系统上某处一文件的占位符文件。文件引用还可以指向除文件以外的项,诸如含有多封电子邮件的文件内的一特定电子邮件。当索引服务索引一特定文件并且还索引以该具体文件作为其目标的文件引用时,索引服务可创建实质上关于同一文件的多个索引条目。结果,同一文件可在一组特定搜索结果中多次出现,以致不可避免地混淆用户。此外,如果引用的文件位于远程文件系统上,则索引程序可能不知道要对其内容进行编目,以致不恰当地阻止其被包含在搜索结果中,其他问题会在索引程序遇到诸如zip文件等文件容器时出现。索引程序可能无法访问文件容器的内容,以致会把来自搜索的潜在相关结果排除在外。但是,即便文件容器是可访问的,索引程序也可能无法恰当索引存储在该文件容器内的文件以及文件引用,从而可能导致混乱或者不完全的搜索结果。-->概述各方面涉及索引文件容器内的计算机文件和文件引用。在其它方面,创建智能协议处理程序用以访问文件容器并选择性地索引其内容以防止在搜索结果内重复文件条目。附图本专利技术的各方面作为示例而非限制在附图中示出,在附图中,相同的标号指示相同的元素,其中:图1示出了通用数字计算环境的示意图;图2描绘了本地文件系统的一个说明性部分;图3描绘了用于列表文件的一个说明性界面;图4描绘了用于zip文件的一个说明性界面;图5和图6描绘了说明性搜索结果;以及图7是示出了一种用于索引文件容器的说明性方法的流程图。详细描述各方面提供了用于智能地索引和搜索文件系统的内容的方法和系统,包括对文件容器(例如,zip文件或列表文件)索引和搜索。注意到将在随后的描述中阐明各元素之间的各种连接。除非特别指明,否则这些连接可以是直接或间接的,并且本说明书并不旨在限于这一方面。概览通过对文件容器的内容进行智能索引,能够避免重复、混乱或不完整的搜索结果。包含在档案和/或压缩文件内的标准文件可以被正常索引,而指向本地存储的文件的文件引用仅被部分索引。通用计算环境图1示出可在其中实现本专利技术的一种合适的计算系统环境100的示例。计算系统环境100只是合适的计算环境的一个示例,而非意在暗示对本专利技术使用范围或功能有任何限制。计算环境100也不应解释成对于在示例性操作环境100中所示出的任一组件或其组合有任何依赖或要求。-->本专利技术可运行于多种其它通用或专用计算系统环境或配置。适合在本专利技术中使用的公知的计算系统、环境和/或配置的示例包括,但不限于,个人计算机、服务器计算机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子品、网络计算机、小型机、大型计算机、包括上述系统或设备中的任一个的分布式计算机环境等。本专利技术可在诸如程序模块等由计算机执行的计算机可执行指令的通用上下文中描述。一般而言,程序模块包括例程、程序、对象、组件、数据结构等,它们执行特定任务或实现特定抽象数据类型。本专利技术也可以在其中由通过通信网络而被连接的远程处理设备来执行任务的分布式计算环境中实践。在分布式计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机存储介质中。参考图1,用于实现本专利技术的一个示例性系统包括计算机110形式的通用计算设备。计算机110的组件可以包括,但不限于,处理单元120、系统存储器130和将包括系统存储器在内的各种系统组件耦合至处理单元120的系统总线121。系统总线121可以是几种类型的总线结构中的任一种,包括存储总线或存储控制器、外围总线、以及使用各种总线体系结构中的任一种的局部总线。作为示例,而非限制,这样的体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强型ISA(EISA)总线、视频电子技术标准协会(VESA)局部总线和外围部件互连(PCI)总线(也称为背板(Mezzanine)总线)。计算机110通常包括各种计算机可读介质。计算机可读介质可以是能够被计算机110访问的任何可用介质,且包括易失性和非易失性介质、可移动和不可移动介质。作为示例,而非限制,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括易失性和非易失性、可移动和不可移动介质,它们以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据这样的信息的任意方法或技术来实现。计算机存储介质包括,但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或能用于存储所需信息且可以由计算机110访问的任何其它介质。通信介质通常具体化为诸如载波或其它传输机制等已调制数据信号中的计算机可读指令、数据结构、程序模块或其它数据,且包含任何信息传递介质。术语“已调制数据信号”指的其一个或多个特征以在信号中编码信息的方式被设定或更改的信号。作为示例,而非限制,通信介质包括有线介质,诸如有线网络或直接线连接,以及无线介质,诸如声学、RF、红外线和其它无线介质。上-->述的任意组合应该包含在计算机可读介质的范围内。系统存储器130包括诸如只读存储器(ROM)131和随机存取存储器(RAM)132的易失性和/或非易失性存储器的形式的计算机存储介质。基本输入/输出系统133(BIOS)包含有助于诸如启动时在计算机110中元件之间传递信息的基本例程,它通常存储在ROM 131中。RAM 132通常包含处理单元120可以立即访问和/或...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于索引文件容器的内容的计算机实现的方法,所述方法包括以下步
骤:
访问文件容器内的项;以及
为所述文件容器内的每个项:
确定所述项是否是一目标文件的文件引用;
响应于所述项目是文件引用,确定所述文件引用的目标文件是否位于索
引范围内;
响应于所述目标文件位于所述范围内,索引所述文件引用的外在特性;
以及
响应于所述目标文件位于所述范围之外,索引所述目标文件的内在和外
在特性以及内容。
2.如权利要求1所述的计算机实现的方法,其特征在于,还包括以下步骤:
索引所述文件容器的内在和外在特性以及内容。
3.如权利要求2所述的计算机实现的方法,其特征在于,索引所述文件容器
的所述特性和内容包括使用IFliter。
4.如权利要求1所述的计算机实现的方法,其特征在于,确定所述目标文件
是否位于所述索引范围内包括确定所述目标文件的位置。
5.如权利要求1所述的计算机实现的方法,其特征在于,访问所述文件容器
内的项包括使用协议处理程序。
6.如权利要求1所述的计算机实现的方法,其特征在于,所述文件容器包括
列表文件。
7.如权利要求1所述的计算机实现的方法,其特征在于,所述文件容器包括
zip格式文件、存储柜格式文件和磁带档案格式文件中的至少一种。
8.如权利要求1所述的计算机实现的方法,其特征在于,所述外在特性包括
有关所述文件引用的用户输入备注。
9.一种用于索引外壳名字空间扩展的内容的系统,包括:
存储器,用于存储电子指令;
存储,用于存储多个文件;以及
处理器,它被配置成接受所述电子指令并执行以下步骤:
索引所述多个文件;
遇到来自所述多个文件的一文件,其中所述文件包含至少一个文件引用;
以及
作为外壳名字空间扩展来访问所述文件以索引所述至少一个文件引用。
10.如权利要求9所述的系统,其特征在于,所述处理器还被配置成执行以
下步骤...

【专利技术属性】
技术研发人员:D·G·德沃切克J·C·贝尔特T·P·麦基
申请(专利权)人:微软公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1