【技术实现步骤摘要】
本专利技术一般涉及电子数据管理,并且尤其是电子数据的索引。
技术介绍
由于关键记录(数据对象)越来越多地存储为电子格式,因此有必要将它们可靠地并且以防篡改的形式存储。而且,增长中的电子记录(例如,电子邮件,即时消息,药物开发日志,医疗记录等)的子集受到管理它们的长期保持和有效性的规定的约束。不符合应用的规定,在某些规则下可能导致严厉的处罚。在许多这样的规定中(例如,SEC规则17a-4)的关键要求是记录必须可靠地存储在非可擦除,非可重写存储器中,从而记录一旦被写入,就不能被改变或覆盖。这种存储器通常被称为WORM(单次写入多次读取)存储器,与能多次写入的可重写或WMRM(多次写入多次读取)存储器相对。由于目前的大量记录,这些记录必须进一步被编索引(例如,通过文件名,通过内容等等),以允许能在日益期望的短响应时间内中检索到与查询相关的记录。该索引典型地存储在可重写存储器中,但是能改变存储在一个可重写存储器中的索引,以有效地删除或更改一个记录。例如,能够操作该索引,从而不能利用该索引定位一个给定的记录。有一些在WORM存储器中存储索引的现有方法。例如,在一个大的记录集合已经被编索引(例如,当CD-R关上时)之后,用于传统WORM存储器(例如,CD-R和DVD-R)的索引(文件目录)被一次写入。在整个记录集合被加入之前,不提交该索引。一旦索引被写入,则新的记录不能被加入到索引中。因为记录是在一段时间中被加入的,该系统将创建多个索引,其使用了很多存储空间。更重要的是,查找一个特定的记录可能需要查找没有被索引的记录以及每一个索引。其它技术包括,仅为已经改变的索引 ...
【技术保护点】
一种用于组织数据对象以便进行快速检索的系统,包括:至少一个定义了数据扇区的数据存储介质;在数据存储介质上的至少一个数据对象;与所述至少一个数据对象相关联的至少一个关键词;以及在数据存储介质上的至少一个单次写入 索引,用来管理所述至少一个数据对象。
【技术特征摘要】
US 2004-12-15 10/905,1031.一种用于组织数据对象以便进行快速检索的系统,包括至少一个定义了数据扇区的数据存储介质;在数据存储介质上的至少一个数据对象;与所述至少一个数据对象相关联的至少一个关键词;以及在数据存储介质上的至少一个单次写入索引,用来管理所述至少一个数据对象。2.如权利要求1的系统,其中,其上存储了单次写入索引的数据存储介质是WORM存储介质。3.如权利要求1的系统,其中所述索引包括至少一个哈希表,其中所述至少一个哈希表用于存储所述至少一个关键词。4.如权利要求3的系统,其中所述至少一个哈希表包括一系列哈希表,该一系列哈希表在大小上一般是增加的。5.如权利要求4的系统,其中所述的一系列哈希表的大小基本上以指数的方式增加。6.如权利要求3的系统,其中在至少一个哈希表中存储关键词的操作包括判断在第一个哈希表中是否存在足够的空间,以及如果存在,则在第一个哈希表中存储该关键词,否则在第二个哈希表中存储该关键词,以及如果不存在第二个哈希表,则创建一个新的哈希表并在其中存储该关键词。7.如权利要求4的系统,其中在至少一个哈希表中存储关键词的操作包括判断在所述一系列哈希表的第一个哈希表中是否存在足够的空间,以及如果存在,则在该哈希表中存储该关键词,否则在所述一系列哈希表中的下一个哈希表中存储该关键词,以及如果在所述一系列哈希表中不存在下一个哈希表,则创建一个新的哈希表作为所述的一系列哈希表中的下一个哈希表并在其中存储该关键词。8.如权利要求3的系统,其中检索数据对象的操作包括,检测第一个哈希表,以判断数据对象的关键词是否存在于第一个哈希表中,并且如果不存在,则检测第二个哈希表,以判断数据对象的关键词是否存在于第二个哈希表中,并且如果不存在第二个哈希表,则返回数据对象不存在于系统中的指示。9.如权利要求8的系统,其中检测哈希表以判断数据对象的关键词是否存在于哈希表中的操作进一步包括,判断在该哈希表中是否具有足够的空间用于存储该关键词,以及如果数据对象的关键词不存在于哈希表中,并且哈希表中具有足够的空间用于存储该关键词,则返回数据对象不存在于系统中的指示。10.如权利要求4的系统,其中检索数据对象的操作包括,检测所述一系列哈希表中的第一个哈希表以判断数据对象的关键词是否存在于所述一系列哈希表的第一个哈希表中,并且如果不存在,则检测所述一系列哈希表中的下一个哈希表,以判断数据对象的关键词是否存在于所述一系列哈希表中的下一个哈希表中,并且如果所述一系列哈希表中不存在下一个哈希表,则返回数据对象不存在于系统中的指示。11.如权利要求10的系统,其中检测哈希表以判断数据对象的关键词是否存在于哈希表中的操作进一步包括,判断在哈希表中是否具有足够的空间用于存储该关键词,以及如果数据对象的关键词不存在于哈希表中,并且哈希表中具有足够的空间用于存储该关键词,则返回数据对象不存在于系统中的指示。12.如权利要求4的系统,其中检索数据对象的操作包括检测所述一系列哈希表中的最后一个哈希表以判断数据对象的关键词是否存在于所述一系列哈希表的最后一个哈希表中,并且如果不存在,则检测所述一系列哈希表中的前一个哈希表,以判断数据对象的关键词是否存在于所述一系列哈希表中的前一个哈希表中,并且如果所述一系列哈希表中不存在前一个哈希表,则返回数据对象不存在于系统中的指示。13.如权利要求3的系统,其中单次写入索引可以从小的数据对象集合扩展为非常大的数据对象的集合,并且其中单次写入索引包括索引条目,所述索引条目包含固定内容并且具有永久的存储位置。14.如权利要求13的系统,其中单次写入索引进一步包括元数据条目,其包含固定的内容并且具有永久的存储位置,这样的元数据条目被用于定位索引条目。15.如权利要求13的系统,其中,在关键词已经在索引中存储之后,在索引中能够找到包含给定关键词的索引条目的可能的存储位置是固定的。16.如权利要求13的系统,其中用于存储索引条目的可能的位置依赖于相应的数据对象的终止日期。17.一种用于组织数据对象以便进行快速检索的方法,包括接收将被存...
【专利技术属性】
技术研发人员:许为善,翁绍基,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。