存储数据的减少冗余制造技术

技术编号：21771445 阅读：37 留言：0更新日期：2019-08-03 21:30

本公开提供一种用于将电子数据存储在随机存储器上的计算机实现的方法和系统。所述方法包括：接收一组参数，其中参数包括文件系统信息、可启动性信息和分区信息；接收元数据；接收一个或多个文件，其中每个文件具有文件名并且包括多个比特；将参数和元数据存储在中介器上；编码所述一个或多个文件中的每一个以存储在随机存取存储器中；对于编码文件的每一个，将多个比特标记符存储在随机存取存储器上的某个位置处；在中介器上存储每个文件名与随机存取存储器上的位置的相关性，其中相关性可存储在单个中介器上；将一个或多个文件存储在随机存取存储器上，一个或多个文件不具有文件系统信息、可启动性信息和分区信息中的任何一个。

Reduction of redundancy in data storage

全部详细技术资料下载

【技术实现步骤摘要】
存储数据的减少冗余本申请为申请日是2014年1月31日、申请号是201480016699.9(PCT/US2014/014225)、专利技术名称为“存储数据的减少冗余”的中国申请的分案申请。专利
本专利技术涉及数据的存储。专利技术背景二十一世纪已经见证了人们和公司生成和存储的数字化信息的量成指数级增长。这类信息由通常存储在磁性表面(如磁盘)上的电子数据组成。这些磁盘含有尺寸为亚微米并且能够存储数条单独二进制数据的较小区域。在任何给定实体所存储的巨量数据内，经常存在信息的明显重复。举例而言，相同的公司信头可以出现在数千个文档中，并且对应于这个数据的每个文件将含有针对信头进行编码的比特。历史上，许多实体已经接受这类重复存在于它们的文件中，以及相同信息的冗余存储的无效是开展业务的成本。因为存储成本不断增加以及存储的可用性不断降低，所以众多实体已经开始探究某些方式来供存储比文件内或文件之间所有重复信息更少的信息。理论上，力图避免重复信息的存储或最小化重复信息存储的次数的实体，可以力图识别其数据集内的独特比特或字节样式，并且以最小的次数来存储这些独特比特或字节样式。为了执行这些方法，在准备新的文件用于存储时，这些文件内的信息将会与已存储的参考信息集进行比较，并且，只有正在考虑的比特或字节样式是独特的，其才会被存储。如果所述比特或字节样式不是独特的，那么便会用参考数据来取代冗余数据，所述参考数据在大小上小于指向所存储数据的数据，所述数据是存储数据的重复。减少重复信息存储的次数的目标面临很多挑战，包括但不限于：(1)保持检查冗余的足够速度；(2)保持数据重建而便于检...

【技术保护点】
1.一种用于将电子数据存储在随机存取存储器上的计算机实现的方法，所述方法包括：接收一组参数，其中所述参数包括文件系统信息、可启动性信息和分区信息；接收元数据；接收一个或多个文件，其中每个文件具有文件名并且包括多个比特；将所述参数和元数据存储在中介器上；编码所述一个或多个文件中的每一个以存储在随机存取存储器中，其中，对于所述一个或多个文件中的每一个，编码包括：将所述文件的所述多个比特分成N个比特的多个子单元；以及使用比特标记符表，为每个子单元分配比特标记符，以形成对应于编码文件的多个比特标记符；其中相同的子单元被分配相同的比特标记符；以及其中所述比特标记符表包括一组X个标记符，其中X等于子单元内的N个比特的不同组合的数量；对于所述编码文件的每一个，将所述多个比特标记符存储在所述随机存取存储器上的某个位置处；在所述中介器上存储每个文件名与所述随机存取存储器上的所述位置的相关性，其中所述相关性可存储在单个中介器上；以及将所述一个或多个文件存储在所述随机存取存储器上，所述一个或多个文件不具有文件系统信息、可启动性信息和分区信息中的任何一个。

【技术特征摘要】
2013.02.01 US 13/756,921;2013.03.12 US 13/797,093;1.一种用于将电子数据存储在随机存取存储器上的计算机实现的方法，所述方法包括：接收一组参数，其中所述参数包括文件系统信息、可启动性信息和分区信息；接收元数据；接收一个或多个文件，其中每个文件具有文件名并且包括多个比特；将所述参数和元数据存储在中介器上；编码所述一个或多个文件中的每一个以存储在随机存取存储器中，其中，对于所述一个或多个文件中的每一个，编码包括：将所述文件的所述多个比特分成N个比特的多个子单元；以及使用比特标记符表，为每个子单元分配比特标记符，以形成对应于编码文件的多个比特标记符；其中相同的子单元被分配相同的比特标记符；以及其中所述比特标记符表包括一组X个标记符，其中X等于子单元内的N个比特的不同组合的数量；对于所述编码文件的每一个，将所述多个比特标记符存储在所述随机存取存储器上的某个位置处；在所述中介器上存储每个文件名与所述随机存取存储器上的所述位置的相关性，其中所述相关性可存储在单个中介器上；以及将所述一个或多个文件存储在所述随机存取存储器上，所述一个或多个文件不具有文件系统信息、可启动性信息和分区信息中的任何一个。2.如权利要求1所述的计算机实现的方法，其中所述编码还包括使用所述比特标记符表来创建转换文件。3.如权利要求2所述的计算机实现的方法，其中所述转换文件不包含所述文件系统信息、可启动性信息或分区信息中的任何一个。4.如权利要求1所述的计算机实现的方法，其中所述参数存储在多个预留磁道中。5.如权利要求4所述的计算机实现的方法，其中所述多个预留磁道为第一组预留磁道，并且所述计算机实现方法还包括将所述参数复制到第二组预留磁道中。6.如权利要求5所述的计算机实现的方法，还包括使用所述第二组预留磁道来检查所述第一组预留磁道中的错误。7.如权利要求1所述的计算机实现的方法，其中所述元数据对应于用于自动精简配置的指令。8.如权利要求1所述的计算机实现的方法，其中所述文件接收自主机，所述主机将所述文件记录为存储在虚拟地址处，并且所述虚拟地址与所述文件的位置不同。9.如权利要求1所述的计算机实现的方法，其中所述编码包括使用每个相应文件中的子单元的出现频率。10.如权利要求1所述的计算机实现的方法，其中存储在所述比特标记符表内的至少50％的比特标记符的大小小于所述子单元。11.如权利要求1所述的计算机实现的方法，其中存储在所述比特标记符表内的至少70％的比特标记符的大小小于所述子单元。12.如权利要求1所述的计算机实现的方法，其中存储在所述比特标记符表内的至少90％的比特标记符的大小小于所述子单元。13.一种数据存储和检索的计算机实现的方法，所述方法包括：通过管理器将数据存储在中介器中，其中所述数据包括文件系统信息、可启动性信息和分区信息，其中所述中介器包括第一组磁道、第二组磁道、第三组磁道和第四组磁道，其中所述中介器从非高速缓存器存储介质远程地存储，其中所述非高速缓存器存储介质包括随机存取存储器，并且其中所述数据存储在所述第一组磁道中；将元数据存储在所述第三组磁道中；编码一个或多个文件以存储在所述随机存取存储器中，其中，对于所述一个或多个文件中的每一个，编码包括：将所述文件分成N个比特的多个子单元；使用比特标记符表，为每个子单元分配比特标记符，以形成对应于编码文件的多个比特标记符；以及使用所述比特标记符表创建转换文件；其中相同的子单元被分配相同的比特标记符；以及其中所...

【专利技术属性】
技术研发人员：B·伊格诺米瑞罗，S·梁，
申请(专利权)人：辛博立科伊奥公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人