分布式存储系统的数据的处理方法、装置及系统制造方法及图纸

技术编号：11374827 阅读：96 留言：0更新日期：2015-04-30 12:48

本发明专利技术提供了一种分布式存储系统的数据的处理方法、装置及系统，该方法包括：获取目标数据的第一模式结构和源数据的第二模式结构；根据上述第一模式结构和上述第二模式结构将上述源数据处理为上述第一模式结构的结构化数据。本发明专利技术解决了相关技术中分布式存储系统中数据模式结构描述不灵活的问题，具有提高数据模式结构描述灵活性从而提高数据处理效率的有益效果。

全部详细技术资料下载

【技术实现步骤摘要】
分布式存储系统的数据的处理方法、装置及系统
本专利技术涉及通信领域，具体而言，涉及一种分布式存储系统的数据的处理方法、装置及系统。
技术介绍
云计算(CloudComputing)是网格计算(GridComputing)、分布式计算(DistributedComputing)、并行计算(ParallelComputing)、效用计算(UtilityComputing)、网络存储(NetworkStorageTechnologies)、虚拟化(Virtualization)、负载均衡(LoadBalance)等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的系统。分布式存储是云计算范畴中的一个领域，其作用是提供海量数据的分布式存储服务以及高速读写访问的能力。数据是有模式结构的，在关系型数据库中，数据的模式结构是数据库来维护的，但是在非关系型的数据存储系统中，通常不感知数据的模式结构。于是，在存储数据时，要根据模式结构将数据转换为二进制数据流，然后存入分布式存储系统中；读取数据时，从分布式存储系统中取出二进制数据流，要根据一定规则还原为可以使用的数据。以上，数据的转换和还原，通常也称之为数据的序列化和反序列化过程。在分布式的应用中，数据的写入者和数据的读取者可能不是同一个程序。如果数据模式结构永远不变，读取者随时都可以根据自己本地的数据模式结构正确的还原出写入者的数据。但通常随着程序的升级，数据的模式结构通常是要发生变化的。而分布式存储中往往是海量数据，难以短时间内全部读出并修改数据的模式结构；此外...

【技术保护点】
一种分布式存储系统的数据的处理方法，其特征在于，包括：获取目标数据的第一模式结构和源数据的第二模式结构；根据所述第一模式结构和所述第二模式结构将所述源数据处理为所述第一模式结构的结构化数据。

【技术特征摘要】
1.一种分布式存储系统的数据的处理方法，其特征在于，包括：获取目标数据的第一模式结构和源数据的第二模式结构；根据所述第一模式结构和所述第二模式结构将所述源数据处理为所述第一模式结构的结构化数据；其中，所述第一模式结构的第一标识号和所述第二模式结构的第二标识号由分布式存储模式管理服务器统一分配；其中，所述第二标识号是通过如下方式获取的：向所述分布式存储模式管理服务器发送所述第二模式结构；接收所述分布式存储模式管理服务器根据所述第二模式结构返回的所述第二标识号，其中，在所述分布式存储模式管理服务器在本地的现有模式结构中匹配到所述第二模式结构的情况下，所述第二标识号为所匹配到的所述现有模式结构的标识，否则所述第二标识号为新分配的标识。2.根据权利要求1所述的方法，其特征在于，所述第一模式结构是对所述目标数据中的每个元素的模式结构的文本描述，所述第二模式结构是对所述源数据中的每个元素的模式结构的文本描述。3.根据权利要求2所述的方法，其特征在于，所述第一模式结构的文本描述包括以下至少之一：所述目标数据中的每个元素的名称，所述目标数据中的所述每个元素的类型，所述目标数据中的所述每个元素的合法取值范围，所述目标数据中的所述每个元素的嵌套关系，所述目标数据中的各个所述每个元素的顺序；和/或所述第二模式结构的文本描述包括以下至少之一：所述源数据中的每个元素的名称，所述源数据中的所述每个元素的类型，所述源数据中的所述每个元素的合法取值范围，所述源数据中的所述每个元素的嵌套关系，所述源数据中的各个所述每个元素的顺序。4.根据权利要求1至3中任一项所述的方法，其特征在于，根据所述第一模式结构和所述第二模式结构将所述源数据处理为所述第一模式结构的所述结构化数据包括：判断所述第一模式结构和所述第二模式结构是否一致；当判断结果为一致时，按照所述第一模式结构或所述第二模式结构将所述源数据处理成所述结构化数据；当判断结果为不一致时，确定所述第一模式结构与所述第二模式结构的差异，并根据所述第一模式结构、所述第二模式结构和所述差异，将所述源数据处理成所述结构化数据。5.根据权利要求4所述的方法，其特征在于，判断所述第一模式结构和所述第二模式结构是否一致包括：比较所述第一模式结构的所述第一标识号和所述第二模式结构的所述第二标识号；如果所述第一标识号与所述第二标识号一致，则所述第一模式结构与所述第二模式结构一致；如果所述第一标识号与所述第二标识号不一致，则所述第一模式结构与所述第二模式结构不一致。6.根据权利要求1所述的方法，其特征在于，当向所述分布式存储系统的存储空间写入数据时，所述目标数据为所述存储空间支持的数据，所述源数据为待写入的数据；和/或当从所述存储空间读取数据时，所述目标数据为读取所要得到的数据，所述源数据为所述存储空间中存储的数据。7.一种分布式存储系统的数据的处理方法，其特征在于，包括：获取源数据的模式结构和所述模式结构的标识，其中，所述源数据为待写入的数据；根据所述模式结构将所述源数据写入存储空间，并将所述标识写入所述存储空间；其中，所述模式结构的所述标识由分布式存储模式管理服务器统一分配；其中，获取所述源数据的模式结构和所述模式结构的标识包括：生成所述模式结构；向分布式存储模式管理服务器发送所述模式结构；接收所述分布式存储模式管理...

【专利技术属性】
技术研发人员：郭斌，陈正华，韩银俊，高洪，程宁，
申请(专利权)人：南京中兴新软件有限责任公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人