分布式文件系统的数据存储方法及系统技术方案

技术编号：11133011 阅读：79 留言：0更新日期：2015-03-12 03:18

本发明专利技术公开了一种分布式文件系统的数据存储方法，包括以下步骤：接收用户发送的数据文件；判断数据文件的大小；如果数据文件的大小小于预设值，则将数据文件通过基于日志格式的归并树LSM-Tree的KV存储方法存储至云端服务器的key-value数据库；如果数据文件的大小大于预设值，则将数据文件切分为多个子数据文件，并存储至本地文件系统。本发明专利技术实施例的方法通过将数据文件按照文件的大小进行区分，从而提高分布式文件系统的效率，实现整体性能的提升。本发明专利技术实施例还公开了一种分布式文件系统的数据存储系统。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文件系统
，特别涉及一种分布式文件系统的数据存储方法及系统。
技术介绍
目前，分布式文件系统如GFS(Google File System，存储数据的文件系统)、MooseFS、Lusture等都是以建立在单机文件系统的基础上的。分布式层负责组织逻辑文件到逻辑数据块列表的映射，而本地文件系统则负责从逻辑数据块到硬盘数据的映射。两层各司其职共同完成了数据的寻址与读写操作。其中，本地文件系统通常使用多层索引来组织磁盘上的数据。如Ext系列的文件系统，在访问数据块之前必须通过元数据索引找到对应的元数据，而找到该元数据之前必须找到其父目录的元数据。在进行数据读写之前需先经历一个沿着目录树寻找元数据的过程。然而，这样的访问模式直接导致了小文件的低读写效率。对于大文件来说，这些开销可以均摊到数据读写，配合系统缓存的设计可以将对性能的影响降到极小，但是对于小文件来说，这部分开销占据了整个访问时间的绝大部分。因此，本地文件系统对于小文件的性能往往会很差，与大小文件读写性能相比会相差一个数量级，并且由于分布式文件系统使用本地文件系统作为后端存储，文件的读写过程相比本地读写多了几次网络交互，导致在分布式环境下同样面临着更加严重的小文件读写性能较低的问题。另外，由于分布式文件系统仅使用本地文件系统基本的存储服务，本地文件系统保留的元数据很多都是不必要的。分布式文件的命名空间组织方式与本地文件系统并不相同，而...
分布式文件系统的数据存储方法及系统

【技术保护点】
一种分布式文件系统的数据存储方法，其特征在于，包括以下步骤：接收用户发送的数据文件；判断所述数据文件的大小；如果所述数据文件的大小小于预设值，则将所述数据文件通过基于日志格式的归并树LSM‑Tree的KV存储方法存储至云端服务器的key‑value数据库；以及如果所述数据文件的大小大于所述预设值，则将所述数据文件切分为多个子数据文件，并存储至本地文件系统。

【技术特征摘要】
1.一种分布式文件系统的数据存储方法，其特征在于，包括以下步骤：
接收用户发送的数据文件；
判断所述数据文件的大小；
如果所述数据文件的大小小于预设值，则将所述数据文件通过基于日志格式的归并树
LSM-Tree的KV存储方法存储至云端服务器的key-value数据库；以及
如果所述数据文件的大小大于所述预设值，则将所述数据文件切分为多个子数据文件，
并存储至本地文件系统。
2.根据权利要求1所述的分布式文件系统的数据存储方法，其特征在于，在所述将所
述数据文件通过LSM-Tree的KV存储方式至云端服务器的key-value数据库中之后，还包
括：
根据所述数据文件的数据块ID、数据块版本、数据块序号生成所述数据文件的Key。
3.根据权利要求1所述的分布式文件系统的数据存储方法，其特征在于，在所述将所
述数据文件切分为多个子数据文件，并存储至本地文件系统之后，还包括：
根据每个子数据文件的数据块ID和数据块版本生成所述多个子数据文件对应的本地
文件系统的文件名。
4.根据权利要求3所述的分布式文件系统的数据存储方法，其特征在于，还包括：根
据所述每个子数据文件中数据块生成对应的校验码，以维护子数据文件。
5.根据权利要求1所述的分布式文件系统的数据存储方法，其特征在于...

【专利技术属性】
技术研发人员：陈康，郑纬民，王振钊，黄剑，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人