一种云端的混合分布式文件存储方法技术

技术编号：31157661 阅读：23 留言：0更新日期：2021-12-04 09:55

一种云端的混合分布式文件存储方法，属于数字信息的传输技术领域，包括以下步骤：步骤1，至少一个云端服务器安装有SSBox，且所有云端服务器的RAM内存都在Ceph和HDFS之间共享，且云端服务器的硬盘被划分为两个大小相等的分区，一个用于Ceph，另一个用于HDFS；步骤2，根据待写入的文件大小对待写入的文件进行初步分类；步骤3，文件大小介于α和β之间的待写入的文件，使用KNN方法预测该文件更适合于哪种分布式文件系统。本方案，将文件适应性的分配到Ceph或者HDFS中，致力于提升读写性能。致力于提升读写性能。致力于提升读写性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种云端的混合分布式文件存储方法

[0001]本专利技术属于数字信息的传输
，具体涉及为一种云端的混合分布式文件存储方法。

技术介绍

[0002]云端存储服务多数使用分布式文件存储系统作为后端存储系统，用户上传的文件，如文档文件、图像文件或音乐文件，通常小于10MB。因此，云存储中的大多数文件为小于10MB的小文件。占少是的大文件，例如电影、操作系统映像文件，通常大于1GB。因此，我们可以假设，大部分的文件为小文件，只有少受10%~20%的文件，为大文件，云端存储的文件分布类似于重尾分布。
[0003]随着云端存储服务的普及，写入吞吐量可能成为云服务的瓶颈。而如果要充分提升云端存储的写入吞吐量，充分利用重尾分布至关重要。尚未有利用文件的重尾分布，来提升云端写入吞吐量的研究方案。

技术实现思路

[0004]针对现有技术的不足，本专利技术提供了一种云端的混合分布式文件存储方法。
[0005]为实现以上目的，本专利技术通过以下技术方案予以实现。
[0006]一种云端的混合分布式文件存储方法，包括以下步骤：步骤1，至少一个云端服务器安装有SSBox，且所有云端服务器的RAM内存都在Ceph和HDFS之间共享，且云端服务器的硬盘被划分为两个大小相等的分区，一个用于Ceph，另一个用于HDFS；步骤2，根据待写入的文件大小对待写入的文件进行初步分类；测量Ceph和HDFS对不同大小的文件所花费的写入时间，然后确定分隔点α和β：当文件大小小于α时，HDFS的写入时间超过Ceph，且两者...

【技术保护点】

【技术特征摘要】
1.一种云端的混合分布式文件存储方法，其特征在于，包括以下步骤：步骤1，至少一个云端服务器安装有SSBox，且所有云端服务器的RAM内存都在Ceph和HDFS之间共享，且云端服务器的硬盘被划分为两个大小相等的分区，一个用于Ceph，另一个用于HDFS；步骤2，根据待写入的文件大小对待写入的文件进行初步分类；测量Ceph和HDFS对不同大小的文件所花费的写入时间，然后确定分隔点α和β：当文件大小小于α时，HDFS的写入时间超过Ceph，且两者的写入时间差异性为5%，此时Ceph为优选；当文件大小大于β时，Ceph的写入时间超过HDFS，且两者的写入时间差异性为5%，此时HDFS为优选；将文件大小小于α的待写入的文件分配给Ceph，将文件大小大于β的待写入的文件分配给HDFS；文件大小介于α和β之间的文件，进入下一步处理；步骤3，文件大小介于α和β之间的待写入的文件，使用KNN方法预测该文件更适合于哪种分布式文件系统。2.根据权利要求1...

【专利技术属性】
技术研发人员：左登超，
申请(专利权)人：杭州雅观科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人