This application discloses a method and device for expanding a distributed storage system. The method includes: writing business data to the first data server and moving part of the data of the first data server to the second data server with increased capacity; judging whether the data of the first data server and the second data server have reached the set state, if so. A distributed storage method is used to write business data to the first data server and the second data server. In this method, the write traffic is distributed to the first and second data servers while expanding capacity, and the front end will not feel the speed slowing down when writing data, which significantly improves the quality of service.
【技术实现步骤摘要】
对分布式存储系统进行扩容的方法及装置
本申请涉及分布式存储系统,具体涉及一种对分布式存储系统进行扩容的方法及装置。
技术介绍
在为云计算提供服务的分布式存储系统中,用户数据经常会不断增长,当用户数据增加到一定程度,原有集群不能满足数据增加的需求,需要进行扩容。提供云服务的商家为了控制成本,一般在高水位(数据服务器的剩余存储空间很低)的情况下才会根据业务增长情况进行少量数据服务器的扩容。现有技术下,当在集群处于高水位进行扩容时,日常的读写流量依然在对外提供服务,写入流量主要集中在少量新的数据服务器上,造成服务质量受到影响。一般主控服务器(通常指负责管理数据服务器的服务器,例如,GFS(GoogleFileSystem)中的元数据服务器Master)的副本分布策略会考虑磁盘容量,优先写入比较空的数据服务器,就会造成新的数据服务器的负载比较重。比如原有集群有1000台已有数据服务器,每台已有数据服务器服务30M写入流量(30MB/s),在水位超过90%(剩余存储空间小于10%)的情况下,新增加100台数据服务器,大量写入流量会集中在新的数据服务器上,达到每台数据服务器150M流量,影响服务质量,对服务造成影响。由于现有技术在扩容时,写入流量主要集中在少量新的数据服务器上,使得新的数据服务器的负载比较重,因此前端在写入数据时会感到速度比较慢,导致服务质量的下降。
技术实现思路
本申请提供一种用于对分布式存储系统进行扩容的方法,以解决现有前端在写入数据时会感到速度比较慢,导致服务质量的下降的问题。本申请提供的一种用于对分布式存储系统进行扩容的方法,包括:将业务数据写入第 ...
【技术保护点】
1.一种用于对分布式存储系统进行扩容的方法,其特征在于,包括:将业务数据写入第一数据服务器,并将所述第一数据服务器的部分数据搬迁至扩容增加的第二数据服务器;判断所述第一数据服务器以及第二数据服务器数据是否达到设定状态,若是,采用分布式存储方法将业务数据写入所述第一数据服务器及第二数据服务器。
【技术特征摘要】
1.一种用于对分布式存储系统进行扩容的方法,其特征在于,包括:将业务数据写入第一数据服务器,并将所述第一数据服务器的部分数据搬迁至扩容增加的第二数据服务器;判断所述第一数据服务器以及第二数据服务器数据是否达到设定状态,若是,采用分布式存储方法将业务数据写入所述第一数据服务器及第二数据服务器。2.根据权利要求1所述的用于对分布式存储系统进行扩容的方法,其特征在于,所述将所述第一数据服务器的部分数据搬迁至第二数据服务器,包括:使用接近物理极限预设范围的网络写入速度或物理极限的网络写入速度将所述第一数据服务器的部分数据搬迁至第二数据服务器。3.根据权利要求1所述的用于对分布式存储系统进行扩容的方法,其特征在于,所述判断所述第一数据服务器以及第二数据服务器数据是否达到设定状态,具体为:判断所述第一数据服务器以及第二数据服务器数据是否达到均衡状态。4.根据权利要求3所述的用于对分布式存储系统进行扩容的方法,其特征在于,所述判断所述第一数据服务器以及第二数据服务器数据是否达到均衡状态,包括:判断第一数据服务器以及第二数据服务器数据存储水位的相似度是否大于或等于相似度阈值,若是,则判断为所述第一数据服务器以及第二数据服务器数据达到均衡状态。5.根据权利要求1至4任一所述的用于对分布式存储系统进行扩容的方法,其特征在于,所述将所述第一数据服务器的部分数据搬迁至第二数据服务器,包括:每台第二数据服务器对应的第一数据服务器的数量相同或数量之差在预设范围内。6.根据权利要求5所述的用于对分布式存储系统进行扩容的方法,其特征在于,所述将所述第一数据服务器的部分数据搬迁至第二数据服务器,包括:对应同一第二数据服务器的所有第一数据服务器分配有的写入流量相同或流量之差在预设范围内。7.根据权利要求1所述的用于对分布式存储系统进行扩容的方法,其特征在于,所述将业务数据写入第一数据服务器,并将所述第一数据服务器的部分数据搬迁至第二数据服务器之前,还包括:判断集群中第一数据服务器的水位是否大于预设水位阈值,并在大于时进行扩容。8.根据权利要求7所述的用于对分布式存储系统进行扩容的方法,其特征在于,包括:第二数据服务器的数量与第一数据服务器的数量之比小于或等于1/10。9.根据权利要求7所述的用于对分布式存储系统进行扩容的方法,其特征在于,所述预设水位阈值范围为80%至90%。10.根据权利要求1所述的用于对分布式存储系统进行扩容的方法,其特征在于,包括:在扩容增加数据服务器之前...
【专利技术属性】
技术研发人员:吴洋,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。