The invention discloses a hierarchical hybrid storage system and method based on consistent hashing. It belongs to the field of computer storage. It can maximize the characteristics of various storage media, and adopt storage strategy reasonably, so as to improve system performance. The present invention includes: according to the difference of storage media, storage strategy of hierarchical design consistent hashing ring; consistent hashing ring in hierarchical storage object hierarchical storage through the access frequency and capacity index; introducing the monitoring module, determine the different time frequency data acquisition and transfer threshold; introduce the scheduling module for data change the time of hot and cold, lifting a reasonable level data migration scheduling; the forest data structure of SSD cluster data information management. The invention provides hierarchical storage for load characteristics, and provides different storage media and storage strategies according to the characteristics of storage objects, enhancing system flexibility, improving system read and write performance, and ensuring its stability.
【技术实现步骤摘要】
一种基于一致性哈希的分层混合存储系统及方法
本专利技术属于混合存储
,更具体地,涉及一种基于一致性哈希的分层混合存储系统及方法。
技术介绍
存储系统设计一直趋向于追求高性能、大容量、低成本的特性。传统磁盘(HDD)容量大、价格低,但是机械特性导致其耗能高、随机读写性能较差。固态硬盘(SSD)采用半导体技术以闪存(flash)为存储介质,相对于HDD具有随机读写速度快、功耗低、抗震性能好等优点。由于向SSD写数据前需进行擦除操作,因此对其寿命造成影响,此外SSD容量较小且价格昂贵。显然存储系统不适合用SSD作为其唯一存储器件,更倾向于兼容多种存储介质。现代存储系统利用高性能存储介质作为低性能存储介质读写缓存,如SSD用来快速读写,HDD用作永久存储,缓解内存到磁盘读写速度不一致问题,但是SSD等高性能存储介质仅仅发挥缓存作用,没有利用到其硬盘的性质。为进一步发挥SSD等高性能存储介质存储的性能,有些存储系统在高性能存储介质存放小容量的和经常被访问到的数据,而低性能存储介质存放大的和冷的数据。此外针对不同特性数据选择不同冗余存储策略。副本策略具有高可靠性,读性能优化的特点,但是成本开销大;纠删码存储策略用读写时间换取高可靠性及低成本开销。因此许多存储系统会将对象以两种方式存储,即一种采用副本,一种采用纠删码。承担绝大部分读请求的主存储节点存储对象的完整副本,而纠删码节点保证了在主存储节点故障后依然可以对外提供服务。这种方式具有高可靠性,高读写性能,但浪费一定的存储开销,且副本节点承担大部分请求,易造成拥塞。存储系统中一个关键性的问题是管理逻辑地址到物理地 ...
【技术保护点】
一种基于一致性哈希的分层混合存储系统,其特征在于,包括:分层一致性哈希环、监控模块以及调度模块;所述分层一致性哈希环包括固态硬盘集群哈希环和传统磁盘集群哈希环,其中,所述固态硬盘集群哈希环用于将热数据以副本存储策略存储至固态硬盘SSD存储集群,所述传统磁盘集群哈希环用于将冷数据与温数据以纠删码存储策略存储至传统磁盘HDD存储集群;所述监控模块,用于监控SSD存储集群的使用情况,并在SSD存储集群的当前使用率超过当前时间段对应的迁移阈值时,按当前时间段对应的各数据访问次数和最后访问时间选择变冷数据,并通过所述调度模块将变冷数据迁移至HDD存储集群,以实现降级迁移调度;所述监控模块,还用于在HDD存储集群中存在热度标志位由冷标志或温标志上升至热标志的数据时,通过所述调度模块将变热数据迁移至SSD存储集群,以实现升级迁移调度。
【技术特征摘要】
1.一种基于一致性哈希的分层混合存储系统,其特征在于,包括:分层一致性哈希环、监控模块以及调度模块;所述分层一致性哈希环包括固态硬盘集群哈希环和传统磁盘集群哈希环,其中,所述固态硬盘集群哈希环用于将热数据以副本存储策略存储至固态硬盘SSD存储集群,所述传统磁盘集群哈希环用于将冷数据与温数据以纠删码存储策略存储至传统磁盘HDD存储集群;所述监控模块,用于监控SSD存储集群的使用情况,并在SSD存储集群的当前使用率超过当前时间段对应的迁移阈值时,按当前时间段对应的各数据访问次数和最后访问时间选择变冷数据,并通过所述调度模块将变冷数据迁移至HDD存储集群,以实现降级迁移调度;所述监控模块,还用于在HDD存储集群中存在热度标志位由冷标志或温标志上升至热标志的数据时,通过所述调度模块将变热数据迁移至SSD存储集群,以实现升级迁移调度。2.根据权利要求1所述的系统,其特征在于,所述冷数据、所述温数据以及所述热数据为:基于存储对象的存储容量,将存储容量小于小容量阈值Cl的存储对象作为小数据,将存储容量大于大容量阈值Ch的存储对象作为大数据,将存储容量在小容量阈值Cl和大容量阈值Ch之间的存储对象作为中等数据,将所述大数据作为冷数据,将所述小数据作为热数据,而所述中等数据根据访问频率在冷、热以及温数据中变化,且所述中等数据初次访问时均作为热数据。3.根据权利要求1所述的系统,其特征在于,所述固态硬盘SSD存储集群中的数据信息采用森林数据结构进行管理,其中,所述森林数据结构由多棵平衡二叉树构成,在代理服务处理写SSD存储集群请求时,则创建一个待写入数据对应的树节点,并将创建的树节点插入所述森林数据结构的树中,以使SSD存储集群中的存储对象均有对应的树节点;在代理服务处理读请求时,则查找所述森林数据结构中是否存在待读数据对应的树节点,若存在则从SSD存储集群读取数据,若不存在,则从HDD存储集群读取数据。4.根据权利要求1至3任意一项所述的系统,其特征在于,所述监控模块,具体用于监控SSD存储集群中的数据以及SSD存储集群的使用率,若SSD存储集群的当前使用率超过当前时间段对应的阈值Wh时,则通过所述调度模块将SSD存储集群中的变冷数据迁移至HDD存储集群,若SSD存储集群的当前使用率小于当前时间段...
【专利技术属性】
技术研发人员:冯丹,刘云,齐一川,李晶,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。