基于遗传算法的数据中心对象存储方法及系统技术方案

技术编号:29702911 阅读:30 留言:0更新日期:2021-08-17 14:31
本发明专利技术属于高速数据备份领域,提供了一种基于遗传算法的数据中心对象存储方法及系统。其中,该方法包括获取数据中心对象存储装置接口的备份数据信息,随机生成设定规模的种群,每个种群中的个体包括两条染色体,第一染色体的基因为所有任务与可选备份数据信息的随机顺序组合,第二染色体的基因为定时备份的数据信息;基于随机生成设定规模的种群及遗传算法,通过设定的适应度函数来筛选出设定数量的最优个体,最终确定出多个并行存储的最优备份数据信息且以提高数据存储效率和空间利用率。

【技术实现步骤摘要】
基于遗传算法的数据中心对象存储方法及系统
本专利技术属于高速数据备份领域,尤其涉及一种基于遗传算法的数据中心对象存储方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。数据中心机房是存放网络、计算、存储的中心。存储方式有很多,如块存储、文件存储和对象存储。其中,块存储读写快,不利于共享;文件存储读写慢,利于共享;对象存储是为了克服块存储与文件存储各自的缺点,发扬它俩各自的优点,读写快,同时利于共享。对象存储是用来描述解决和处理离散单元的方法的通用术语。对象在一个层结构中不会再有层级结构,是以扩展元数据为特征的。对象分为三个部分:数据、元数据以及对象id。由于不同节点的位置不同,数据同步时可能会有一定时间的延迟或者错误;不易做数据库:对象存储比较适合存储那些变动不大甚至不变的文件,而对于像数据库这种需要直接与存储裸盘相互映射的应用,对象存储不合适。因此,专利技术人发现,对象存储存在数据存储效率和空间利用率等问题。
技术实现思路
针对数据中心备份可伸缩要求的数据存储效率和空间利用率等问题,本专利技术提供一种基于遗传算法的数据中心对象存储方法及系统,其通过对数据中心对象存储装置接口获取的数据进行种群初始化,并采用遗传算法来确定出最优的备份数据信息,实现对象存储装置调用的属性值优化存储,可提高数据存储效率和空间利用率。为了实现上述目的,本专利技术采用如下技术方案:本专利技术的第一个方面提供一种基于遗传算法的数据中心对象存储方法。一种基于遗传算法的数据中心对象存储方法,其包括:获取数据中心对象存储装置接口的备份数据信息,随机生成设定规模的种群,每个种群中的个体包括两条染色体,第一染色体的基因为所有任务与可选备份数据信息的随机顺序组合,第二染色体的基因为定时备份的数据信息;基于随机生成设定规模的种群及遗传算法,通过设定的适应度函数来筛选出设定数量的最优个体,最终确定出多个并行存储的最优备份数据信息且以提高数据存储效率和空间利用率;其中,适应度函数为个体的平均权值、个体的相似度及个体编码中的0的个数均值这三者的加权和。本专利技术的第二个方面提供一种基于遗传算法的数据中心对象存储系统。一种基于遗传算法的数据中心对象存储系统,其包括:种群初始化模块,其用于获取数据中心对象存储装置接口的备份数据信息,随机生成设定规模的种群,每个种群中的个体包括两条染色体,第一染色体的基因为所有任务与可选备份数据信息的随机顺序组合,第二染色体的基因为定时备份的数据信息;个体筛选模块,其用于基于随机生成设定规模的种群及遗传算法,通过设定的适应度函数来筛选出设定数量的最优个体,最终确定出多个并行存储的最优备份数据信息且以提高数据存储效率和空间利用率;其中,适应度函数为个体的平均权值、个体的相似度及个体编码中的0的个数均值这三者的加权和。本专利技术的第三个方面提供一种计算机可读存储介质。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于遗传算法的数据中心对象存储方法中的步骤。本专利技术的第四个方面提供一种计算机设备。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于遗传算法的数据中心对象存储方法中的步骤。与现有技术相比,本专利技术的有益效果是:为了解决对象存储效率低且空间利用率低的问题,本专利技术利用获取的数据中心对象存储装置接口的备份数据信息,随机生成设定规模的种群,基于随机生成设定规模的种群及遗传算法,通过设定的适应度函数来筛选出设定数量的最优个体,最终确定出多个并行存储的最优备份数据信息且,提高了数据存储效率和空间利用率。本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。图1是本专利技术实施例的基于遗传算法的数据中心对象存储方法流程图;图2是本专利技术实施例的高速数据采集存储回放设备硬件组成;图3是本专利技术实施例的备份存储卡框图;图4是本专利技术实施例的写操作流水软件流程图;图5是本专利技术实施例的FPGA程序总体框图。具体实施方式下面结合附图与实施例对本专利技术作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。实施例一如图1所示,本实施例的一种基于遗传算法的数据中心对象存储方法,其具体包括如下步骤:S101:获取数据中心对象存储装置接口的备份数据信息,随机生成设定规模的种群,每个种群中的个体包括两条染色体,第一染色体的基因为所有任务与可选备份数据信息的随机顺序组合,第二染色体的基因为定时备份的数据信息。在具体实施中,首先建立编码表示模型,最常用的编码模型是向量空间模型(VectorSpaceModal,简称VSM),在该模型中,备份数据的文档空间被视为一组正交词条向量组成的向量空间,每个备份文本di都可以映射为此空间中的一个特征向量,V(di)=((ti1,wi1),(ti2,wi2),…,(tin,win)),其中tij为特征项,wij表示特征项的权重,即特征项在表示备份文本内容上的重要程度,确定权重的方法很多,采用TF-IDE方法,把di简化为以特征项权重为分量的向量(wi1,wi2,…,win)表示,数据信息的特征选择就转化为向量空间的特征选择问题,通过特征选择来建立关键词汇表。利用存储中常用到的关键词建立关键词词汇表,而关键词汇表的长度就是遗传算法中个体编码的长度。由于遗传算法中种群个体采用二进制编码,而且种群是由机器随机生成的,所以只需要确定编码的长度,即获得专业词汇表的长度。遗传算法种群初始化时随机产生个体。个体的长度与上述关键词汇表的长度相同。关于种群大小,建议群体的个数取值范围一般取20到100之间,所以此处初始化种群的大小取值100。得到初始化种群后,如何选择进入下一代的个体,则需要判断每个个体是否适应环境,下面描述如何判断种群个体的适应度。S102:基于随机生成设定规模的种群及遗传算法,通过设定的适应度函数来筛选出设定数量的最优个体,最终确定出多个并行存储的最优备份数据信息且以提高数据存储效率和空间利用率;其中,适应度函数为个体的平均权值、个体的相似度及个本文档来自技高网
...

【技术保护点】
1.一种基于遗传算法的数据中心对象存储方法,其特征在于,包括:/n获取数据中心对象存储装置接口的备份数据信息,随机生成设定规模的种群,每个种群中的个体包括两条染色体,第一染色体的基因为所有任务与可选备份数据信息的随机顺序组合,第二染色体的基因为定时备份的数据信息;/n基于随机生成设定规模的种群及遗传算法,通过设定的适应度函数来筛选出设定数量的最优个体,最终确定出多个并行存储的最优备份数据信息且以提高数据存储效率和空间利用率;其中,适应度函数为个体的平均权值、个体的相似度及个体编码中的0的个数均值这三者的加权和。/n

【技术特征摘要】
1.一种基于遗传算法的数据中心对象存储方法,其特征在于,包括:
获取数据中心对象存储装置接口的备份数据信息,随机生成设定规模的种群,每个种群中的个体包括两条染色体,第一染色体的基因为所有任务与可选备份数据信息的随机顺序组合,第二染色体的基因为定时备份的数据信息;
基于随机生成设定规模的种群及遗传算法,通过设定的适应度函数来筛选出设定数量的最优个体,最终确定出多个并行存储的最优备份数据信息且以提高数据存储效率和空间利用率;其中,适应度函数为个体的平均权值、个体的相似度及个体编码中的0的个数均值这三者的加权和。


2.如权利要求1所述的基于遗传算法的数据中心对象存储方法,其特征在于,每个种群中的个体采用二进制编码。


3.如权利要求1所述的基于遗传算法的数据中心对象存储方法,其特征在于,每个种群中的个体的编码的长度为关键词汇表的长度,关键词汇表通过特征选择来建立。


4.如权利要求3所述的基于遗传算法的数据中心对象存储方法,其特征在于,建立关键词汇表所选择的特征为:数据信息的特征,该特征映射为备份数据的文档空间中的一个特征向量;特征向量由特征项和特征项的权重构成。


5.如权利要求4所述的基于遗传算法的数据中心对象存储方法,其特征在于,备份数据的文档空间被为一组正交词条向量组成的向量空间。


6.如权利要求1所述的基于遗传算法的数据中心对象存储方法,其特征在于,在遗传算法筛选最优个体的过程中,若未达到停止条件之前,选择通过适应度函数来计算个体的适应度...

【专利技术属性】
技术研发人员:邱烨李罡王德超闫洪利
申请(专利权)人:济南轨道交通集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1