Embodiments of the present disclosure provide methods, systems and computer readable storage media for controlling data backup. The method includes acquiring test data backed up by a variety of backup schemes, which are associated with each set of values of a plurality of factors affecting the data backup, generating a training sample set based on the comparison of the test data, and converting the training sample set into a set for use in the data backup. A decision model for controlling data backup; the decision model is optimized based on the configuration parameters obtained by using the decision model to perform data backup.
【技术实现步骤摘要】
用于控制数据备份的方法和系统
本公开涉及数据备份领域,并且更具体地,涉及用于控制数据备份的方法和系统。
技术介绍
现代数据备份技术通常能够根据待备份的数据类型、数据大小、备份设备所在的网络环境以及带备份数据的放置位置来选择不同的备份方案。上述数据类型、数据大小、备份设备所在的网络环境以及带备份数据的放置位置等因素通常会影响备份方案的选择。选择不同的数据备份方案,完成数据备份所需的时间和通过备份设备间网络所发送的字节数会有很大的不同。因此,在特定的备份场景下如何控制数据备份,进而选择最为合适的备份方案在现有技术中是一个亟待解决的难题。
技术实现思路
本公开提供一种用于控制数据备份的方法,能够针对不同影响数据备份的因素选择合适的数据备份方案。在本公开的第一方面,提供了一种用于控制数据备份的方法。该方法包括:获得以多种备份方案执行数据备份的测试数据,该多种该备份方案与影响该数据备份的多个因素的多组取值中的每组取值相关联;基于对该测试数据的比较,生成训练样本集;将该训练样本集转换成用于控制数据备份的决策模型;基于使用该决策模型执行数据备份而获得的配置参数,来优化该决策模型。在 ...
【技术保护点】
1.一种用于控制数据备份的方法,包括:获得以多种备份方案执行数据备份的测试数据,所述多种所述备份方案与影响所述数据备份的多个因素的多组取值中的每组取值相关联;基于对所述测试数据的比较,生成训练样本集;将所述训练样本集转换成用于控制数据备份的决策模型;基于使用所述决策模型执行数据备份而获得的配置参数,来优化所述决策模型。
【技术特征摘要】
1.一种用于控制数据备份的方法,包括:获得以多种备份方案执行数据备份的测试数据,所述多种所述备份方案与影响所述数据备份的多个因素的多组取值中的每组取值相关联;基于对所述测试数据的比较,生成训练样本集;将所述训练样本集转换成用于控制数据备份的决策模型;基于使用所述决策模型执行数据备份而获得的配置参数,来优化所述决策模型。2.根据权利要求1所述的方法,其中所述因素包括以下至少一个:待备份数据的大小、与上一次备份数据相比新增字节所占的比例、平均存储段的大小、最小存储段的大小、最大存储段的大小、存储段的总数量、待备份文件的数量、执行备份的设备与待备份的设备之间的网络带宽、执行备份的设备与待备份的设备之间的网络往返时延(RTT)。3.根据权利要求1所述的方法,其中获得所述测试数据包括:基于预设的所述多个因素的所述每组取值,在用于测试数据生成的存储系统之间以所述多个备份方案执行数据备份,来生成所述测试数据;基于使用所述决策模型执行数据备份而获得的配置参数包括:客户端使用存储在共享存储单元上的所述决策模型在线执行所述数据备份;存储管理服务器在线收集所述客户端的所述配置参数。4.根据权利要求3所述的方法,其中生成训练样本集包括:基于预设的所述每组取值,比较所述测试数据中不同备份方案执行所述数据备份所花费的时间;选择执行数据备份所花费的时间低于阈值的所述备份方案;基于被选择的所述备份方案及其相关联的所述多个因素的所述每组取值,生成所述训练样本集的一条训练样本。5.根据权利要求1所述的方法,其中将所述训练样本集转换成用于控制数据备份的决策模型包括:基于快速决策树(VFDT)算法将所述训练样本集转换成以所述因素为属性的决策树。6.根据权利要求5所述的方法,其中所述决策树的内部节点为所述因素,叶节点表示用于控制数据备份的备份方案,从所述内部节点到所述叶节点的各分支为基于所述备份环境变量的取值范围的分类。7.一种用于控制数据备份的系统,包括:存储单元,被配置为存储一个或多个程序和用于控制数据备份方案选择的决策模型;处理器,耦合至所述存储单元并且被配置为执行所述一个或多个程序使所述设备执行多个动作,所述动作包括:获得以多种备份方案执行数据备份的测试数据,所述多个备份方案与影响所述数据备份的多个因素的多组取值中的每组取值相关联;基于对所述测试数据的比较,生成训练样本集;将所述训练样本集转换成用于控制数据备份的决策模型;基于使用所述决策模型执行数据备份而获得的配置参数,来优化所述决策模型。8.根据权利要求7所述的系统,其中所述因素包括以下至少一个:待备份数据的大小、与上一次备份数据相比新增字节所占的比例、平均存储段的大小、最小存储段的大小、最大存储段的大小、存储段的总数量、待备份文件的数量、执行备份的设备与待备份的设备之间的网络带宽、执行备份的设备与待备份的设备之间的网络往返时延(RTT)。9.根据权利要求7所述的系统,其中获得所述测试数据包括:基于预设的所述多个因素的所述每组取值,在用于测试数据生成的存储系统之间以所述多个备份方案执行数据备份,来生成所述测试数据;基于使...
【专利技术属性】
技术研发人员:张宇霆,高雪东,林超,彭飞,代文豪,
申请(专利权)人:伊姆西IP控股有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。