数据存储量的预测方法和预测装置制造方法及图纸

技术编号:13372542 阅读:86 留言:0更新日期:2016-07-19 22:28
作为本发明专利技术的一个方面,提供一种数据存储量的预测方法,包括:对第一预定时间段内的原始历史数据的数据记录进行归一化处理,以获得第一预定时间段内的目标历史数据;根据按照目标历史数据对应的原始历史数据将第一预定时间段内的所有目标历史数据划分为多个子数据集;计算各个子数据集中的各个目标数据记录在目标历史数据中出现的概率;将多个子数据集中的目标历史数据的数据记录及其出现概率代入SVM模型,计算获得各种类型的数据在将来的第二预定时间段的预测数据记录及出现概率,计算各个子数据集在第二预定时间段内的数据存储量。本发明专利技术还提供一种预测装置。利用预测方法可以准确预测信息系统的数据存储量。

【技术实现步骤摘要】
201610101938

【技术保护点】
一种数据存储量的预测方法,其特征在于,所述预测方法包括:对第一预定时间段内的原始历史数据的数据记录进行归一化处理,以获得所述第一预定时间段内的目标历史数据,所述原始历史数据包括多种不同类型的数据,且所述第一预定时间段包括多个子时间段;根据按照所述目标历史数据对应的原始历史数据将所述第一预定时间段内的所有目标历史数据划分为多个子数据集;计算各个子数据集中的各个目标数据记录在所述目标历史数据中出现的概率;将多个所述子数据集中的目标历史数据的数据记录代入SVM模型,计算获得各种类型的数据在将来的第二预定时间段的预测数据记录;将多个所述子数据集中的目标历史数据出现的概率代入SVM模型,计算获得各种类型的数据在将来的第二预定时间段内出现的预测概率;利用公式(1)计算各个子数据集在第二预定时间段内的数据存储量:MN=Σi=1m(xiN·piN)·Li·T+A---(1);]]>其中,MN为第二预定时间段内的数据存储量;xiN为第二预定阶段内第i种数据的预测数据记录;Li为第i种数据的数据记录的字节长度;T为第二预定时间段的长度;A为存储冗余常数;i为数据类型的编号,i为自然数,1≤i≤m;m为数据类型的总数,m>1;piN为第i种数据在第二预定阶段内出现的预测概率。...

【技术特征摘要】
1.一种数据存储量的预测方法,其特征在于,所述预测方法包
括:
对第一预定时间段内的原始历史数据的数据记录进行归一化处
理,以获得所述第一预定时间段内的目标历史数据,所述原始历史数
据包括多种不同类型的数据,且所述第一预定时间段包括多个子时间
段;
根据按照所述目标历史数据对应的原始历史数据将所述第一预
定时间段内的所有目标历史数据划分为多个子数据集;
计算各个子数据集中的各个目标数据记录在所述目标历史数据
中出现的概率;
将多个所述子数据集中的目标历史数据的数据记录代入SVM
模型,计算获得各种类型的数据在将来的第二预定时间段的预测数据
记录;
将多个所述子数据集中的目标历史数据出现的概率代入SVM
模型,计算获得各种类型的数据在将来的第二预定时间段内出现的预
测概率;
利用公式(1)计算各个子数据集在第二预定时间段内的数据存
储量:
M N = Σ i = 1 m ( x i N · p i N ) · L i · T + A - - - ( 1 ) ; ]]>其中,MN为第二预定时间段内的数据存储量;
xiN为第二预定阶段内第i种数据的预测数据记录;
Li为第i种数据的数据记录的字节长度;
T为第二预定时间段的长度;
A为存储冗余常数;
i为数据类型的编号,i为自然数,1≤i≤m;
m为数据类型的总数,m>1;
piN为第i种数据在第二预定阶段内出现的预测概率。
2.根据权利要求1所述的预测方法,其特征在于,m=4,多个
所述子数据集包括清单子数据集、客户资料子数据集、账务子数据集
和结算子数据集,所述清单子数据集包括清单类数据,所述客户资料
子数据集包括客户资料类数据,所述结算子数据集包括结算数据。
3.根据权利要求2所述的预测方法,其特征在于,所述第一预
定时间段为12个月,每个子阶段为一个月,所述第二预定时间段为
第一预定时间段后的第13个月,在将多个所述子数据集中的目标历
史数据的数据记录代入SVM模型的步骤中、以及在将多个所述子数
据集中的目标历史数据出现的概率代入SVM模型的步骤中,选择的
训练样本包括六个月的数据,预测样本包括六个月的数据。
4.根据权利要求1至3中任意一项所述的预测方法,其特征在
于,在对第一预定时间段内的原始历史数据的数据记录进行归一化处
理的步骤中,利用公式(2)对原始历史数据的数据记录极性归一化
处理:
x i n ‾ = x i n - x i _ min x i _ max - x i _ m i n - - - ( 2 ) ]]>其中,xin为第n个子时间段内,第i种类型的原始历史数据的
数据记录;
xi_min为在所述原始历史数据中,第i种类型的原始历史数
据的数据机理的最小值;
xi_max为在所述原始历史数据中,第i种类型的原始历史
数据的数据记录的最大值;
为第n个子时间段内,第i种类型的目标历史数据的数
据记录。
5.根据权利要求1至3中任意一项所述的预测方法,其特征在
于,所述原始历史数据为在线存储数据、近线存储数据和归档存储数
据中的任意一种。
6.一种数据存储量的预测装置,其特征在于,所述预测装置包
括:
预处理模块,所述预处理模块用于对第一预定时间段内的原始
历史数据的数据记录进行归一化处理,以获得所述第一预定时间段内
的...

【专利技术属性】
技术研发人员:张肖
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1