预测主机的批量运行时长的方法、系统、装置及存储介质制造方法及图纸

技术编号:24251348 阅读:67 留言:0更新日期:2020-05-22 23:28
本发明专利技术公开了一种预测主机的批量运行时长的方法、系统、装置及存储介质,其中,所述方法包括:通过性能数据库获取主机批量运行时的性能数据集合,通过历史数据库获取历史批量运行时长;根据预设的筛选规则筛选性能数据集合中的元素,获取关联性能数据集合;将关联性能数据集合和历史批量运行时长投入预设的学习模型中进行训练,获取时长预测模型;根据时长预测模型对主机的批量运行时长进行预测。采用本发明专利技术不仅能处理线性关系的预测还能处理非线性关系的预测,且支持具有多种复杂变量的环境,适用性广泛的同时可以使预测结果更加精准。此外,本发明专利技术采用损失函数使时长预测模型可以不断的自动调整,使得预测本身具有机器学习的特点。

The method, system, device and storage medium for predicting the running time of host in batch

【技术实现步骤摘要】
预测主机的批量运行时长的方法、系统、装置及存储介质
本专利技术涉及计算机应用
,更为具体而言,涉及一种预测主机的批量运行时长的方法、系统、装置及存储介质。
技术介绍
目前,各大银行核心业务主要建立在以主机为核心的架构之上,各类核心业务除了白天联机交易的处理外,还有大量的夜间批量交易处理。随着近期金融业的迅猛发展,夜间批量承载的业务处理量远超白天,夜间批量处理的时长逐渐成为数据中心重点关注的指标,但目前主机平台上缺少有效的分析和预测手段。对于主机批量时长的预测,传统的方式是基于历史数据的对比性预测,依赖于历史批量时间建立的样本空间,然后利用简单的一元回归,是一种经验数据的推导过程,准确率较低,缺少对于主机各相关信息与主机批量时长的关联性分析和科学的数据建模理论基础。同时,随着银行业务的迅猛发展以及跨领域业务的扩张,现有的批量运行平台已经由主机扩展到了开放平台,业务系统也从原来单一的主机平台拓展到了x86,这些巨大的变化导致影响批量运行时长的变量也日异繁多,仅仅依据历史运行时长的估算方式已经不能适用于现有银行批量运行时长的实际估算场景本文档来自技高网...

【技术保护点】
1.一种预测主机的批量运行时长的方法,其特征在于,所述方法包括:/n通过性能数据库获取所述主机批量运行时的性能数据集合,通过历史数据库获取历史批量运行时长;/n根据预设的筛选规则筛选所述性能数据集合中的元素,获取关联性能数据集合;/n将所述关联性能数据集合和所述历史批量运行时长投入预设的学习模型中进行训练,获取时长预测模型;/n根据所述时长预测模型对主机的批量运行时长进行预测。/n

【技术特征摘要】
1.一种预测主机的批量运行时长的方法,其特征在于,所述方法包括:
通过性能数据库获取所述主机批量运行时的性能数据集合,通过历史数据库获取历史批量运行时长;
根据预设的筛选规则筛选所述性能数据集合中的元素,获取关联性能数据集合;
将所述关联性能数据集合和所述历史批量运行时长投入预设的学习模型中进行训练,获取时长预测模型;
根据所述时长预测模型对主机的批量运行时长进行预测。


2.如权利要求1所述的方法,其特征在于,所述根据预设的筛选规则筛选所述性能数据集合中的元素,获取关联性能数据集合包括:
对于所述性能数据集合中的元素,分别执行以下操作:
将所述元素作为自变量,所述历史批量运行时长作为因变量,计算皮尔逊相关系数;
若所述皮尔逊相关系数大于预设的阈值,则确定所述元素为关联元素;
将筛选出的所有关联元素的集合作为所述关联性能数据集合。


3.如权利要求1所述的方法,其特征在于,所述根据预设的筛选规则筛选所述性能数据集合中的元素,获取关联性能数据集合包括:
对于所述性能数据集合中的元素,分别执行以下操作:
将所述元素作为自变量,所述历史批量运行时长作为因变量,计算皮尔逊相关系数;
若所述皮尔逊相关系数大于预设的阈值,则获取所述皮尔逊相关系数的统计量;
根据所述统计量获取对应的概率值;
判断所述概率值是否小于预设值,
若小于,则确定所述元素为关联元素;
将筛选出的所有关联元素的集合作为所述关联性能数据集合。


4.如权利要求1所述的方法,其特征在于,所述预设的学习模型为梯度提升树回归模型,模型公式如下:
FM(X)=y1h1(X)+y2h2(X)+…+yihi(X)+…+yMhM(X);
FM(X)=FM-1(X)+yMhM(X);
其中,FM(X)为因变量,X为自变量,hi(X)为基本算法,yi为权重,M为所述基本算法的个数。


5.如权利要求4所述的方法,其特征在于,
所述hi(X)为决策树算法。


6.如权利要求4所述的方法,其特征在于,所述将所述关联性能数据集合和所述历史批量运行时长投入预设的学习模型中进行训练包括:
将所述关联性能数据集合作为自变量,所述历史批量运行时长作为因变量,投入所述梯度提升树回归模型进行训练。


7.如权利要求6所述的方法,其特征在于,所述将所述关联性能数据集合和所述历史批量运行时长投入预设的学习模型中进行训练还包括:
通过损失函数对所述梯度提升树回归模型进行修正。


8.一种预测主机的批量运行时长的系统,其特征在于,所述系统包括:
数据获取模块,用于通过性能数据库获取所述主机批量...

【专利技术属性】
技术研发人员:王毅李靖洪长灿谢淼
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1