性能数据补全方法、装置、设备和存储介质制造方法及图纸

技术编号:38624254 阅读:18 留言:0更新日期:2023-08-31 18:26
本申请涉及一种性能数据补全方法、装置、设备和存储介质。方法包括:获取云平台的目标主机的历史性能数据;根据历史性能数据所属目标主机的机器信息对历史性能数据进行分组,并根据历史性能数据的日期信息和时间点信息对每组历史性能数据进行排序;根据每组排序后的历史性能数据的机器信息、日期信息和时间点信息,构建历史性能数据的待补全三维张量;将待补全三维张量分解为待求解的低秩张量和稀疏张量,并构建求解低秩张量和稀疏张量的优化模型;按照优化模型迭代地依次优化低秩张量和稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量,并根据最优的低秩张量确定补全后的历史性能数据。采用本方法能够提高性能数据补全的准确性。据补全的准确性。据补全的准确性。

【技术实现步骤摘要】
性能数据补全方法、装置、设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种性能数据补全方法、装置、设备和存储介质。

技术介绍

[0002]云平台上的主机是云计算在基础设施应用上的重要组成部分,比如:云主机和云虚机,但是由于采集设备故障、传输过程丢失以及保存数据过程出错等原因,往往会导致云平台上的主机的关键性能指标(Key Performance Indicators,KPI)数据缺失的情况。云平台上的主机的关键性能指标数据的完整性在智能云节能等方面起到关键作用,因此,如何对数据存在缺失的云平台主机的关键性能指标数据进行数据补全成为了一个非常重要的问题。
[0003]传统方法中,一般是采用深度学习网络训练得到模型,然后使用预先训练的模型对待补全的历史性能数据(即,关键性能指标数据)进行补全。然而,这种方法往往需要依赖大量的有效训练样本进行模型训练才能得到准确的模型,在训练样本不足的情况下,往往难以得到准确的模型,导致基于不准确的模型进行数据补全的准确性不高。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高准确性的性能数据补全方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种性能数据补全方法。所述方法包括:
[0006]获取云平台的目标主机的历史性能数据;
[0007]根据所述历史性能数据所属目标主机的机器信息对所述历史性能数据进行分组,并根据所述历史性能数据的日期信息和时间点信息对每组所述历史性能数据进行排序;
[0008]根据每组排序后的所述历史性能数据的机器信息、日期信息和时间点信息,构建所述历史性能数据的待补全三维张量;
[0009]将所述待补全三维张量分解为待求解的低秩张量和稀疏张量,并构建求解所述低秩张量和所述稀疏张量的优化模型;
[0010]按照所述优化模型迭代地依次优化所述低秩张量和所述稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量,并根据所述最优的低秩张量确定补全后的历史性能数据。
[0011]第二方面,本申请还提供了一种性能数据补全装置。所述装置包括:
[0012]数据获取模块,用于获取云平台的目标主机的历史性能数据;
[0013]数据预处理模块,用于根据所述历史性能数据所属目标主机的机器信息对所述历史性能数据进行分组,并根据所述历史性能数据的日期信息和时间点信息对每组所述历史性能数据进行排序;
[0014]张量构建模块,用于根据每组排序后的所述历史性能数据的机器信息、日期信息
和时间点信息,构建所述历史性能数据的待补全三维张量;
[0015]优化模型构建模块,用于将所述待补全三维张量分解为待求解的低秩张量和稀疏张量,并构建求解所述低秩张量和所述稀疏张量的优化模型;
[0016]求解模块,用于按照所述优化模型迭代地依次优化所述低秩张量和所述稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量,并根据所述最优的低秩张量确定补全后的历史性能数据。
[0017]在其中一个实施例中,所述求解模块还用于以目标结果等于所述待补全三维张量为约束条件,迭代地依次优化所述低秩张量和所述稀疏张量,以求解使得目标项最小时的低秩张量和稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量;
[0018]其中,所述目标结果是所述低秩张量和所述稀疏张量之和;所述目标项,是所述低秩张量的核范数和所述稀疏张量的L1范数的加权之和。
[0019]在其中一个实施例中,所述求解模块还用于对所述待补全三维张量进行奇异值分解,得到所述待补全三维张量对应的多个奇异值;将所述多个奇异值按照从大到小的顺序进行排序,保留排在前预设数量的奇异值,得到低管秩处理后的待补全三维张量;以目标结果等于所述低管秩处理后的待补全三维张量为约束条件,迭代地依次优化所述低秩张量和所述稀疏张量,以求解使得目标项最小时的低秩张量和稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量。
[0020]在其中一个实施例中,所述求解模块还用于朝着使损失函数的值减小的方向,迭代地依次优化所述损失函数中的所述低秩张量、所述稀疏张量和优化参数,直至符合停止条件,得到最优的低秩张量、稀疏张量和优化参数,并根据所述最优的低秩张量确定补全后的历史性能数据;
[0021]其中,所述损失函数包括所述目标项和通过所述优化参数加权后的条件项;所述条件项是根据所述目标结果与所述待补全三维张量之间的差值确定的。
[0022]在其中一个实施例中,所述数据预处理模块还用于根据所述历史性能数据所属目标主机所处地区的地区信息,将所述历史性能数据划分为多个地区组;不同地区组中的历史性能数据所属的目标主机处于不同地区;
[0023]所述张量构建模块还用于根据同一地区组中每组排序后的所述历史性能数据的机器信息、日期信息和时间点信息,构建所述地区组对应的地区的历史性能数据的待补全三维张量。
[0024]在其中一个实施例中,所述历史性能数据包括中央处理器利用率、内存利用率、磁盘读写速度和流量中的至少一种性能指标对应的数据;
[0025]所述张量构建模块还用于根据同一地区组中属于同一种性能指标的每组排序后的所述历史性能数据的机器信息、日期信息和时间点信息,构建所述地区组对应的地区在所述性能指标下的历史性能数据的待补全三维张量。
[0026]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行本申请各实施例所述的性能数据补全方法中的步骤。
[0027]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行本申请各
实施例所述的性能数据补全方法中的步骤。
[0028]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,使得所述处理器执行本申请各实施例所述的性能数据补全方法中的步骤。
[0029]上述性能数据补全方法、装置、计算机设备、存储介质和计算机程序产品,根据历史性能数据所属云平台的目标主机的机器信息对历史性能数据进行分组,并根据历史性能数据的日期信息和时间点信息对每组历史性能数据进行排序,根据每组排序后的历史性能数据的机器信息、日期信息和时间点信息,构建历史性能数据的待补全三维张量,求解将待补全的三维张量分解成的最优的低秩张量和稀疏张量,根据最优的低秩张量确定补全后的历史性能数据,通过分组和排序后构建张量能够充分利用历史性能数据中的上下文时序信息和缺失数据前后的数据特征,使得数据补全更加准确,而且无需依赖于训练样本进行模型训练,避免了在训练样本数据量较小的情况下难以实现准确的数据补全的问题,进一步提高了性能数据补全的准确性。
附图说明
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种性能数据补全方法,其特征在于,所述方法包括:获取云平台的目标主机的历史性能数据;根据所述历史性能数据所属目标主机的机器信息对所述历史性能数据进行分组,并根据所述历史性能数据的日期信息和时间点信息对每组所述历史性能数据进行排序;根据每组排序后的所述历史性能数据的机器信息、日期信息和时间点信息,构建所述历史性能数据的待补全三维张量;将所述待补全三维张量分解为待求解的低秩张量和稀疏张量,并构建求解所述低秩张量和所述稀疏张量的优化模型;按照所述优化模型迭代地依次优化所述低秩张量和所述稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量,并根据所述最优的低秩张量确定补全后的历史性能数据。2.根据权利要求1所述的方法,其特征在于,所述按照所述优化模型迭代地依次优化所述低秩张量和所述稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量包括:以目标结果等于所述待补全三维张量为约束条件,迭代地依次优化所述低秩张量和所述稀疏张量,以求解使得目标项最小时的低秩张量和稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量;其中,所述目标结果是所述低秩张量和所述稀疏张量之和;所述目标项,是所述低秩张量的核范数和所述稀疏张量的L1范数的加权之和。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:对所述待补全三维张量进行奇异值分解,得到所述待补全三维张量对应的多个奇异值;将所述多个奇异值按照从大到小的顺序进行排序,保留排在前预设数量的奇异值,得到低管秩处理后的待补全三维张量;所述以目标结果等于所述待补全三维张量为约束条件,迭代地依次优化所述低秩张量和所述稀疏张量,以求解使得目标项最小时的低秩张量和稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量包括:以目标结果等于所述低管秩处理后的待补全三维张量为约束条件,迭代地依次优化所述低秩张量和所述稀疏张量,以求解使得目标项最小时的低秩张量和稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量。4.根据权利要求2所述的方法,其特征在于,所述以目标结果等于所述待补全三维张量为约束条件,迭代地依次优化所述低秩张量和所述稀疏张量,以求解使得目标项最小时的低秩张量和稀疏张量,直至符合停止条件,得到最优的低秩张量和稀疏张量包括:朝着使损失函数的值减小的方向,迭代地依次优化所述损失函数中的所述低秩张量、所述稀疏张量和优化参数,直至符合停止条件,得到最优的低秩张量、稀疏张量和优化参数,并根据所述最优的低秩张量确定补全后的历史性能数据;其中,所述损失函数包括所述目标项和通过所述优化参数加权后...

【专利技术属性】
技术研发人员:谭健楠李力卡吴秉佺王谦段俊
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1