【技术实现步骤摘要】
一种基于非冗余特征选择的数据中心服务器能耗预测方法
[0001]本专利技术涉及深度学习,特别是一种基于非冗余特征选择的数据中心服务器能耗预测方法。
技术介绍
[0002]IT设备和制冷设备是数据中心的两大组成部分,二者的能耗约占总能耗的90%。由服务器、存储和网络通信设备等所构成的IT设备系统所产生的功耗约占数据中心总功耗的45%,其中服务器系统约占50%。准确地预测服务器能耗不仅可以为数据中心节能提供重要依据,也是数据中心资源调度方法的基础。
[0003]然而数据中心服务器能耗特征复杂且维度高,如何选择合适的特征,缩减特征的维度,提高数据处理的效率和预测准确率显得尤为重要。针对以上需求,服务器能耗特征选择和模型构建成为数据中心服务器能耗预测的关键问题。
[0004]特征选择是机器学习中一个重要的“数据预处理”过程,可以将数据集中相关性较小的数据清除,从而提升机器学习的效率和精度。然而目前的特征选择方法对冗余特征的判定标准和方法不尽相同。大多数的研究是从两个特征的相关性判定冗余性,比如说计算两个特征之间的余弦相似度,很少有分析特征与特征的相关性和特征与目标值的相关性之间的联系。另外数据中心服务器能耗特征集维度巨大,一些特征选择算法也无法适用。
技术实现思路
[0005]专利技术目的:本专利技术的目的是提供一种基于非冗余特征选择的数据中心服务器能耗预测方法,从而使数据中心运维人员能够直观准确地掌握影响服务器能耗的关键因子,更好地分析、预测服务器运行时的负载变化和能耗趋势。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于非冗余特征选择的数据中心服务器能耗预测方法,其特征在于,包括以下步骤:(1)选择出服务器能耗原始特征集中的强相关特征集;(2)通过冗余特征判定算法找出强相关特征中的非冗余特征;(3)利用GRU神经网络构建模型预测服务器能耗。2.根据权利要求1所述的一种基于非冗余特征选择的数据中心服务器能耗预测方法,其特征在于,所述步骤(1)具体为:(1.1)计算原始特征中每个特征F
i
与目标标量能耗y之间的皮尔逊相关性系数ρ
i,y
;(1.2)设定一个阈值α,选出相关性系数ρ
i,y
大于等于设定阈值α的特征作为强相关特征集,并将强相关特征集按相关性大小降序排列。3.根据权利要求2所述的一种基于非冗余特征选择的数据中心服务器能耗预测方法,其特征在于,所述步骤(1.1)中皮尔逊相关性系数ρ
i,y
的计算公式为:其中Cov(i,y)是特征F
i
和目标变量能耗y的协方差,σ
i
和σ
y
分别为特征F
i
和目标变量能耗y的标准差。4.根据权利要求2所述的一种基于非冗余特征选择的数据中心服务器能耗预测方法,其特征在于,所述步骤(1.2)中设定的阈值α大于等于0.8且小于1。5.根据权利要求1所述的一种基于非冗余特征选择的数据中心服务器能耗预测方法,其特征在于,所述步骤(2)具体为:(2.1)记原始特征集中每个特征与目标变量能耗的皮尔逊相关性系数ρ
i,y
中的最大值为ρ
max
;(2.2)从强相关特征集最左端获取第一个特征F
j
,再依次获取F
j
右侧的特征F
i
,计算F
i
和F
j
的皮尔逊相关性系数ρ
i,j
;(2.3)判定ρ
i,y
和ρ
max
是很接近的情况,如果ρ
i,j
>ρ
max
,则特征F
i
是近似特征,从强相关特征集合中删除特征F
i
;(2.4)判定ρ
iy
和ρ
max
不是很接近的情况,但是其中为所有强相关特征和目标标量能耗相关性系数的平均值,则特征F
i
是近似特征,从强相关特征集合中删除特征F
i
;(2.5)选择F
j<...
【专利技术属性】
技术研发人员:丰佳,张立志,杨华飞,牧军,杨文清,宋文,秦培兆,李虎,席文超,李强,洪岩,申波,李伟,李磊,毛林晖,吴禹,刘辉,王丽君,张正银,
申请(专利权)人:国电南瑞科技股份有限公司南瑞集团有限公司国网电力科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。