一种数据中心能效相关特征的选择方法技术

技术编号：22260746 阅读：35 留言：0更新日期：2019-10-10 13:58

本发明专利技术提出了一种数据中心能效相关特征的选择方法，针对数据中心能效的特征选择问题，本发明专利技术采用了一种基于K近邻分类损失函数和分类间隔的特征选择方法，该方法通过收集数据中心能耗数据和对应的PUE值，然后将PUE值分级分类，通过样本找到对应的分类间隔，并更新特征权重和对特征权重排序，以此根据设定的阈值获得特征选择结果。本发明专利技术所述方法能够提取出与数据中心能效相关的特征并很好地处理噪声数据，从而提高后续能效预测的精度，有效防止过学习。

A Method for Selecting Energy Efficiency Related Features in Data Centers

全部详细技术资料下载

【技术实现步骤摘要】
一种数据中心能效相关特征的选择方法
本专利技术属于云计算和机器学习，具体涉及一种数据中心能效相关特征的选择方法。
技术介绍
数据中心是执行全天候大规模关键运算任务的基础设施，是支撑IT行业运转的重要设施。随着网络运营商和互联网公司的大规模云服务对数据计算、处理和存储的需求不断增长，拥有成千上万台服务器的大型数据中心激增。其次，高性能运算的云端化随着网络带宽的扩容而不断发展，这扩大了构建大规模计算基础架构的需求。因此，数据中心成为快速发展的IT行业的关键基础设施之一。近年来，由于数据中心的高经济效益与环境相关性，数据中心的能源效率的优化问题已经变得至关重要。首先，数据中心带来了许多经济效益，这使得数据中心的规模和数量也不断增长。随着用电量的急剧增加和电力成本的上升，电费已经成为当今数据中心的主要开支。在某些情况下，数据中心的电力成本可能高于原始资本投资的成本。其次，数据中心的能源使用会产生许多环境问题，如大量的电能消耗、空调等制冷设备的温室气体排放与冷却水的排放。而且即使数据中心的服务器处于空闲状态，同样会消耗大量的能量。出于这些原因，目前在数据中心运营过程中其能源效率需要优先考虑。衡量数据中心能效的最常用指标是能源使用效率，即PUE。这个指标的定义是输入数据中心的总能耗除以IT设备使用的能耗。总能耗包括IT设备使用的能耗加上任何非计算和数据通信用途的设备(即冷却，照明设备等)所消耗的任何开销功耗。若数据中心的PUE值为2.0，这意味着该设施每供给IT设备1瓦特的能耗，其他非IT设备也会消耗1瓦特能耗。最理想的PUE是1.0，即除IT设备外无其他能耗的假设情...

【技术保护点】
1.一种数据中心能效相关特征的选择方法，其特征在于：包括以下步骤：(1)收集数据中心能耗数据和对应的PUE值；(2)按分级标准将PUE值分级；(3)随机选择样本并查找其K近邻，同时计算该样本所对应的分类间隔；(4)建立基于分类损失‑间隔的特征选择评价准则；(5)通过梯度下降优化所设计的评价准则更新特征权重；(6)对特征权重排序，并通过设定阈值来获得特征选择结果。

【技术特征摘要】
1.一种数据中心能效相关特征的选择方法，其特征在于：包括以下步骤：(1)收集数据中心能耗数据和对应的PUE值；(2)按分级标准将PUE值分级；(3)随机选择样本并查找其K近邻，同时计算该样本所对应的分类间隔；(4)建立基于分类损失-间隔的特征选择评价准则；(5)通过梯度下降优化所设计的评价准则更新特征权重；(6)对特征权重排序，并通过设定阈值来获得特征选择结果。2.据权利要求1所述一种数据中心能效相关特征的选择方法，其特征在于：所述步骤(2)中按分级标准将PUE值分级，根据电能利用效率分级表计算出每条数据xi对应的PUE等级yi∈{1，2，3}，xi表示第i条数据的n维特征矢量，其中的xij则表示第i条数据的第j个实数特征值，其表达式如下：3.据权利要求1所述一种数据中心能效相关特征的选择方法，其特征在于：步骤(3)所述的随机选择样本并查找其K近邻，同时计算该样本所对应的分类间隔具体步骤如下：(31)获得二维二值标签对应关系矩阵B和目标近邻关系矩阵T，所述矩阵B中元素bij∈{0，1}表示PUE等级yi和yj是否相同，矩阵T中元素tij∈{0，1}表示样本xj是否为xi的目标近邻；(32)目标近邻的定义为与xiPUE等级相同的K近邻同类样本，其中K＞2；(33)从N条样本中不放回选择样本xi，找到与样本xi...

【专利技术属性】
技术研发人员：李云，张諝晟，沈子钰，夏彬，刘峥，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人