当前位置: 首页 > 专利查询>浙江大学专利>正文

一种根据特征选择负载的方法和系统技术方案

技术编号:11722605 阅读:253 留言:0更新日期:2015-07-11 13:49
本发明专利技术适用于算法领域,提供了一种根据特征选择负载的方法和系统,所述方法包括:对待处理特征数据进行预处理;通过特征聚类算法对所述待处理特征数据进行分类,并获取各类的代表元;根据互信息值和所述代表元,选择高准确度的特征对应的负载。本发明专利技术实施例,对待处理特征数据进行预处理,通过特征聚类算法对待处理特征数据进行分类,获取各类的代表元,根据互信息值和代表元,选择高准确度的特征对应的负载,提供了一种高效率的负载选择方法和系统,提高了负载选择的效率。

【技术实现步骤摘要】

本专利技术属于算法领域,尤其涉及一种根据特征选择负载的方法和系统
技术介绍
无论是传统的物理机或者云计算中的虚拟集群,对于系统的优化都非常重要。为 了适应不同的应用要求,对系统的优化会采取不同的优化方法。在这种情况下,首先需要对 物理机或者虚拟机进行负载分类,根据其属于CPU密集型,内存密集型,IO密集型和网络密 集型等分别采取不同的优化方法,以提高效率。负载分类方法是系统优化的前提,其效率的好坏直接影响着系统优化的效率。在 负载分类过程中,准确度与效率是一个相互制约的因素,通常提高准确度的同时意味着效 率的下降。 在负载分类过程中,一般情况下,增加特征的维度可以提高分类的准确度,但会降 低分类的效率。但盲目地增加特征的维度并不能提高准确度,因为有相关关系的特征维度 会相互影响并降低分类准确率。所以在特征选择中,需要选择与分类相关度高的特征,避免 特征的盲目增加。
技术实现思路
鉴于此,本专利技术提供一种根据特征选择负载的方法和系统,以解决现有技术的负 载选择效率低的技术问题。 本专利技术实施例是这样实现的,一种根据特征选择负载的方法,所述方法包括以下 步骤: 对待处理特征数据进行预处理; 通过特征聚类算法对所述待处理特征数据进行分类,并获取各类的代表元;根据互信息值和所述代表元,选择高准确度的特征对应的负载。 本专利技术实施例还提供一种根据特征选择负载的系统,所述系统包括: 预处理单元,用于对待处理特征数据进行预处理; 代表元获取单元,用于通过特征聚类算法对所述预处理单元处理的待处理特征数 据进行分类,并获取各类的代表元; 负载选择单元,用于根据互信息值和所述代表元获取单元获取的代表元,选择高 准确度的特征对应的负载。 本专利技术实施例,对待处理特征数据进行预处理,通过特征聚类算法对待处理特征 数据进行分类,获取各类的代表元,根据互信息值和代表元,选择高准确度的特征对应的负 载,提供了一种高效率的负载选择方法和系统,提高了负载选择的效率。【附图说明】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述 中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些 实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些 附图获得其他的附图。 图1是本专利技术实施例提供根据特征选择负载方法的流程图;图2是本专利技术实施例提供的根据特征选择负载系统的结构图。【具体实施方式】 为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并 不用于限定本专利技术。 为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。 实施例一 如图1所示为本专利技术实施例提供根据特征选择负载方法的流程图,所述方法包括 以下步骤: 步骤S101,对待处理特征数据进行预处理。 在本专利技术实施例中,对待处理的特征数据进行预处理,通过该预处理,可以获取该 特征数据的有效数据,该特征数据为负载在运行时表现出的特征,该特征包括但不限于: CPU密集型、内存密集型、IO密集型和网络密集型。所述对待处理特征数据进行预处理的步 骤,包括: 1、通过粒度选择将所述待处理特征数据组成数据矩阵。 在本专利技术实施例中,对待处理特征数据进行粒度选择,即:取一段时间内的特征数 据,将不同时间的数据按行排列、同一时间的不同指标数据按列排列,并将上述按行列排列 的数据组成数据矩阵。【主权项】1. 一种根据特征选择负载的方法,其特征在于,所述方法包括以下步骤: 对待处理特征数据进行预处理; 通过特征聚类算法对所述待处理特征数据进行分类,并获取各类的代表元; 根据互信息值和所述代表元,选择高准确度的特征对应的负载。2. 如权利要求1所述的方法,其特征在于,所述对待处理特征数据进行预处理的步骤, 包括: 通过粒度选择将所述待处理特征数据组成数据矩阵; 通过公5对所述数据矩阵进行正规化处理。3. 如权利要求1所述的方法,其特征在于,所述通过特征聚类算法对所述待处理特征 数据进行分类,并获取各类的代表元的步骤,具体为: 计算所述特征之间的皮尔森相关系数PCC ; 根据所述PCC衡量特征之间的关联性,并根据所述关联性进行聚类; 从各类别中选择一个特征作为所述类别的代表元。4. 如权利要求1所述的方法,其特征在于,所述根据互信息值和所述代表元,选择高准 确度的特征对应的负载的步骤,包括: 根据公?i计算所述代表元的互信息值; 根据所述互信息值对所述代表元进行排序; 根据所述排序选择高准确度的特征对应的负载。5. -种根据特征选择负载的系统,其特征在于,所述系统包括: 预处理单元,用于对待处理特征数据进行预处理; 代表元获取单元,用于通过特征聚类算法对所述预处理单元处理的待处理特征数据进 行分类,并获取各类的代表元; 负载选择单元,用于根据互信息值和所述代表元获取单元获取的代表元,选择高准确 度的特征对应的负载。6. 如权利要求5所述的系统,其特征在于,所述预处理单元,包括: 数据矩阵组成子单元,用于通过粒度选择将所述待处理特征数据组成数据矩阵; 正规化处理子单元,用于通过公式对所述数据矩阵组成子 单元组成的数据矩阵进行正规化处理。7. 如权利要求5所述的系统,其特征在于,所述代表元获取单元,包括: PPC计算子单元,用于计算所述特征之间的PCC ; 聚类子单元,用于根据所述PPC计算子单元计算的PCC衡量特征之间的关联性,并根据 所述关联性进行聚类; 代表元获取子单元,用于从所述聚类子单元计算的各类别中选择一个特征作为所述类 别的代表元。8.如权利要求5所述的系统,其特征在于,所述负载选择单元,包括: 互信息值计算子单元,用于根据公式j计 算所述代表元的互信息值; 排序子单元,用于根据所述互信息值计算子单元计算的互信息值对所述代表元进行排 序; 负载选择子单元,用于根据所述排序子单元计算的排序选择高准确度的特征对应的负 载。【专利摘要】本专利技术适用于算法领域,提供了一种根据特征选择负载的方法和系统,所述方法包括:对待处理特征数据进行预处理;通过特征聚类算法对所述待处理特征数据进行分类,并获取各类的代表元;根据互信息值和所述代表元,选择高准确度的特征对应的负载。本专利技术实施例,对待处理特征数据进行预处理,通过特征聚类算法对待处理特征数据进行分类,获取各类的代表元,根据互信息值和代表元,选择高准确度的特征对应的负载,提供了一种高效率的负载选择方法和系统,提高了负载选择的效率。【IPC分类】G06F17-30【公开号】CN104765804【申请号】CN201510147870【专利技术人】尹建伟, 林鹏翔, 赵新奎, 李莹, 邓水光, 吴健, 吴朝晖 【申请人】浙江大学【公开日】2015年7月8日【申请日】2015年3月31日本文档来自技高网...

【技术保护点】
一种根据特征选择负载的方法,其特征在于,所述方法包括以下步骤:对待处理特征数据进行预处理;通过特征聚类算法对所述待处理特征数据进行分类,并获取各类的代表元;根据互信息值和所述代表元,选择高准确度的特征对应的负载。

【技术特征摘要】

【专利技术属性】
技术研发人员:尹建伟林鹏翔赵新奎李莹邓水光吴健吴朝晖
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1