多层次指标的投影寻踪动态聚类方法与装置制造方法及图纸

技术编号:9866934 阅读:126 留言:0更新日期:2014-04-03 03:17
本公开涉及一种多层次指标的投影寻踪动态聚类方法与装置。该方法包括根据领域与目标的不同构建多层次评价指标体系;确定多层次评价指标体系中指标的权重;对实时元组数据中的噪声进行处理;基于处理后的实时元组数据和指标的权重建立投影寻踪聚类模型;基于遗传算法和投影寻踪聚类模型对处理后的实时元组数据实现投影寻踪动态聚类。本公开可以快速、高效且客观地实现数据动态聚类。

【技术实现步骤摘要】
多层次指标的投影寻踪动态聚类方法与装置
本公开涉及高维数据聚类
,特别地,涉及一种多层次指标的投影寻踪动态聚类方法与装置。
技术介绍
传统的统计模型多采用“假定-模拟-预测”这种证实性数据分析思路,这种分析思路难以适应千变万化的客观世界,无法真正找到数据的内在联系与规律,当它被用于高维、非线性、非正态分布数据预测建模时更难有好的效果。农业方面的数据通常具有数量大、指标多层次、多维度等特点,如何对农业领域不同的数据进行科学有效地聚类与评价一直是个重点和难题。因为这些农业数据过于巨大,同时影响因素又过于繁多。如果简单的运用传统统计假设的方法,不但难以有效地对多层次高维度数据进行科学聚类与评价,而且随着时间的变化要进行大量的重复工作。上世纪70年代以来,随着计算机技术的发展,国际统计界发展了一种投影寻踪技术(Projection Pursuit)。它采用的是“审视数据-模拟-预测”这样一种探索性数据分析(Exploratory Data Analysis)的新思路,其本质是寻找由高维数据投影到低维数据的特征投影方向,通过几个投影方向了解高维数据的分布、结构、联系等性质。投影寻踪这种新兴的统计方法适用于高维、非线性、非正态问题的分析和处理,因此,它一直引起国内外统计专家和信号处理学者的关注,已经被成功地应用于多个领域。投影寻踪是分析高维数据的一类统计方法,其基本思想是将高维数据投影到低维子空间上进行聚类,通过分析低维空间数据点的变化特征来研究高维数据结构特征。但是,普通的投影寻踪聚类方法无法体现实际指标经验的重要性。同时传统的AHP (AnalyticHierarchy Process,层次分析法)存在评价主观性过重的问题,从而可能影响评价与选择。1981 年,Friedman 和 Stuetzle 提出 了实现 PPR (Projection Pursuit Regression,投影寻踪回归)的多重平滑回归技术,但该方法计算复杂、编程困难,难以推广使用。
技术实现思路
本公开鉴于以上问题中的至少一个提出了新的技术方案。本公开在其一个方面提供了一种多层次指标的投影寻踪动态聚类方法,其可以快速、高效且客观地实现数据动态聚类。本公开在其另一方面提供了一种多层次指标的投影寻踪动态聚类装置,其可以快速、高效且客观地实现数据动态聚类。根据本公开,提供一种多层次指标的投影寻踪动态聚类方法,包括:根据领域与目标的不同构建多层次评价指标体系;确定多层次评价指标体系中指标的权重;对实时元组数据中的噪声进行处理;基于处理后的实时元组数据和指标的权重建立投影寻踪聚类模型;基于遗传算法和投影寻踪聚类模型对处理后的实时元组数据实现投影寻踪动态聚类。在本公开的一些实施例中,确定多层次评价指标体系中指标的权重的步骤包括:采用层次分析法为各级指标赋予初步权重;根据各级指标的初步权重计算综合评价指标的权重。在本公开的一些实施例中,基于处理后的实时元组数据和指标的权重建立投影寻踪聚类模型的步骤包括:对处理后的实时元组数据进行归一化处理;利用指标的权重对归一化后的数据进行权重调整;对权重调整后的数据进行线性投影;基于线性投影的结果构造投影目标函数;确定对各指标的投影方向向量和对投影目标函数的限定条件。在本公开的一些实施例中,基于遗传算法和投影寻踪聚类模型对处理后的实时元组数据实现投影寻踪动态聚类的步骤包括:随机产生多个单位向量,每个单位向量作为一条染色体;针对每条染色体根据投影目标函数计算其适应度值;根据适应度值在多条染色体中选出设定条数的染色体作为繁衍后代的父代;对父代群体中的染色体进行交叉与变异操作;过滤掉不满足单位向量要求的交叉与变异后的染色体;计算交叉与变异后的染色体的适应度值;[0031 ]根据种群迭代次数和适应度值确定是否终止种群迭代;如终止种群迭代,则将迭代出的种群中与适应度值最大的单位向量作为最佳投影方向向量,否则继续根据适应度值选择繁衍后代的父代。根据本公开,还提供了一种多层次指标的投影寻踪动态聚类装置,包括:指标体系建立单元,用于根据领域与目标的不同构建多层次评价指标体系;权重确定单元,用于确定多层次评价指标体系中指标的权重;数据处理单元,用于对实时元组数据中的噪声进行处理;模型建立单元,用于基于处理后的实时元组数据和指标的权重建立投影寻踪聚类模型;聚类处理单元,用于基于遗传算法和投影寻踪聚类模型对处理后的实时元组数据实现投影寻踪动态聚类。在本公开的一些实施例中,权重确定单元包括:各级指标权重赋值子单元,用于采用层次分析法为各级指标赋予初步权重;综合指标权重计算子单元,用于根据各级指标的初步权重计算综合评价指标的权重。在本公开的一些实施例中,模型建立单元包括:归一化子单元,用于对处理后的实时元组数据进行归一化处理;权重调整子单元,用于利用指标的权重对归一化后的数据进行权重调整;线性投影子单元,用于对权重调整后的数据进行线性投影;投影目标函数构造子单元,用于基于线性投影的结果构造投影目标函数;限定条件确定子单元,用于确定对各指标的投影方向向量和对投影目标函数的限定条件。在本公开的一些实施例中,聚类处理单元包括:父代选取子单元,用于随机产生多个单位向量,每个单位向量作为一条染色体,针对每条染色体根据投影目标函数计算其适应度值,根据适应度值在多条染色体中选出设定条数的染色体作为繁衍后代的父代;交叉与变异处理子单元,用于对父代群体中的染色体进行交叉与变异操作,过滤掉不满足单位向量要求的交叉与变异后的染色体,计算交叉与变异后的染色体的适应度值;迭代判断子单元,用于根据种群迭代次数和适应度值确定是否终止种群迭代,如终止种群迭代,则将迭代出的种群中与适应度值最大的单位向量作为最佳投影方向向量,否则继续根据适应度值选择繁衍后代的父代。在本公开的技术方案中,通过有效地结合层次分析法、投影寻踪和遗传算法,使得数据的动态聚类更快速、高效且客观。【附图说明】此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分。在附图中:图1是本公开一个实施例的多层次指标的投影寻踪动态聚类方法的流程示意图。图2是本公开另一实施例的多层次指标的投影寻踪动态聚类方法的流程示意图。图3是本公开一个实施例的多层次指标的投影寻踪动态聚类装置的结构示意图。【具体实施方式】下面将参照附图描述本公开。要注意的是,以下的描述在本质上仅是解释性和示例性的,决不作为对本公开及其应用或使用的任何限制。除非另外特别说明,否则,在实施例中阐述的部件和步骤的相对布置以及数字表达式和数值并不限制本公开的范围。另外,本领域技术人员已知的技术、方法和装置可能不被详细讨论,但在适当的情况下意在成为说明书的一部分。本公开是鉴于上述技术问题而产生的,其目的在于克服现有技术的不足之处,通过有效的结合ΑΗΡ、投影寻踪和遗传算法等优点,提出了一种基于遗传算法的多层次指标的投影寻踪动态聚类的技术方案,可以快速、高效、客观的实现数据动态聚类。图1是本公开一个实施例的多层次指标的投影寻踪动态聚类方法的流程示意图。如图1所示,该实施例可以包括以下步骤:S102,根据领域与目标的不同构建多层次评价指标体系;举例说明,假设该评价指标体系的一级评价指标可以包括三个Zl、Ζ2和Ζ3,针本文档来自技高网
...

【技术保护点】
一种多层次指标的投影寻踪动态聚类方法,其特征在于,包括:根据领域与目标的不同构建多层次评价指标体系;确定多层次评价指标体系中指标的权重;对实时元组数据中的噪声进行处理;基于处理后的实时元组数据和指标的权重建立投影寻踪聚类模型;基于遗传算法和投影寻踪聚类模型对处理后的实时元组数据实现投影寻踪动态聚类。

【技术特征摘要】
1.一种多层次指标的投影寻踪动态聚类方法,其特征在于,包括: 根据领域与目标的不同构建多层次评价指标体系; 确定多层次评价指标体系中指标的权重; 对实时元组数据中的噪声进行处理; 基于处理后的实时元组数据和指标的权重建立投影寻踪聚类模型; 基于遗传算法和投影寻踪聚类模型对处理后的实时元组数据实现投影寻踪动态聚类。2.根据权利要求1所述的多层次指标的投影寻踪动态聚类方法,其特征在于,所述确定多层次评价指标体系中指标的权重的步骤包括: 采用层次分析法为各级指标赋予初步权重; 根据各级指标的初步权重计算综合评价指标的权重。3.根据权利要求1所述的多层次指标的投影寻踪动态聚类方法,其特征在于,所述基于处理后的实时元组数据和指标的权重建立投影寻踪聚类模型的步骤包括: 对处理后的实时元组数据进行归一化处理; 利用指标的权重对归一化后的数据进行权重调整; 对权重调整后的数据进行线性投影; 基于线性投影的结果构造投影目标函数;` 确定对各指标的投影方向向量和对投影目标函数的限定条件。4.根据权利要求1所述的多层次指标的投影寻踪动态聚类方法,其特征在于,所述基于遗传算法和投影寻踪聚类模型对处理后的实时元组数据实现投影寻踪动态聚类的步骤包括: 随机产生多个单位向量,每个单位向量作为一条染色体; 针对每条染色体根据投影目标函数计算其适应度值; 根据适应度值在多条染色体中选出设定条数的染色体作为繁衍后代的父代; 对父代群体中的染色体进行交叉与变异操作; 过滤掉不满足单位向量要求的交叉与变异后的染色体; 计算交叉与变异后的染色体的适应度值; 根据种群迭代次数和适应度值确定是否终止种群迭代; 如终止种群迭代,则将迭代出的种群中与适应度值最大的单位向量作为最佳投影方向向量,否则继续根据适应度值选择繁衍后代的父代。5.一种多层次指标的投影寻踪动态聚类装置,其特征在于,包括: 指标体系建立单...

【专利技术属性】
技术研发人员:缪可成宋革联王茂华杨蕊张彬筠
申请(专利权)人:浙江省公众信息产业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1