基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法技术

技术编号:22689600 阅读:58 留言:0更新日期:2019-11-30 03:58
基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,本发明专利技术针对CMAES算法在对多维数据进行协方差矩阵更新迭代时数据维度过高的缺点提出了基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,PerD‑CMAES,在CMAES算法迭代更新计算数据种群的协方差矩阵C的过程中,将C特征分解得到代表每维数据变化趋势的特征值,将离散的特征值绘制成曲线,计算曲线的斜率来表示变化率,利用皮尔逊相关系数计算出曲线的相似度,用图论的最短路径思想找出应该聚类到一起的数据,并在典型函数上分析,实验证明,该方法降低了算法更新过程中问题维数对于算法的影响,并在Robocup3D足球机器人的行走优化中得到了很好的应用。

Cmaes clustering optimization method based on the similarity of eigenvalue curve of covariance matrix

Based on the similarity of the eigenvalue curve of the covariance matrix, the cmaes clustering optimization method is proposed. In this invention, aiming at the disadvantage that the data dimension of the cmaes algorithm is too high when updating the covariance matrix of the multi-dimensional data, the cmaes clustering optimization method based on the similarity of the eigenvalue curve of the covariance matrix is proposed. The method of per \u2011 cmaes is used to update the covariance matrix C of the data population in the cmaes algorithm In the process, the C feature is decomposed to get the characteristic value which represents the change trend of each dimension data, the discrete characteristic value is drawn into a curve, the slope of the curve is calculated to represent the change rate, the similarity of the curve is calculated by Pearson correlation coefficient, the data that should be clustered together is found by the shortest path idea of graph theory, and analyzed on the typical function. The experiment shows that the method reduces the calculation The influence of the dimension of the problem on the algorithm in the process of method updating has been well applied in the walking optimization of RoboCup 3D soccer robot.

【技术实现步骤摘要】
基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法
本专利技术涉及数据聚类优化领域,具体涉及一种基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法。
技术介绍
自适应协方差矩阵进化策略(cmaes)算法,是基于进化算法的一种改进算法,通过模拟生物进化过程来达到最优目的,主要用来解决非线性、非凸的优化问题。该方法从一个随机的初始搜索点开始搜索,并按照一定的概率分布产生第一个种群A,并评价其中所有个体的适应度;然后根据种群A中个体的适应度选择较好的个体更新进化策略,从而调整下一种群的进化方向,即控制下一种群的产生;每次突变后,须对比当前种群中的最优解和收敛条件,若满足则找到最优解并退出循环,否则继续迭代。该方法具有全局性能好、寻优效率高的特点,但多维数据进行协方差矩阵更新迭代时会存在数据维度过高的问题。
技术实现思路
本专利技术主要针对cmaes算法在对多维数据进行协方差矩阵更新迭代时数据维度过高的缺点,提出了一种基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,该方法降低了算法更新过程中问题维数对于算法的影响。基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,包括如下步骤:步骤1,给定目标函数f,设置cmaes的初始参数,如种群λ、父代个数μ、重组权重wi,阻尼系数dσ,协方差矩阵C的秩1和秩μ更新学习率c1、cμ;步骤2,初始化问题维度N,给定均值m(0)(维度为N),步长σ(0),步长和协方差矩阵分别对应的进化路径C(0)=I(单位矩阵);代数g从0开始,为上述值的右上角标,即迭代次数,具体迭代次数视实际需要而定;步骤3,cmaes循环开始,满足循环的终止条件后停止循环,并进入下一步骤;步骤4,特征值分解,并绘制出特征值的斜率变化曲线;步骤5,计算N维特征值斜率曲线彼此间的皮尔逊相关系数;步骤6,聚类优化;将N维特征值斜率曲线的皮尔逊相关系数看作曲线间的距离,算出距离彼此距离最近的曲线,聚类在一起,将对应维度的优化参数带入目标函数再次带入cmaes优化,如果得到更理想的目标函数值,则结束算法,否则聚类失败。进一步地,所述步骤3中,该cmaes循环的终止条件是满足指定问题精度,或是评价函数值不再变换,或是到达指定的迭代次数,该终止条件由用户自行设定,每次循环后迭代次数g=g+1。进一步地,所述步骤3中,所述cmases循环包括如下分步骤:步骤3-1,对多元分布N(0,C(g))进行采样,生成种群B、D为协方差矩阵C特征分解后得到的矩阵,C=B(D2)BT,BBT=E(单位阵),B的列向量由C的特征向量正交基组成,D的对角线由C的特征值平方根组成,在坐标轴内按比例缩放球形分布;为第(g+1)代第k个个体;步骤3-2,均值重组,将带入f,此时,其中步骤3-2,步长σ更新;E(||N(0,I)||是正态分布随机向量范数的期望长度,步骤3-4,协方差矩阵C更新;进一步地,所述步骤4中,所述特征值分解具体如下:C(g)=B(g)((D(g))2)B(g)T,为C的特征值平方,记录下各维特征值每代的值;进一步地,所述步骤5中,计算N维特征值斜率曲线彼此间的皮尔逊相关系数,具体计算过程如下;其中,为第i维,第(g+1)代的特征值曲线的斜率,r(ki,kj)为第i维和第j维特征值斜率曲线的皮尔逊相关系数。本专利技术达到的有益效果为:本专利技术提出的基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,降低了算法更新过程中问题维数对于算法的影响,并在Robocup3D足球机器人的行走优化中得到了很好的应用。附图说明图1为本专利技术所述基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法的步骤流程图。图2为优化前后机器人直线行走的对比图。图3为优化前后机器人绕圈行走的对比图。具体实施方式下面结合说明书附图对本专利技术的技术方案做进一步的详细说明。CMAES(CMA代表协方差自适应,ES表示演化策略)是用于实参数(连续域)的随机优化算法。核心思想是自适应调整搜索分布:多元正态分布N(m,C)的协方差矩阵C(C是对称正定的,它的几何意义是一个(超)椭球{x∈Rn|xTC-1x=1},使其逐步逼近目标函数f的等高线,在凸二次函数上,该量近似于逆Hessian(H-1)矩阵,从而使种群收敛于全局最优解(类似于拟牛顿法中H-1的更新)。协方差(正定)矩阵C具有吸引人的几何解释:它们可以用一个(超)椭球{x∈Rn|xTC-1x=1}唯一地识别,椭圆体的表面是分布密度相等的。椭球的主轴对应于C的特征向量,轴的长度对应于C的特征值。对C进行特征分解可得,C=B(D2)BT,BBT=E(单位阵),B的列向量由C的特征向量正交基组成(为椭圆体定义一个新的方向,椭球的新主轴对应于B的列),D的对角线由C的特征值平方根组成,在坐标轴内按比例缩放球形分布。N(m,C)分布可改写为:~表示分布相等。综上可得在用CMAES对搜索分布更新匹配目标函数的过程中,超椭球的每个轴放缩大小是由特征值决定的。随着逼近目标函数,理论上来说放缩值会越来越小。对于高维超椭球,如果在更新的过程中,某些轴的变化趋势一致,可以将这些轴的归为一类,从而降低数据维度。从数学角度来说就是分析协方差矩阵的特征值曲线,判别特征值曲线的相似度来进行分类优化。对于曲线相似度,皮尔逊相关系数ρ用来反应变量间的线性相关度,可以作为一种衡量标准。用于整体时,给定随机变量x,y,皮尔逊相关系数为其中cov为协方差,σx为x的方差,σy为y的方差,用于样本时ρ记为r,其中n为样本个数,和分别为样本均值,xiyi为各自样本的观测值。ρ∈[-1,1]。1为正相关,-1为完全负相关,0为无关。相关系数越大,表示曲线距离越近。综上可得,在CMAES迭代更新的过程中,可以得到每代的协方差矩阵的特征值,代与代之间间隔为1,给定问题的初始维度N,可以得到N条特征值曲线,特征值曲线的趋势可以用斜率k表示。两两计算曲线间的皮尔逊相关系数ρ。如果两条特征值斜率的曲线成正相关,说明一条曲线在变化时,另外一条曲线随之做同样的变化,这两条曲线可以归为一类,看作同一个变化。结合相关系数ρ来衡量CMAES协方差矩阵主轴变化趋势的算法,得到一种基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,为了讨论方便,记为PerD-CMAES。算法的流程图如图1,详细步骤如下:步骤1,给定目标函数f,设置cmaes的初始参数,如种群λ、父代个数μ、重组权重wi,阻尼系数dσ,协方差矩阵C的秩1和秩μ更新学习率c1、cμ。步骤2,初始化问题维度N,给定均值m(0)(维度为N),步长σ(0),步长和协方差矩阵分别对应的进化路径C(0)=I(单本文档来自技高网...

【技术保护点】
1.基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,其特征在于:包括如下步骤:/n步骤1,给定目标函数f,设置cmaes的初始参数,如种群λ、父代个数μ、重组权重w

【技术特征摘要】
1.基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,其特征在于:包括如下步骤:
步骤1,给定目标函数f,设置cmaes的初始参数,如种群λ、父代个数μ、重组权重wi,阻尼系数dσ,协方差矩阵C的秩1和秩μ更新学习率c1、cμ;
步骤2,初始化问题维度N,给定均值m(0)(维度为N),步长σ(0),步长和协方差矩阵分别对应的进化路径C(0)=I(单位矩阵);代数g从0开始,为上述值的右上角标,即迭代次数,具体迭代次数视实际需要而定;
步骤3,cmaes循环开始,满足循环的终止条件后停止循环,并进入下一步骤;
步骤4,特征值分解,并绘制出特征值的斜率变化曲线;
步骤5,计算N维特征值斜率曲线彼此间的皮尔逊相关系数;
步骤6,聚类优化;将N维特征值斜率曲线的皮尔逊相关系数看作曲线间的距离,算出距离彼此距离最近的曲线,聚类在一起,将对应维度的优化参数带入目标函数再次带入cmaes优化,如果得到更理想的目标函数值,则结束算法,否则聚类失败。


2.根据权利要求1所述的基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,其特征在于:所述步骤3中,该cmaes循环的终止条件是满足指定问题精度,或是评价函数值不再变换,或是到达指定的迭代次数,该终止条件由用户自行设定,每次循环后迭代次数g=g+1。


3.根据权利要求1所述的基于协方差矩阵特征值曲线相似度的cmaes聚类优化方法,其特征在于:所述步骤3中,所述cmases循环包括如...

【专利技术属性】
技术研发人员:梁志伟陈佳云
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1