基于遗传算法和高斯混合水平集模型的曲线拟合方法技术

技术编号:17597897 阅读:19 留言:0更新日期:2018-03-31 10:49
本发明专利技术提供一种基于遗传算法和高斯混合水平集模型的曲线拟合方法,应用于封闭离散数据点的曲线拟合,以解决目前曲线拟合方法中对于封闭离散数据点的拟合精度不高和对未知数据特征的离散数据点的拟合过程较为复杂、易出现过拟合的问题。具体方案为:首先构造一个二维高斯混合模型并根据所给离散封闭数据点计算高斯混合模型参数,随后利用二维高斯混合模型集合水平集算法思想,通过截取二维高斯混合模型中同一水平集的数据点,构造一条封闭曲线作为初始曲线,然后通过最小二乘法表征拟合点与样本点间的偏差,最后使用遗传算法进行曲线的拟合进化并计算求解封闭曲线中的参数,实现曲线拟合。

A curve fitting method based on genetic algorithm and Gauss mixed level set model

【技术实现步骤摘要】
基于遗传算法和高斯混合水平集模型的曲线拟合方法
本专利技术涉及一种曲线拟合方法,特别涉及一种对封闭数据点的曲线拟合方法,属于图像处理领域。
技术介绍
目前,曲线拟合算法被广泛应用于工程设计、图像处理、逆向工程等领域,并且成为这些领域进行数据处理必不可少的关键环节。获取数据的最终目的在于挖掘数据背后的现实意义,故一种对于观测数据的曲线拟合算法,对分析现有数据以及对于未来数据的预测具有重要的意义。曲线拟合技术是一种使用连续的曲线近似的刻画或是比拟平面上离散点集函数关系的数据处理算法,其通过对离散数据点进行分析处理来获取最合适的曲线的函数式表达。其核心思想是以经过测量或是采集得到的离散数据点集A={A|(xi,yi)i=1,2......n}作为输入,拟合数据点与观测数据点间差异量作为研究对象,实现由曲线拟合数据点的目的。然而现有的针对封闭离散数据的曲线拟合方法,大多采用分段式拟合方法。使用分段式拟合方法有很大的弊端,尤其是如何平滑过渡各分段连接点以及如何划分分段的区域难以把握。而且在曲线拟合算法中,大多通过多项式函数形式对已有数据点进行拟合得到多项式参数,由于数据特征的未知性,常出现过拟合现象。所以如何解决对于封闭离散数据点的曲线拟合,并且避免分段式拟合方法的弊端与过拟合问题是需要解决的问题。
技术实现思路
有鉴于此,本专利技术提出一种基于遗传算法和高斯混合水平集模型的曲线拟合方法,能够有效解决封闭离散数据点曲线拟合精度不高和由于未知数据特征而导致的过拟合问题。所述的基于遗传算法和高斯混合水平集模型的曲线拟合方法,具体步骤为:步骤一:确定待拟合的数据点的数值区间,所述数据点为封闭离散数据点;步骤二:依据步骤一中所确定的数据点的数值区间,构造二维高斯混合模型;然后选取该二维高斯混合模型中由同一水平集数据所构成的封闭曲线作为初始曲线,获得该初始曲线的拟合函数表达式;步骤三:将步骤二中得到的初始曲线的拟合函数表达式作为输入,通过最小二乘法表征拟合点与样本点间的偏差,并通过遗传算法计算初始曲线的拟合函数表达式中的各参数数值,得到待拟合的数据点的曲线拟合表达式。所述步骤一中在确定待拟合的数据点的数值区间前,先剔除数据点中的异常数据点;所述异常数据点为所有数据点的平面散点图中超出设定范围内的数据点。所述步骤二中:构造二维高斯混合模型的步骤为:步骤21:根据步骤一所确定的数值区间,随机选取二维高斯混合模型中的类值K;步骤22:二维高斯混合模型表示为:其中:αk为第k个高斯分布的权重,μk,σk分别为第k个高斯分布的均值和方差,N(v|μk,σk)表示单高斯分布;对上述二维高斯混合模型参数初始化,得到高斯分布的三个参数αk、μk、σk的初始值步骤23:根据二维高斯混合模型,采用最大似然估计法构造最大似然函数L(θ);初始时,最大似然函数L(θ)中的三个参数αk、μk、σk取其初始值步骤24:使用EM优化算法估算二维高斯混合模型的参数三个αk、μk和σk,估算后的三个参数值分别为αk′、μk′和σk′;将该三个参数值代入公式(2),构造新的最大似然函数;步骤25:重复步骤24,直到满足设定的收敛条件。有益效果:(1)由于二维高斯模型本身的函数特征,当选取合适的水平截面数值时,所截取的曲线必为一个或多个封闭曲线,所以能很方便的获取到封闭曲线,从而避免采用分段式拟合方法带来的相交不光滑的问题。(2)在选用遗传算法来求解二维高斯混合模型中参数的数值过程中,结合优化参数的结构和约束条件,使用矩阵编码的形式,提高了算法的运算速度和稳定性。附图说明图1为本专利技术的方法的流程图;图2为截取同一水平集数据所构成的初始曲线,这里为选取level=0.01得到的GMMlevel=0.01曲线图;图3曲线拟合进化过程图;图4最终曲线拟合结果图。具体实施方式下面结合附图并举实施例,对本专利技术进行详细描述。本实施例提供一种基于遗传算法和高斯混合水平集模型的曲线拟合方法,该方法将二维高斯混合模型与水平集算法相结合,获取初始封闭曲线的函数表达式,由于二维高斯混合模型的密度函数表达式在空间几何上是三维表示的,结合水平集算法思想,截取同一水平的密度函数值,由于二维高斯模型本身的函数特征,当选取的水平数值合适时,所截取的曲线必为一个或多个封闭曲线。并选用遗传算法来求解二维高斯混合模型中参数的数值,完成对离散的封闭数据点的曲线拟合,获取拟合曲线的函数表达式,同时为了提高运算效率采用矩阵编码的形式。如图1所示,该方法的具体步骤如下:步骤一:观测数据点,确定数据点大致数值区间,以方便后续的函数的构造。具体为:(1-1)处理数据点:绘制所给数据点(即待拟合的封闭离散数据点)的平面散点图,观测数据点在平面散点图中的分布。考虑所给数据点中,由于各种因素影响可能会出现异常数据点(即远离正常数据点群的数据点),如果混杂了个别异常数据点,会给正常分析造成巨大影响,使得计算和结论的可靠性降低。尤其是针对数据量不大的情况,可能会导致错误的结论。为了防止这类数据点影响,采用人工观测的方式定性的剔除这些远离正常数据点群的异常数据点,令处理后的数据点集A为:A={A|(xi,yi);i=1,2......n},n为处理后的数据点的个数;(xi,yi)为第i个数据点在平面散点图中的坐标。(2-2)获取处理后的数据点数值区间:对于曲线拟合问题,数据点在平面内具有两个维度,将两个维度上的数值区间的最小值和最大值记录下来并分别记为a和b,则数据点数值区间为[a,b]。步骤二:构造二维高斯混合模型(2DGaussianMixtureModel),截取二维高斯混合模型中由同一水平集数据所构成的曲线作为初始曲线L(∩),得到拟合函数表达式。具体为:(2-1)根据步骤一中所确定的数据点数值区间,构造二维高斯混合模型:(2-11)根据所拟合数据特征与数值区间[a,b],主观随机选取二维高斯混合模型中所需的类值K;(2-12)高斯混合模型参数初始化,高斯混合模型表示为:其中:αk是第k个高斯分布的权重,μk,σk分别是第k个高斯分布的均值和方差,N(v|μk,σk)表示单高斯分布;初始化高斯分布的参数(2-13)根据采用最大似然估计法构造似然函数L(θ);(2-14)使用EM优化算法估算二维高斯混合模型的参数αk、μk和σkTheprocessof“Expectation”:估计数据由每个Component生成的概率:对于第i个数据Ai=(xi,yi)来说,它由第k个Component生成的概率λik为:Theprocessof“Maximization”:基于λik数值,运用最大似然法估计二维高斯混合模型的参数:(2-15):重复步骤(2-14),直到满足设定的收敛条件:即前后两次结果相差在设定的阈值内,最终得到一个二维高斯混合模型的函数表达式。(2-2)获取二维高斯混合模型的水平集函数表达式截取由(2-1)中构造的二维高斯混合模型中同一水平集数据所构成的曲线作为初始曲线L(∩)。截取该二维高斯混合模型的空间半封闭区间中的一个水平截面(或称为同一水平集level)作为初始曲线L(∩)的拟合函数,选取水平截面数值时,保证所截取的曲线为封闭曲线,即初始曲线L(∩)应为封闭曲线,如图2所示;曲线拟合函数如式(7本文档来自技高网...
基于遗传算法和高斯混合水平集模型的曲线拟合方法

【技术保护点】
基于遗传算法和高斯混合水平集模型的曲线拟合方法,其特征在于,具体步骤为:步骤一:确定待拟合的数据点的数值区间,所述数据点为封闭离散数据点;步骤二:依据步骤一中所确定的数据点的数值区间,构造二维高斯混合模型;然后选取该二维高斯混合模型中由同一水平集数据所构成的封闭曲线作为初始曲线,获得该初始曲线的拟合函数表达式;步骤三:将步骤二中得到的初始曲线的拟合函数表达式作为输入,通过最小二乘法表征拟合点与样本点间的偏差,并通过遗传算法计算初始曲线的拟合函数表达式中的各参数数值,得到待拟合的数据点的曲线拟合表达式。

【技术特征摘要】
1.基于遗传算法和高斯混合水平集模型的曲线拟合方法,其特征在于,具体步骤为:步骤一:确定待拟合的数据点的数值区间,所述数据点为封闭离散数据点;步骤二:依据步骤一中所确定的数据点的数值区间,构造二维高斯混合模型;然后选取该二维高斯混合模型中由同一水平集数据所构成的封闭曲线作为初始曲线,获得该初始曲线的拟合函数表达式;步骤三:将步骤二中得到的初始曲线的拟合函数表达式作为输入,通过最小二乘法表征拟合点与样本点间的偏差,并通过遗传算法计算初始曲线的拟合函数表达式中的各参数数值,得到待拟合的数据点的曲线拟合表达式。2.根据权利要求1所述的基于遗传算法和高斯混合水平集模型的曲线拟合方法,其特征在于,所述步骤一中在确定待拟合的数据点的数值区间前,先剔除数据点中的异常数据点;所述异常数据点为所有数据点的平面散点图中超出设定范围内的数据点。3.根据权利要求1所述的基于遗传算法和高斯混合水平集模型的曲线拟合方法,其特征在于,所述步骤二中:构造二维高斯混合模型的步骤为:步骤21:根据步骤一所确定的数值区间,随机选取二维高斯混合模型中的类值K;步骤22:二维高斯混合模型表示为:其中:αk为第k个高斯分布的权重,μk,σk分别为第k个高斯分布的均值和方差,N(v|μk,σk)表示单高斯分布;对上述二维高斯混合模型参数初始化,得到高斯分布的三个参数αk、μk、σk的初始值步骤23:根据二维高斯混合模型,采用最大似然估计法构造最大似然函数L(θ);初始时,最大似然函数L(θ)中的三个参数αk、μk、σk取其初始值步骤24:使用EM优化算法估算二维高斯混合模型的参数三个αk、μk和σk,估算后的三个参数值分别为αk′、μk′和σk′;将该三个参数值代入公式(2),构造新的最大似然函数;步骤25:重复步骤24,直到满足设定的收敛条件。4.根据权利要求3所述的基于遗传算法和高斯混合水平集模型的曲线拟合方法,其特征在于,所述步骤三中:步骤31:设计目标函数通过最小二乘法表征拟合数据点与实际数据点之间的偏差函数,将该偏差函数的最小值作为目标函数;步骤32:通过遗传算法计算初始曲线的拟合函数表达式中的参数数值,所述的参数为权重α、均值μ和方差σ,具体步骤为:(321):编码采用矩阵编码的形式,...

【专利技术属性】
技术研发人员:王国新贾良跃郝佳阎艳杨念
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1