一种EM算法二维直方图聚类的方法及装置制造方法及图纸

技术编号:21090994 阅读:30 留言:0更新日期:2019-05-11 10:29
本发明专利技术公开了一种EM算法二维直方图聚类的方法及装置,通过对二维直方图建立二维高斯混合模型,计算混合分量的个数与各个分布的权重并转换二维高斯混合模型,二维高斯混合模型根据类属标签采用贝叶斯后验概率计算隐含类别,只要给定混合模型的个数,可以自动收敛得到多阈值分类的结果,随着混合模型个数的增加,区域分类越来越精细,特征分类越来越明显,在噪声图像和多目标图像中的分类效果很好。

【技术实现步骤摘要】
一种EM算法二维直方图聚类的方法及装置
本公开涉及图像处理领域,具体涉及一种EM算法二维直方图聚类的方法及装置。
技术介绍
二维直方图是在一维直方图的基础上考虑邻域后的二维分布,由于二维直方图既反映了图像的灰度分布,又能体现像素点与其邻域的空间相关信息,具有较好的抗噪性,因此受到了很多关注。利用二维直方图进行阈值分割,最大类间方差法和最大熵法应用得最多,但仅是单阈值分割,没有扩展到多阈值,满足不了多阈值多目标的复杂图像分割需求。现在的萤火虫和二维熵结合的算法寻找多阈值,由于反复迭代,计算耗时费力。考虑到直方图是一个典型的统计量,往往呈现双峰或多峰状态,直方图的形状可以看做是多个高斯分布的叠加,混合高斯模型可以描述这种多态情况。二维直方图比一维直方图的抗噪声能力强,直方图阈值是图像分割的重要依据,二维直方图因为考虑了每个像素的邻域相关信息,对噪声图像的分割效果更好。有别于传统的最大类间方差及最大熵阈值法。图像分割就是将一幅图像划分成若干聚类区域,每个区域都有相似的特性。在众多的图像分割方法中,直方图阈值法因其简单高效备受注意。它的基本思想是目标和背景分布在直方图灰度轴的两端,只要找到这个分割点,就可以进行图像分割,最大类间方差法(大津OTSU)、最大熵法、模糊聚类、期望最大(EM)值法等,都是典型的阈值分割方法。随着研究的深入、应用领域的扩大,阈值分割算法也在不断进化,出现了多阈值分割、融合目标特征的分割、以及利用二维直方图的多维度分割算法等。
技术实现思路
本公开提供一种EM算法二维直方图聚类的方法及装置,用二维GMM拟合二维直方图曲线,采用EM算法获取GMM的分布参数,利用多个高斯分布的叠加对直方图进行逼近,得到聚类的高斯混合模型,由此高斯混合模型进行聚类。为了实现上述目的,根据本公开的一方面,提供一种EM算法二维直方图聚类的方法,所述方法包括以下步骤:步骤1,获取图像的二维直方图;步骤2,对二维直方图建立二维高斯混合模型;步骤3,计算混合分量的个数与各个分布的权重,并转换二维高斯混合模型;步骤4,二维高斯混合模型根据类属标签采用贝叶斯后验概率计算隐含类别;步骤5,根据Jensen不等式计算二维混合高斯模型的似然函数;步骤6,获取所有分布得到类属更新分布;步骤7,重复执行步骤4直到计算出所有类别。进一步地,在步骤1中,所述获取图像的二维直方图的方法为,输入一个的图像,所述图像的图像矩阵为m行n列,根据每个像素本身的灰度值,计算每个像素的邻域平均灰度值,由每个像素本身的灰度值和邻域平均灰度值构成了二维坐标系;设任意像素点p在坐标(x,y)处的灰度值为f(x,y),取p的8-邻域(N8)平均灰度值g(x,y),二者的值域都在[0,L]之间;根据公式计算邻域灰度,即获取到二维直方图,式中w是以p点为中心的滤波掩膜,进一步地,在步骤2中,所述对二维直方图建立二维高斯混合模型的方法为,图像有m*n个像素,样本rxy(i,j)表示第x行y列像素点的本体灰度和邻域灰度,且样本互相独立,建立每个rxy的二维混合概率密度函数P(rxy;Θ),构造似然函数L(Θ;R),其中,pk(rxy;θk)是rxy第k个二维高斯独立分布的密度函数,θk是其参数向量,θk={μ1k,μ2k,σ1k,σ2k}。ωk是第k簇的混合比例系数,满足ω1+...+ωK=1的条件,K是混合模型的分量数目,Θ是混合模型的参数集,Θ={θ1,θ2,…,θK};设R={r(i,j),i,j=0,1,...,L}是图像二维直方图的二元点集,h(i,j)是二维直方图,这样在EM算法中就可以脱离图像,仅对二维直方图运算,则二维高斯混合模型为,进一步地,在步骤3中,计算混合分量的个数与各个分布的权重,并转换二维高斯混合模型的方法为,计算混合分量的个数K与各个分布的权重ωk,引入隐含类别标签设是为示性函数,取值只有0和1,在给定类属标签后,每个r(i,j)的混合概率密度函数转化为混合权重ωk由类属标签的分布;设r(i,j)属于第k个类属的概率且在已知类属标签的情况下,每个r(i,j)的混合概率密度函数二维高斯混合模型转换为,进一步地,在步骤4中,二维高斯混合模型根据类属标签采用贝叶斯后验概率计算隐含类别的方法为,根据类属标签,采用贝叶斯后验概率计算隐含类别,借用EM算法迭代更新,首先假定二维混合模型的参数已知,且类属的分布概率也已知,然后根据样本观测值,计算已知观测样本的类属分布,观测样本的类属分布就是关于已有参数的后验概率,记做观测样本数值引起变化,模型参数也发生变化,通过求取似然函数极大值,获得新的参数估计子对于二维高斯分布,设两个变量互相独立,那么单个二维高斯分布如公式二维混合高斯模型的似然函数如公式,将二维混合高斯模型的似然函数先求和再进行对数运算。进一步地,在步骤5中,根据Jensen不等式计算二维混合高斯模型的似然函数的方法为,根据Jensen不等式,一个凹函数有f(EX)≥E[f(X)],考虑到log(x)是凹函数,且就是的期望,那么由Jensen不等式,二维混合高斯模型的似然函数转换为,进一步地,在步骤6中,获取所有分布得到类属更新分布的方法为,获取每一个k分布,分开求取偏导数,得到下面的参数更新公式:同时得到类属更新分布φk,进一步地,在步骤7中,重复执行步骤4,直到得到的各值都满足收敛条件为止。本专利技术还提供了一种EM算法二维直方图聚类装置,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:二维直方图获取单元,用于获取图像的二维直方图;高斯混合建模单元,用于对二维直方图建立二维高斯混合模型;模型转换单元,用于计算混合分量的个数与各个分布的权重,并转换二维高斯混合模型;类别计算单元,用于通过二维高斯混合模型根据类属标签采用贝叶斯后验概率计算隐含类别;似然函数计算单元,用于根据Jensen不等式计算二维混合高斯模型的似然函数;类属更新分布获取单元,用于获取所有分布得到类属更新分布;类别迭代计算单元,用于重复调用类别计算单元直到计算出所有类别。本公开的有益效果为:本专利技术提供一种EM算法二维直方图聚类的方法及装置,只要给定混合模型的个数,可以自动收敛得到多阈值分类的结果,随着混合模型个数的增加,聚类的区域分类越来越精细,特征分类越来越明显,在噪声图像和多目标图像中的分类效果很好。附图说明通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:图1所示为一种EM算法二维直方图聚类的方法的流程图;图2所示为一种EM算法二维直方图聚类装置图。具体实施方式以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。如图1所示为根据本公开的一种EM算法二维直方图聚类的方法的流程图,下面结合图1来阐述根据本本文档来自技高网...

【技术保护点】
1.一种EM算法二维直方图聚类的方法,其特征在于,所述方法包括以下步骤:步骤1,获取图像的二维直方图;步骤2,对二维直方图建立二维高斯混合模型;步骤3,计算混合分量的个数与各个分布的权重,并转换二维高斯混合模型;步骤4,二维高斯混合模型根据类属标签采用贝叶斯后验概率计算隐含类别;步骤5,根据Jensen不等式计算二维混合高斯模型的似然函数;步骤6,获取所有分布得到类属更新分布;步骤7,重复执行步骤4直到计算出所有类别。

【技术特征摘要】
1.一种EM算法二维直方图聚类的方法,其特征在于,所述方法包括以下步骤:步骤1,获取图像的二维直方图;步骤2,对二维直方图建立二维高斯混合模型;步骤3,计算混合分量的个数与各个分布的权重,并转换二维高斯混合模型;步骤4,二维高斯混合模型根据类属标签采用贝叶斯后验概率计算隐含类别;步骤5,根据Jensen不等式计算二维混合高斯模型的似然函数;步骤6,获取所有分布得到类属更新分布;步骤7,重复执行步骤4直到计算出所有类别。2.根据权利要求1所述的一种EM算法二维直方图聚类的方法,其特征在于,在步骤1中,所述获取图像的二维直方图的方法为,输入一个的图像,所述图像的图像矩阵为m行n列,根据每个像素本身的灰度值,计算每个像素的邻域平均灰度值,由每个像素本身的灰度值和邻域平均灰度值构成了二维坐标系;设任意像素点p在坐标(x,y)处的灰度值为f(x,y),取p的8-邻域(N8)平均灰度值g(x,y),二者的值域都在[0,L]之间;根据公式计算邻域灰度,即获取到二维直方图,式中w是以p点为中心的滤波掩膜,3.根据权利要求1所述的一种EM算法二维直方图聚类的方法,其特征在于,在步骤2中,所述对二维直方图建立二维高斯混合模型的方法为,图像有m*n个像素,样本rxy(i,j)表示第x行y列像素点的本体灰度和邻域灰度,且样本互相独立,建立每个rxy的二维混合概率密度函数P(rxy;Θ),构造似然函数L(Θ;R),其中,pk(rxy;θk)是rxy第k个二维高斯独立分布的密度函数,θk是其参数向量,θk={μ1k,μ2k,σ1k,σ2k},ωk是第k簇的混合比例系数,满足ω1+...+ωK=1的条件,K是混合模型的分量数目,Θ是混合模型的参数集,Θ={θ1,θ2,…,θK};设R={r(i,j),i,j=0,1,...,L}是图像二维直方图的二元点集,h(i,j)是二维直方图,这样在EM算法中就可以脱离图像,仅对二维直方图运算,则二维高斯混合模型为,4.根据权利要求1所述的一种EM算法二维直方图聚类的方法,其特征在于,在步骤3中,计算混合分量的个数与各个分布的权重,并转换二维高斯混合模型的方法为,计算混合分量的个数K与各个分布的权重ωk,引入隐含类别标签设是为示性函数,取值只有0和1,在给定类属标签后,每个r(i,j)的混合概率密度函数转化为混合权重ωk由类属标签的分布;设r(i,j)...

【专利技术属性】
技术研发人员:郭玲龚兰芳
申请(专利权)人:广东水利电力职业技术学院广东省水利电力技工学校
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1