当前位置: 首页 > 专利查询>南京大学专利>正文

基于聚类学习器集成的数字图像分割方法技术

技术编号:2932268 阅读:164 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于聚类学习器集成的数字图像分割方法,该方法包括以下步骤:将图像转化为像素向量集合;利用像素向量集合训练出多个聚类学习器;将各聚类学习器的聚类结果进行结合以产生粗分割结果;去除粗分割结果中的孤立点;将像素数少的小区域并入其最大邻域;将RGB均值小的区域并入其最近领域;结束。本发明专利技术的显著优点是利用多个聚类学习器提高了数字图像分割的精度,并辅助提高了数字图像处理装置在进行数字图像分割时的性能。

【技术实现步骤摘要】

本专利技术涉及数字图像处理装置,特别涉及一种基于聚类学习器集成技术的数字图像分割方法。
技术介绍
随着数字图像设备例如数码相机等的普及,数字图像已经在各行各业得到了广泛应用。为了有效提取和利用数字图像中包含的信息,需要对图像进行分割。图像分割是指将图像中具有不同语义的区域分割开,这些区域互不相交,每个区域都满足一致性。有效的数字图像分割技术将为进一步的数字图像检索、识别等奠定基础。聚类学习器是经典的机器学习技术,目前基于聚类学习器的数字图像分割技术都只利用了一个聚类学习器,分割效果有待进一步提高。
技术实现思路
本专利技术的目的是提供一种利用多个聚类学习器、提高分割精度的数字图像分割方法,以辅助提高数字图像处理装置在进行数字图像分割时的性能。为实现本专利技术所述目的,本专利技术所述的,包括以下步骤1、将图像转化为像素向量集合;2、利用像素向量集合训练出多个聚类学习器,包括将各聚类学习器使用的聚类标记进行配准;3、将各聚类学习器的聚类结果进行结合以产生粗分割结果;4、去除粗分割结果中的孤立点;5、将像素数少的小区域并入其最大邻域;6、将RGB均值小的区域并入其最近邻域;7、结束。本专利技术与现有技术相比,其显著优点是利用多个聚类学习器提高了数字图像分割的精度,并辅助提高了数字图像处理装置在进行数字图像分割时的性能。四附图说明图1是数字图像处理装置工作流程图。图2是本专利技术方法的流程图。图3是生成聚类学习器集成的流程图。图4是产生粗分割结果的流程图。五具体实施例方式下面结合附图和实施例对本专利技术进行详细说明。如图1所示,数字图像处理装置通过数字图像输入设备获取数字图像,然后进行平滑、去噪等预处理,然后进行图像分割,分割之后的图像可以继续进行检索、识别等处理。本专利技术的方法如图2所示。步骤10是初始动作。步骤11从用户处获得欲分割出的区域数N(N是一个大于1的整数)。步骤12生成聚类学习器集成,该步骤将在后面的部分结合图3进行具体介绍。步骤14利用聚类学习器集成产生粗分割结果,该步骤将在后面的部分结合图4进行具体介绍。粗分割的结果中包含多个区域和若干个孤立的点,步骤16将这些孤立点去除,即将孤立点并入将其包围的区域中。步骤17计算出各区域所包含的像素数,将像素数最少的区域并入其最大邻域,直到剩下2N个区域。步骤18计算出各区域的RGB均值(即图像中红色、绿色、蓝色分量的平均值),找出RGB均值最小的区域,并将该区域并入与其RGB均值最接近的邻域,直到剩下N个区域,此时就得到了分割结果。步骤19是图2的结束状态。图3详细说明了图2中的步骤12,其作用是生成聚类学习器集成。步骤120是初始动作。步骤121从用户处获得要使用的聚类学习器数M(M是一个大于1的整数),这里所使用的聚类学习器可以是任何类型的聚类学习器,只要能执行聚类任务即可,例如可以使用机器学习教科书中介绍的SOM神经网络。步骤122将图像中每个像素表示为一个5维像素向量,这里R、G、B分别代表该像素的红色、绿色、蓝色分量值,x和y分别代表该像素的横坐标和纵坐标。步骤123将控制参数i置为1。步骤124判断i是否不大于M,是则执行步骤125,否则转到步骤128。步骤125随机设置聚类学习器的参数,例如如果使用的是SOM神经网络,则随机设置其学习率和距离阈值。步骤126训练出一个聚类学习器,该聚类学习器将像素向量聚为k个类,这里k可以是任何比图2中的2N大的常整数,为叙述方便,假设这k个类分别为C1(i),C2(i),……,Ck(i),这里Cj(i)表示第i个聚类学习器聚出的第j个类。步骤127将控制变量i加1,然后转到步骤124。由于各聚类学习器是分别训练的,其使用的聚类标记可能是不同的,例如第i个聚类学习器聚出的第l个类可能与第j个聚类学习器聚出的第l个类并不是同一个类,因此需要把各聚类学习器使用的聚类标记进行配准。图3的剩余部分即用于完成此任务。图3的步骤128将控制变量j置为2。步骤129判断j是否不大于M,是则执行步骤130,否则转到步骤138,即图3的结束状态。步骤130将Ω置为由第j个聚类学习器使用的聚类标记C1(j),C2(j),……,Ck(j)组成的集合。步骤131将控制变量l置为1。步骤132判断l是否不大于k,是则执行步骤133,否则执行步骤137,将控制变量j加1后转到步骤129。步骤133找出Ω中与第1个聚类学习器聚出的第l个类,即Cl(1),所包含的相同的像素向量最多的类Cu(j)。步骤134将Cu(j)置为Cl(1)。步骤135从Ω中去掉Cu(j)。步骤136将控制变量l加1后转到步骤132。从步骤132至136的操作实际上是将第j个聚类学习器使用的聚类标记向第1个聚类学习器使用的聚类标记配准。图4详细说明了图2的步骤14,其作用是利用图3生成的聚类学习器集成来产生粗分割结果。步骤140是初始动作。步骤141将控制变量i置为1。步骤142判断i是否不大于图3中的M,即聚类学习器集成中的聚类学习器数,是则执行步骤143,否则转到步骤146。步骤143根据下式计算聚类学习器集成中第i个聚类学习器的平均互信息βi,βi的值越大,意味着第i个聚类学习器所没有被其他聚类学习器所包含的信息量就越少βi=1M-1Σi=1,i≠jMΦNM1(C(i),C(j))]]>其中C(i)和C(j)为两个聚类学习器,其互信息ΦNM1(C(i),C(j))定义为下式ΦNM1(C(i),C(j))=2nΣa=1kΣb=1knablogk2(nabnnanb)]]>其中k为图2的步骤126中聚类学习器将像素向量集合聚为的类别数,n为像素向量数,这些像素向量中有na个属于Ca(i),有nb个属于Cb(j),有nab个既属于Ca(i)又属于Cb(j)。图4的步骤144利用步骤143计算出的平均互信息,根据下式计算聚类学习器集成中第i个聚类学习器的权重wiwi=1βiZ]]>其中Z是规范化因子,使得wi>0(i=1,2,...,M)andΣi=1Mwi=1]]>图4的步骤145将控制变量i加1,转到步骤142。步骤146从像素向量集合中取出一个未处理的像素向量。步骤147为每个类别分别设置一个计数器,这些计数器用来记录有多少个聚类学习器给出的结果是该类别,这里的各类别分别对应了图3中第1个聚类学习器的聚类结果,即C1(1),C2(1),……,Ck(1)。步骤148将所有计数器清零。步骤149将控制变量j置为1。步骤150取得聚类学习器集成中第j个聚类学习器在当前像素向量上的结果,为叙述方便,称该结果为Cx(j)。步骤151将Cx(j)所对应的类别的计数器加wj,即步骤144计算出的第j个聚类学习器的权重。步骤152将控制变量j加1。步骤153判断j是否不大于M,即聚类学习器集成中聚类学习器的个数,是则转到步骤150,否则就执行步骤154。步骤154对所有计数器中的值进行比较,找出值最大的计数器,并将其对应的类别作为当前像素向量的结果类别;如果有多个计数器中的值均为最大值,本文档来自技高网...

【技术保护点】
一种基于聚类学习器集成的数字图像分割方法,包括将数字图像通过数字图像输入设备输入到数字图像处理装置进行预处理,然后进行图像分割处理,其特征在于所述分割处理的方法包括以下步骤:(1)将图像转化为像素向量集合;(2)利用像素向量 集合训练出多个聚类学习器;(3)将各聚类学习器的聚类结果进行结合以产生粗分割结果;(4)去除粗分割结果中的孤立点;(5)将像素数少的小区域并入其最大领域;(6)将图像中红色、绿色、蓝色分量的平均值小的区域并入 其最近领域;(7)结束。

【技术特征摘要】

【专利技术属性】
技术研发人员:姜远周志华
申请(专利权)人:南京大学
类型:发明
国别省市:84[中国|南京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1