基于融合万有引力的自然邻搜索的图像聚类方法及系统技术方案

技术编号:38581081 阅读:10 留言:0更新日期:2023-08-26 23:26
本发明专利技术提供了基于融合万有引力的自然邻搜索的图像聚类方法及系统,方法包括:获取待聚类的图像数据集;根据所述图像数据集,计算所述图像数据集中各图像数据之间的距离;基于所述各图像数据之间的距离,计算所述图像数据集中各图像数据之间的引力;根据所述各图像数据之间的引力,基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表;基于各图像数据的邻居列表,确定邻居关系,并根据所述邻居关系,把互为邻居的图像数据聚类为同一个簇,得到图像聚类结果。本发明专利技术基于融合万有引力的自然邻搜索的图像聚类方法,从而从根源上解决了现有的图像聚类方法准确率低的问题。了现有的图像聚类方法准确率低的问题。了现有的图像聚类方法准确率低的问题。

【技术实现步骤摘要】
基于融合万有引力的自然邻搜索的图像聚类方法及系统


[0001]本专利技术属于图像处理
,具体涉及一种基于融合万有引力的自然邻搜索的图像聚类方法及系统。

技术介绍

[0002]在科学研究中,图像处理是一个非常热门的研究领域。图像聚类是将相同或相似的图像划分到同一簇中,不同的图像划分到不同簇中。通过对图像进行聚类,可实现图像数据的自动分类。
[0003]目前,常见的图像聚类方法包括:基于K最近邻算法(KNN)的图像聚类方法、基于自然邻居的图像聚类方法等。
[0004]然而,现有的基于KNN图像聚类方法中,关键参数(k值)取值的不同会得到完全不同的图像聚类结果;虽然现阶段已经提出了许多基于KNN的优化图像聚类方法,无论哪种优化方式,这些参数的确定都要依赖于研究人员的经验知识和大量的实验。另外,现有的基于自然邻居的图像聚类方法虽然解决了传统邻居算法的参数选择难题,但仍然使用传统的距离度量方式作为邻居判断标准,它们在邻居搜索的过程中不能很好的体现图像数据集的整体结构;对噪声点十分敏感,对距离较近的簇边缘点的处理能力也不高,导致图像聚类准确性较低。综上,目前现有的图像聚类方法准确性均较低。
[0005]因此,如何提高图像聚类准确性,是本领域亟待解决的问题。

技术实现思路

[0006]本专利技术的目的是针对现有技术的缺陷,提供一种基于融合万有引力的自然邻搜索的图像聚类方法及系统。本专利技术基于融合万有引力的自然邻搜索的图像聚类方法,利用万有引力定律,结合图像数据集的自然结构,选择适当的质量权重计算方式,计算图像数据间的万有引力,通过万有引力来代替传统的距离衡量方式,重新定义图像数据的自然邻居,基于邻居列表,得到图像聚类结果,解决了现有的基于最近邻的图像聚类方法中对参数依赖和基于自然邻的图像聚类方法中对噪声点敏感及对簇边缘的点处理性能不足导致的图像聚类准确性低问题。
[0007]为了实现以上目的,本专利技术采用以下技术方案:
[0008]本文提出一种基于融合万有引力的自然邻搜索的图像聚类方法,其特征在于,包括步骤:
[0009]S1、获取待聚类的图像数据集;
[0010]S2、根据所述图像数据集,计算所述图像数据集中各图像数据之间的距离dist(x,y);具体包括:
[0011]S21、计算两幅图像之间的相似度SSIM(x,y);
[0012]由如下公式计算X、Y两幅图像之间的相似度,记为SSIM(x,y)
[0013][0014]其中u
x
和u
y
表示两幅图像灰度的平均值,σ
x
和σ
y
表示两幅图像的标准差,σ
xy
表示两幅图像的协方差;C1和C2为常数,以避免分母等于零,C1和C2的值取决于u和σ;如果分母接近于零,则任意选择C1和C2的值以增加SSIM值的稳定性;上式表示两幅图像之间的结构相似性;SSIM值越大,表示两幅图像越相似;
[0015]S22、计算两幅图像之间的距离dist(x,y);
[0016]两幅图像之间的距离记为dist(x,y),计算如下公式:
[0017]dust(x,y)=1

SSIM(x,y);
[0018]S3、基于所述各图像数据之间的距离dist(x,y),计算所述图像数据集中各图像数据之间的引力;
[0019]S31、根据自然最近邻居算法构造出饱和邻域图;
[0020]S32、根据所述饱和邻域图分析每个图像数据与其他图像数据之间的结构相似度来计算质量权重,计算方式如下:
[0021][0022]其中,质量权重M
xy
为图像x的质量m
x
与图像y的质量m
y
的乘积,σ(x,y)表示样图像x与图像y之间的结构相似度,定义为图像节点x和y共享的结构数量与它们各自节点结构数乘积的开方的商;Γ(x)表示图像x的节点结构,指图像节点x及其相连节点的集合,Γ(y)表示图像y的节点结构,指图像节点y及其相连节点的集合;
[0023]S33、计算图像x和图像y之间的万有引力;具体计算公式如下:
[0024][0025]其中,G为万有引力常数,取值为1;m
y
为图像y的质量,m
x
为图像x的质量,R为图像y与x之间的距离,其中R=dist(x,y);
[0026]S4、根据所述各图像数据之间的引力,基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表;
[0027]S41、对于每一个图像数据,在其他所有图像数据中找到对它引力最大那个图像数据,并将其加入该图像数据的邻居列表中;
[0028]S42、每一轮循环中,在未归入该图像的邻居列表以外的其他所有图像中搜索一个对它引力最大的图像数据加入该图像数据的邻居列表中,直至当所有图像数据都至少有一个其他图像数据把它当作邻居时,整个图像数据集就达到一种引力稳定状态,邻居搜索过程结束;
[0029]S5、基于所述各图像数据的邻居列表,确定邻居关系,并根据所述邻居关系,把互为邻居的图像聚类为同一个簇,得到图像聚类结果。
[0030]进一步地,SSIM的值为[0,1]。
[0031]本文提出一种基于融合万有引力的自然邻搜索的图像聚类系统,其特征在于,所
述图像聚类系统执行上述的基于融合万有引力的自然邻搜索的图像聚类方法,包括:图像数据集获取模块、图像间距离计算模块、图像间引力计算模块、图像邻居列表构造模块、图像聚类结果生成模块;
[0032]所述图像数据集获取模块,用于获取待聚类的图像数据集;
[0033]所述图像间距离计算模块,用于根据所述图像数据集,计算所述图像数据集中各图像数据之间的距离;
[0034]所述图像间引力计算模块,用于基于所述各图像数据之间的距离,计算所述图像数据集中各图像数据之间的引力;
[0035]所述图像邻居列表构造模块,根据所述各图像数据之间的引力,基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表;
[0036]图像聚类结果生成模块,基于各图像数据的邻居列表,确定邻居关系,并根据所述邻居关系,把互为邻居的图像聚类为同一个簇,得到图像聚类结果。
[0037]本专利技术还提出一种计算机设备,所述设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0038]与现有技术相比,具有如下有益效果:
[0039]本专利技术的基于融合万有引力的自然邻搜索的图像聚类方法,利用了自然最近邻居无参特性,以及利用万有引力定律,结合图像数据集的自然结构,选择适当的质量权重计算方式,计算图像数据间的万有引力,通过万有引力代替传统的距离衡量方式,重新定义图像数据的自然邻居,基于邻居列表,得到图像聚类结果,提升了图像聚类的准确性。
附图说明
[0040]为了更清楚地说明本专利技术实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于融合万有引力的自然邻搜索的图像聚类方法,其特征在于,包括步骤:S1、获取待聚类的图像数据集;S2、根据所述图像数据集,计算所述图像数据集中各图像数据之间的距离dist(x,y);具体包括:S21、计算两幅图像之间的相似度SSIM(x,y);由如下公式计算X、Y两幅图像之间的相似度,记为SSIM(x,y)其中u
x
和u
y
表示两幅图像灰度的平均值,σ
x
和σ
y
表示两幅图像的标准差,σ
xy
表示两幅图像的协方差;C1和C2为常数,以避免分母等于零,C1和C2的值取决于u和σ;如果分母接近于零,则任意选择C1和C2的值以增加SSIM值的稳定性;上式表示两幅图像之间的结构相似性;SSIM值越大,表示两幅图像越相似;S22、计算两幅图像之间的距离dist(x,y);两幅图像之间的距离记为dist(x,y),计算如下公式:dist(x,y)=1

SSIM(x,y);S3、基于所述各图像数据之间的距离dist(x,y),计算所述图像数据集中各图像数据之间的引力;S31、根据自然最近邻居算法构造出饱和邻域图;S32、根据所述饱和邻域图分析每个图像数据与其他图像数据之间的结构相似度来计算质量权重,计算方式如下:其中,质量权重M
xy
为图像x的质量m
x
与图像y的质量m
y
的乘积,σ(x,y)表示样图像x与图像y之间的结构相似度,定义为图像节点x和y共享的结构数量与它们各自节点结构数乘积的开方的商;Γ(x)表示图像x的节点结构,指图像节点x及其相连节点的集合,Γ(y)表示图像y的节点结构,指图像节点y及其相连节点的集合;S33、计算图像x和图像y之间的万有引力;具体计算公式如下:其中,G为万有引力常数,取值为1;m
y

【专利技术属性】
技术研发人员:杨力军杨俊涛王文彤唐东明刘韬
申请(专利权)人:西南民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1