一种基于分离度的小样本半监督聚类方法技术

技术编号:35514279 阅读:17 留言:0更新日期:2022-11-09 14:30
本发明专利技术属于计算机仿真与方法优化技术领域,公开了一种基于分离度的小样本半监督聚类方法,包括如下步骤:步骤1:聚类中心计算;步骤2:分离度计算;步骤3:非目标聚类中心确定;步骤4:参数计算;步骤5:类中心迁移;步骤6:迭代计算;步骤7:目标分离。本发明专利技术针对传统无监督聚类和半监督聚类在目标分类、鉴别性能不佳的问题,发明专利技术了一种基于目标分离度的小样本半监督聚类方法,设定目标与非目标的分离度,并基于已知小样本在分离度的基础上进行迭代运算,实现了相似度较高的目标于非目标的精确分离,本发明专利技术采用了新型的算法框架提高了目标分类、鉴别的精确性。鉴别的精确性。鉴别的精确性。

【技术实现步骤摘要】
一种基于分离度的小样本半监督聚类方法


[0001]本专利技术属于计算机仿真与方法优化
,尤其涉及一种基于分离度的小样本半监督聚类方法。

技术介绍

[0002]目标检测和目标分类一直是人们研究的重点问题,当目标先验知识少、信息一致性低和干扰信息严重等问题时,基于学习类的方法并不适用。
[0003]在此种条件下,当目标与非目标纹理、结构等特征相似度较高时,传统的目标分类和目标鉴别方法并不能很好的将目标分离出来,也就造成了目标的检测性能低下等问题。
[0004]在无训练情况下,目标检测通常采用自相似比较方法或无监督/半监督分类算法。
[0005]采用基于欧式空间距离的负指数函数作为相似性度量,对浓密计算尺度不变特征进行判定,实现对汽车、人脸和一般目标的检测。采用矩阵余弦相似度基于单样本在待检测图像中寻找相似性匹配项,实现目标检测。
[0006]聚类算法是无监督学习的典型案例,其目的是把相似的东西聚在一起。常用的聚类算法有基于距离的模糊C均值(Fuzzy c

Means,FCM)聚类算法、证据C均值(Evidential c

Means,ECM)聚类算法、中智模糊(Neutrosophic c

Means,NCM)聚类算法和基于密度的DBSCAN聚类算法等。聚类算法无需训练、技术简单,但SAR图像中存在与目标纹理非常相似的杂波等干扰信息,直接使用聚类算法实现目标的自动分类,性能不高。
[0007]半监督学习主要基于聚类模型和流形模型来建立未知样本、目标和已知样本之间的联系。聚类假设与人的直观认识相符合,因此出现了很多基于聚类假设的分类算法。如TSVM算法通过迭代方法为未标记样本找到合适的分类标记。聚类假设主要关注整体特性,流形假设主要考虑模型的局部特性。如基于核范数的二维局部保持投影(Nuclear Norm

based Two

Dimensional Locality Preserving Projections,NN

2DLPP)方法通过低阶学习恢复噪声数据矩阵去除数据中的噪声,然后将学习到的干净数据点投影到新的子空间上,并在此投影子空间中尽可能地保持同一类数据点之间的距离。
[0008]目前上述大部分方法的研究都是基于无噪声干扰的数据,直接在基于特征的目标分类中使用,目标检测性能较低。

技术实现思路

[0009]本专利技术目的在于提供一种基于分离度的小样本半监督聚类方法,以解决上述的技术问题。
[0010]为解决上述技术问题,本专利技术的一种基于分离度的小样本半监督聚类方法的具体技术方案如下:
[0011]一种基于分离度的小样本半监督聚类方法,包括如下步骤:
[0012]步骤1:聚类中心计算:采用NCM算法进行聚类中心计算;
[0013]步骤2:分离度计算:在NCM聚类计算过程中调整两个类别的聚类中心,增强目标与
非目标的可分离性;
[0014]步骤3:非目标聚类中心确定:根据步骤1初步计算样本聚类中心,并在潜在目标中计算特征与样本聚类中心的分离度,将分离度最大的特征作为初始非目标聚类中心;
[0015]步骤4:参数计算:计算[T,I,F]元组的值,并更新目标与非目标的聚类中心;
[0016]步骤5:类中心迁移:在参数迭代的过程中,将潜在目标聚类中心像样本聚类中心迁移,将远离样本中心的潜在目标作为非目标;
[0017]步骤6:迭代计算:对于步骤3到步骤5进行迭代计算;
[0018]步骤7:目标分离:根据样本中心,确定潜在目标是属于目标集群的确定度,与不属于目标集群的确定都F的比值来最终判定潜在目标是否为目标。进一步地,所述步骤1包括如下具体步骤:
[0019]NCM使用一个元组[T,I,F]来描述成员值,其中T是属于一个集群的对象的确定度,F是不属于集群的对象的确定度,I是一个对象到边界集群的不确定度,NCM算法的目标函数表达式为:
[0020][0021]其中,C={c
j
,j=1,2,

,K}是集群的集合,c
j
是集群j的中心,d
i,Kj
表示从对象x
i
到所考虑的K簇中心的距离,ω
i
是加权系数,δ是检测非目标的给定距离,只选择最近的两个确定性聚类来考虑最大隶属度值,简化为:
[0022][0023]其中,是从对象x
i
到两个簇中心的距离,这两个簇是距离中心最近的和第二近的簇,上式满足:
[0024][0025]对象x
i
的成员元组[T
ij
,I
i
,F
i
]在迭代中更新并使得J
NCM
最小化,当成员值达到收敛时,迭代将中断,
[0026][0027]其中,[T,I,F]三个成员值按如下方式迭代更新:
[0028][0029][0030]进一步地,所述步骤2包括如下具体步骤:
[0031]设目标X与非目标Y的分离度S
xy
,在NCM聚类计算过程中调整两个类别的聚类中心,
增强目标与非目标的可分离性,分离度S
xy
为:
[0032][0033]其中,d
xy
为类X和类Y的类间方差;D(x)和D(y)为类内方差。
[0034]进一步地,所述步骤4包括如下具体步骤:
[0035]计算[T,I,F]元组的值,并更新目标与非目标的聚类中心
[0036][0037][0038]进一步地,所述步骤5包括如下具体步骤:
[0039]在参数迭代的过程中,将潜在目标聚类中心像样本聚类中心迁移,将远离样本中心的潜在目标作为非目标,其中,潜在目标与样本聚类中心的直接的距离通过分离度来计算,在类中心迁移过程中不计算离散点,并将其对应的潜在目标区域认定为非目标。
[0040]进一步地,所述步骤6包括如下具体步骤:
[0041]对于步骤3到步骤5进行迭代计算,当[T,I,F]满足下式要求式,判定达到达到收敛点,迭代停止,
[0042][0043]进一步地,所述步骤6在迭代过程中,引入一个新的变量f
dp
作为离散点判断的基础,并迭代过程中计算出消除离散点后新对象集的聚类中心,此时,目标函数表达式和约束条件可以表示为:
[0044][0045][0046]本专利技术的一种基于分离度的小样本半监督聚类方法具有以下优点:本专利技术针对传统无监督聚类和半监督聚类在目标分类、鉴别性能不佳的问题,专利技术了一种基于目标分离度的小样本半监督聚类方法,设定目标与非目标的分离度,并基于已知小样本在分离度的基础上进行迭代运算,实现了相似度较高的目标于非目标的精确分离,本专利技术采用了新型的算法框架提高了目标分类、鉴别的精确性。
附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分离度的小样本半监督聚类方法,其特征在于,包括如下步骤:步骤1:聚类中心计算:采用NCM算法进行聚类中心计算;步骤2:分离度计算:在NCM聚类计算过程中调整两个类别的聚类中心,增强目标与非目标的可分离性;步骤3:非目标聚类中心确定:根据步骤1初步计算样本聚类中心,并在潜在目标中计算特征与样本聚类中心的分离度,将分离度最大的特征作为初始非目标聚类中心;步骤4:参数计算:计算[T,I,F]元组的值,并更新目标与非目标的聚类中心;步骤5:类中心迁移:在参数迭代的过程中,将潜在目标聚类中心像样本聚类中心迁移,将远离样本中心的潜在目标作为非目标;步骤6:迭代计算:对于步骤3到步骤5进行迭代计算;步骤7:目标分离:根据样本中心,确定潜在目标是属于目标集群的确定度,与不属于目标集群的确定都F的比值来最终判定潜在目标是否为目标。2.根据权利要求1所述的基于分离度的小样本半监督聚类方法,其特征在于,所述步骤1包括如下具体步骤:NCM使用一个元组[T,I,F]来描述成员值,其中T是属于一个集群的对象的确定度,F是不属于集群的对象的确定度,I是一个对象到边界集群的不确定度,NCM算法的目标函数表达式为:其中,C={c
j
,j=1,2,

,K}是集群的集合,c
j
是集群j的中心,d
i,Kj
表示从对象x
i
到所考虑的K簇中心的距离,ω
i
是加权系数,δ是检测非目标的给定距离,只选择最近的两个确定性聚类来考虑最大隶属度值,简化为:其中,是从对象x
i
到两个簇中心的距离,这两个簇是距离中心最近的和第二近的簇,上式满足:对象x
i
的成员元组[T
ij
,I
i<...

【专利技术属性】
技术研发人员:孙建国黄晏瑜胡瑞敏曾丽娜
申请(专利权)人:西安电子科技大学杭州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1