当前位置: 首页 > 专利查询>东南大学专利>正文

一种利用偏标记信息增强的聚类方法技术

技术编号:45548424 阅读:20 留言:0更新日期:2025-06-17 18:21
本发明专利技术公开了一种利用偏标记信息增强的聚类方法,利用有限的偏标记信息来提高聚类性能。首先基于样本在特征空间中的相似关系构造一个样本权重矩阵,并消除候选标签的歧义,从而基于权重矩阵估计其真实标签。然后,基于消歧结果构造了一组必须链接和不能链接的约束。此外,基于对抗性先验的对偶图方法传播了初始的必须链接和不能链接约束。最后,将权值矩阵的构造、标签消歧和约束传播集成到一个联合模型中,以实现相互增强。在合成数据集和真实数据集上的综合实验表明,本发明专利技术方法与最先进的约束聚类方法相比具有优越的性能,并且在有限样本标签信息时优于偏标记学习和半监督偏标记学习方法。

【技术实现步骤摘要】

本专利技术属于偏标记学习方法与聚类方法交叉,可以应用于图像分类、自然语言处理、人脸识别等领域,具体涉及一种利用偏标记信息增强的聚类方法


技术介绍

1、偏标记学习(pll)是一个流行的弱监督学习框架,其中每个训练样本对应一组候选标签,但只有一个是真实标签。这种弱监督形式出现在许多应用中,例如,网络挖掘,多媒体内容分析、自然语言处理。偏标记学习可以用于这些具有大量模糊标签的实际应用中,这避免了手动标记每个样本真实标签的巨大资源和时间成本。

2、偏标记学习主要的研究内容是基于可用的弱监督信息学习一个多类分类器。设表示d维特征空间,表示标签空间,对于每个变量其候选标记集合为组成了偏标记训练集偏标记学习的目标是从中学习出一个多类分类器以预测未标记变量的真实标记。

3、现有的偏标记学习方法在许多应用取得了良好效果,但仍存在一些缺点:

4、1、偏标记学习方法的核心是标签消歧,即选择更有可能成为真实标记的候选标记。然而,现有的标签消歧方法无法做到完全消除歧义,在消歧的过程中可能会引入噪声,将错误的标记作为概率最大的真实标记,导致模型的本文档来自技高网...

【技术保护点】

1.一种利用偏标记信息增强的聚类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种利用偏标记信息增强的聚类方法,其特征在于,步骤1具体如下:

3.根据权利要求2所述的一种利用偏标记信息增强的聚类方法,其特征在于,步骤2具体如下:

4.根据权利要求3所述的一种利用偏标记信息增强的聚类方法,其特征在于,步骤3具体如下:

5.根据权利要求4所述的一种利用偏标记信息增强的聚类方法,其特征在于,步骤4具体如下:

【技术特征摘要】

1.一种利用偏标记信息增强的聚类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种利用偏标记信息增强的聚类方法,其特征在于,步骤1具体如下:

3.根据权利要求2所述的一种利用偏标记信息增强的聚类方...

【专利技术属性】
技术研发人员:贾育衡谢宇通
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1