一种偏标记特征选择方法及系统技术方案

技术编号:45601022 阅读:15 留言:0更新日期:2025-06-20 22:22
本发明专利技术提供一种偏标记特征选择方法及系统,方法包括:获取若干个候选特征,及与其对应的若干个邻近标签及干个标记标签,以获取与候选特征对应的初始置信度;获取候选特征的更新置信度,进而获取最终置信度;获取与候选特征对应的候选特征矩阵,获取候选聚类中心及总聚类中心,进而获取与候选特征的紧密度,通过紧密度自若干个候选特征中选定若干个阶段特征,获取阶段特征的悲观依赖度及乐观依赖度,基于最终置信度、悲观依赖度及乐观依赖度获取阶段特征的重要性评估值,以获取最优特征。通过上述方式提高了识别可辨识特征的能力,克服了假阳性标记对单模态依赖度的干扰,显著提升特征重要性评估的鲁棒性。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种偏标记特征选择方法及系统


技术介绍

1、偏标记学习(pll)作为弱监督学习的重要范式,其主要任务是基于训练示例学习得到一个多类分类器,其中每个示例与一组候选标记相关联。与传统的多标记学习不同,偏标记场景下候选标记集合同时包含真实标记和歧义性标记,且只有一个真实标记。这种不精确的监督信息显著降低了数据标注的成本,使其成功应用于自然语言处理、多媒体内容分析和生态信息学等实际领域。

2、现有的偏标记特征选择方法多基于预设的静态粒度划分策略,未充分考虑数据内在的层次化结构特性,这直接影响了可辨识特征的识别,且现有方法量化特征判别力的依赖度度量通常采用单一模态分析,由于假阳性标记会扭曲单模态依赖度的可靠性,导致无法实现鲁棒的特征重要性评估,从而影响模型的性能。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种偏标记特征选择方法及系统。

2、第一方面,本申请实施例提供了一种偏标记特征选择方法,包括以下步骤:

3、获取偏标记数据集,所述偏标记本文档来自技高网...

【技术保护点】

1.一种偏标记特征选择方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述初始置信度的获取公式为:

3.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取所述候选特征的更新置信度的步骤具体为:

4.根据权利要求3所述的偏标记特征选择方法,其特征在于,所述基于所述欧式距离自若干个所述待定特征中选取若干个判别单元的步骤具体为:

5.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取与所述候选特征矩阵对应的候选聚类中心的步骤包括:

6.根据权利要求1所述的偏标记特征选择方法...

【技术特征摘要】

1.一种偏标记特征选择方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述初始置信度的获取公式为:

3.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取所述候选特征的更新置信度的步骤具体为:

4.根据权利要求3所述的偏标记特征选择方法,其特征在于,所述基于所述欧式距离自若干个所述待定特征中选取若干个判别单元的步骤具体为:

5.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取与所述候选特征矩阵对应的候选聚类中心的步骤包括:

6.根据权利要求1所述的偏标记特征选择方法...

【专利技术属性】
技术研发人员:钱文彬丁姣舒文豪
申请(专利权)人:江西农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1