【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种偏标记特征选择方法及系统。
技术介绍
1、偏标记学习(pll)作为弱监督学习的重要范式,其主要任务是基于训练示例学习得到一个多类分类器,其中每个示例与一组候选标记相关联。与传统的多标记学习不同,偏标记场景下候选标记集合同时包含真实标记和歧义性标记,且只有一个真实标记。这种不精确的监督信息显著降低了数据标注的成本,使其成功应用于自然语言处理、多媒体内容分析和生态信息学等实际领域。
2、现有的偏标记特征选择方法多基于预设的静态粒度划分策略,未充分考虑数据内在的层次化结构特性,这直接影响了可辨识特征的识别,且现有方法量化特征判别力的依赖度度量通常采用单一模态分析,由于假阳性标记会扭曲单模态依赖度的可靠性,导致无法实现鲁棒的特征重要性评估,从而影响模型的性能。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种偏标记特征选择方法及系统。
2、第一方面,本申请实施例提供了一种偏标记特征选择方法,包括以下步骤:
3、获取偏标
...【技术保护点】
1.一种偏标记特征选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述初始置信度的获取公式为:
3.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取所述候选特征的更新置信度的步骤具体为:
4.根据权利要求3所述的偏标记特征选择方法,其特征在于,所述基于所述欧式距离自若干个所述待定特征中选取若干个判别单元的步骤具体为:
5.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取与所述候选特征矩阵对应的候选聚类中心的步骤包括:
6.根据权利要求1所述
...【技术特征摘要】
1.一种偏标记特征选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述初始置信度的获取公式为:
3.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取所述候选特征的更新置信度的步骤具体为:
4.根据权利要求3所述的偏标记特征选择方法,其特征在于,所述基于所述欧式距离自若干个所述待定特征中选取若干个判别单元的步骤具体为:
5.根据权利要求1所述的偏标记特征选择方法,其特征在于,所述获取与所述候选特征矩阵对应的候选聚类中心的步骤包括:
6.根据权利要求1所述的偏标记特征选择方法...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。