一种基于实例相关性消除噪声标记的偏多标记学习方法技术

技术编号:40600898 阅读:31 留言:0更新日期:2024-03-12 22:05
本发明专利技术公开了一种基于实例相关性消除噪声标记的偏多标记学习方法,首先,分解给定实例的候选标记矩阵为真实标记矩阵和噪声标记矩阵的加和,通过两个小矩阵的乘积来近似真实标记矩阵,并引入L<subgt;1</subgt;范数正则化来约束噪声标记矩阵;利用核函数将实例的特征向量映射到高维空间,同时捕获实例间的线性和非线性相关性;构建目标函数并通过交替优化实现偏多标记学习;最后,通过从特征空间到标记空间的线性映射来预测新的未见实例的相关标记。本发明专利技术将噪声标记消除和实际相关标记预测整合为一个联合优化问题,同时考虑实例之间的线性和非线性相关性加强噪声标记的消除效果,进而提升了偏多标记学习的性能。

【技术实现步骤摘要】

本专利技术涉及消除噪声标记方法,尤其涉及一种基于实例相关性消除噪声标记的偏多标记学习方法


技术介绍

1、在实际应用场景中,每个实例有多个标记注释,例如,一段音乐包含多种情感,一张图片包含多种实物。多标记学习(multi-label learning,下文简写mll)一般假设训练实例都被准确标注了相关标记,进而基于此学习模型以预测未见过实例的所有相关标记。然而,实例质量不稳定或标注方法不可靠的问题导致每个训练实例包含一些不相关的标记或噪声标记(下文统称为噪声标记)。为此,偏多标记学习(partial multi-label learning,下文简写pml)基于多标记学习中的部分标记数据学习模型,以期更加适用于只有部分标记有效的复杂场景。

2、根据是否同时优化候选标记和学习模型,已有偏多标记学习方法分为两类:第一类方法首先从实例的候选标记中识别真实标记,然后基于真实标记构建多标记学习模型。mlknn方法和lift方法直接考虑所有候选标记,首先识别k个最相近实例或构造每个标记的类属特征,然后利用最大后验假设或归纳一组分类器确定真实标记。parvl本文档来自技高网...

【技术保护点】

1.一种基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:步骤(1)中,真实标记矩P阵低秩,通过两个矩阵的乘积来近似,即其中,

3.根据权利要求1所述的基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:步骤(1)中,真实标记矩阵P和噪声标记矩阵Q中的元素≥0,对三个矩阵U,V,Q施加非负约束。

4.根据权利要求1所述的基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:步骤(2)中,基于学习到的亲和矩阵Z,定义正则化项,利用实例线性和...

【技术特征摘要】

1.一种基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:步骤(1)中,真实标记矩p阵低秩,通过两个矩阵的乘积来近似,即其中,

3.根据权利要求1所述的基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:步骤(1)中,真实标记矩阵p和噪声标记矩阵q中的元素≥0,对三个矩阵u,v,q施加非负约束。

4.根据权利要求1所述的基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:步骤(2)中,基于学习到的亲和矩阵z,定义正则化项,利用实例线性和非线性相关性进消除噪声标记,如公式(6)所示:

5.根据权利要求1所述的基于实例相关性消除噪声标记的偏多标记学习方法,其特征在于:步骤(2)中,通过核函数映射原始非线性关系到高维的空间来进行线性相关,令表示将数据从输入空间映射...

【专利技术属性】
技术研发人员:高光亮高谷刚马如坡洪磊印杰
申请(专利权)人:江苏警官学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1