一种基于证据理论的含噪偏标记学习方法技术

技术编号：41324389 阅读：15 留言：0更新日期：2024-05-13 15:02

本发明专利技术面向偏标记学习领域公开了一种基于证据理论的含噪偏标记学习方法，该方法能够有效地处理现实场景中偏标记数据含噪的问题。首先，本发明专利技术采用证据深度学习技术，计算每个偏标记样本的不确定性和置信度，从而在数据集中识别出噪声样本。接着，本发明专利技术使用高斯混合模型，将不含噪样本分为消歧样本和未消歧样本。最后，本发明专利技术对划分后的数据集采用极大似然方法进行优化。本发明专利技术不仅有效地解决了偏标记学习中噪声数据对模型训练的负面影响，而且能够显著提升模型在复杂场景下的鲁棒性和分类准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习，特别是一种基于证据理论的含噪偏标记学习方法。

技术介绍

1、在过去十年，机器学习取得了显著的发展，在自动驾驶、自然语言处理、推荐系统、医疗健康以及金融交易等多个领域得到了广泛应用。其中，在监督学习中，通常假设每个样本都具备明确且单一的语义信息，即每个样本都对应唯一的正确标记。然而，获取这种大规模且高质量的数据集通常是费时且昂贵的。因此，研究人员有时会选择更为经济的替代方案，如众包和半自动化标注平台。但这种标注方式可能会导致数据的标注是偏标记的形式，为此研究人员提出了偏标记的学习框架。

2、在偏标记学习中，通常假设每个样本的候选集中包含且仅包含一个真实标记和其它噪声标记，然而在实际场景中，存在候选集缺少真实标记的情形，即含噪的偏标记，以往偏标记学习算法只能去除候选集中的噪声标记，无法有效的去除这类噪声样本。一般情况下，可以采用小损失策略来去除噪声样本，但是这类方法通常受到模型过度自信的干扰，导致噪声样本选择错误。因此，如何为含噪的偏标记数据集设计更加鲁棒的偏标记学习算法，仍是实际偏标记学习场景中的一项空白。

...

【技术保护点】

1.一种基于证据理论的含噪偏标记学习方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法，其特征在于，步骤(1)所述的使用带权重的交叉熵损失函数更新一个多分类神经网络模型M具体为：

3.根据权利要求2所述的一种基于证据理论的含噪偏标记学习方法，其特征在于，所述多分类网络模型为ResNet或PreResNet。

4.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法，其特征在于，步骤(2)所述的每个样本的不确定性的计算公式为：

5.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法，其特征...

【技术特征摘要】

1.一种基于证据理论的含噪偏标记学习方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法，其特征在于，步骤(1)所述的使用带权重的交叉熵损失函数更新一个多分类神经网络模型m具体为：

3.根据权利要求2所述的一种基于证据理论的含噪偏标记学习方法，其特征在于，所述多分类网络模型为resnet或preresnet。

4.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法，其特征在于，步骤(2)所述的每个样本的不确定性的计算公式为：

5.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法，其特征在于，步骤(3)具...

【专利技术属性】
技术研发人员：黄圣君，郭洪涛，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人