【技术实现步骤摘要】
本专利技术涉及机器学习,特别是一种基于证据理论的含噪偏标记学习方法。
技术介绍
1、在过去十年,机器学习取得了显著的发展,在自动驾驶、自然语言处理、推荐系统、医疗健康以及金融交易等多个领域得到了广泛应用。其中,在监督学习中,通常假设每个样本都具备明确且单一的语义信息,即每个样本都对应唯一的正确标记。然而,获取这种大规模且高质量的数据集通常是费时且昂贵的。因此,研究人员有时会选择更为经济的替代方案,如众包和半自动化标注平台。但这种标注方式可能会导致数据的标注是偏标记的形式,为此研究人员提出了偏标记的学习框架。
2、在偏标记学习中,通常假设每个样本的候选集中包含且仅包含一个真实标记和其它噪声标记,然而在实际场景中,存在候选集缺少真实标记的情形,即含噪的偏标记,以往偏标记学习算法只能去除候选集中的噪声标记,无法有效的去除这类噪声样本。一般情况下,可以采用小损失策略来去除噪声样本,但是这类方法通常受到模型过度自信的干扰,导致噪声样本选择错误。因此,如何为含噪的偏标记数据集设计更加鲁棒的偏标记学习算法,仍是实际偏标记学习场景中的一项空
【技术保护点】
1.一种基于证据理论的含噪偏标记学习方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法,其特征在于,步骤(1)所述的使用带权重的交叉熵损失函数更新一个多分类神经网络模型M具体为:
3.根据权利要求2所述的一种基于证据理论的含噪偏标记学习方法,其特征在于,所述多分类网络模型为ResNet或PreResNet。
4.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法,其特征在于,步骤(2)所述的每个样本的不确定性的计算公式为:
5.根据权利要求1所述的一种基于证据理论的含噪偏
...【技术特征摘要】
1.一种基于证据理论的含噪偏标记学习方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法,其特征在于,步骤(1)所述的使用带权重的交叉熵损失函数更新一个多分类神经网络模型m具体为:
3.根据权利要求2所述的一种基于证据理论的含噪偏标记学习方法,其特征在于,所述多分类网络模型为resnet或preresnet。
4.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法,其特征在于,步骤(2)所述的每个样本的不确定性的计算公式为:
5.根据权利要求1所述的一种基于证据理论的含噪偏标记学习方法,其特征在于,步骤(3)具...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。