【技术实现步骤摘要】
一种标签噪声下基于不确定性评估的结果预测方法
[0001]本专利技术涉及机器学习
,尤其涉及的是一种标签噪声下基于不确定性评估的结果预测方法。
技术介绍
[0002]在机器学习领域,用于训练模型的数据通常被称为Id
‑
distribution(ID)数据,和训练的ID数据分布不一致的数据被称为Out
‑
of
‑
distribution(OOD)数据。在真实应用场景中,训练数据是有限的,不可能包含所有可能场景,因此OOD数据会出现在实际应用场景中。例如马路上的大象、侧翻的卡车通常不会出现在训练的ID数据中,但在真实场景中是有可能出现的。
[0003]近些年以深层神经网络为代表的深度学习已经取得了卓越的成就,在许多领域有广泛的应用。在图片分类、语音识别等任务中,当输入数据是和训练的ID数据独立同分布时,神经网络能够取得卓越的效果,但它们往往无法识别这些预测何时可能是错误的。更严重的是在OOD数据存在的情况下,神经网络模型的预测结果是不可信的。神经网络模型无法为O ...
【技术保护点】
【技术特征摘要】
1.一种标签噪声下基于不确定性评估的结果预测方法,其特征在于,所述方法包括:获取真实场景数据;其中,所述真实场景数据中的部分数据与训练数据分布相异;将真实场景数据输入至已训练的深度神经网络模型和函数模型,得到第一不确定性预测值和初始预测结果,其中,所述深度神经网络模型基于若干次迭代训练得到,每次迭代训练过程中,对训练数据添加权重,并根据权重对训练数据进行筛选;根据所述第一不确定性预测值和所述初始预测结果,得到目标预测结果。2.根据权利要求1所述的标签噪声下基于不确定性评估的结果预测方法,其特征在于,所述深度神经网络模型的训练过程包括:获取包含标签噪声的初始训练数据集;其中,所述标签噪声为对训练数据标注错误标签导致的噪声;将所述初始训练数据集输入至初始深度神经网络模型和所述函数模型,得到与所述初始训练数据集对应的第二不确定性预测值集,根据所述第二不确定性预测值集,得到与所述初始训练数据集对应的权重集,根据所述权重集和所述初始训练数据集,得到中间训练数据集,将所述中间训练数据集作为初始训练数据集,并重复执行将所述初始训练数据集输入至初始深度神经网络模型和所述函数模型的步骤;当所述初始深度神经网络模型满足预设训练条件时,停止迭代训练,得到训练好的深度神经网络模型。3.根据权利要求2所述的标签噪声下基于不确定性评估的结果预测方法,其特征在于,所述将所述初始训练数据集输入至初始深度神经网络模型和所述函数模型,得到与所述初始训练数据集对应的第二不确定性预测值集,根据所述第二不确定性预测值集,得到与所述初始训练数据集对应的权重集,根据所述权重集和所述初始训练数据集,得到中间训练数据集,将所述中间训练数据集作为初始训练数据集,并重复执行将所述初始训练数据集输入至初始深度神经网络模型和所述函数模型的步骤包括:针对第t次迭代训练,获取所述第t次迭代训练中与所述初始训练数据集对应的损失函数值集和所述第t次迭代训练中与所述初始训练数据集对应的第二不确定性预测值集,根据所述损失函数值集和所述第二不确定性预测值集,得到所述第t次迭代训练中与所述初始训练数据集对应的训练数据权重集,基于所述训练数据权重集,对所述第t次迭代训练中的所述初始训练数据集进行加权,得到中间训练数据集;其中,所述训练数据权重集用于表征训练数据在初始深度神经网络模型中的重要程度;其中,所述t大于或者等于1;将所述中间训练数据集输入至初始深度神经网络模型和所述函数模型,进行第t+1次迭代训练。4.根据权利要求3所述的标签噪声下基于不确定性评估的结果预测方法,其特征在于,所述初始训练数据集包括若干初始训练数据;所述获取所述第t次迭代训练中与所述初始训练数据集对应的损失函数值集和所述第t次迭代训练中与所述初始训练数据集对应的第二不确定性预测值集,根据所述损失函数值集和所述第二不确定性预测值集,得到所述第t次迭代训练中与所述初始训练数据集对应的训练数据权重集包括:针对每个...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。