一种对象处理方法及装置制造方法及图纸

技术编号:35117808 阅读:17 留言:0更新日期:2022-10-05 09:45
本申请涉及人工智能领域,公开了一种对象处理方法及装置。所述方法包括:将待处理对象输入至对象处理网络,经所述对象处理网络输出所述待处理对象的处理结果;其中,所述对象处理网络利用含噪声样本集合训练得到,所述含噪声样本集合包括至少一个标签有误的噪声样本,所述训练包括:获取所述含噪声样本集合中目标样本的推断标签;根据所述推断标签,修正所述目标样本的标签;利用修正标签后的所述目标样本监督训练初始对象处理网络,得到所述对象处理网络。理网络。理网络。

【技术实现步骤摘要】
一种对象处理方法及装置


[0001]本申请涉及人工智能
,尤其涉及一种对象处理方法及装置。

技术介绍

[0002]人工智能的发展离不开机器学习模型,而机器学习模型的训练依赖于样本数据的质量。在有监督学习中,样本数据中标注有标签信息,标签信息越准确,样本数据的质量越高。利用专家经验标注高质量的标签信息需要耗费较多的人力成本。为了降低成本,可以利用数据收集平台(如Amazon Mechanical Turk)或者网络爬虫等方式获取大量低成本的样本数据,这些样本数据中往往还有大量的噪声样本,噪声样本即包括错误的标签信息。
[0003]相关技术中,一些机器学习算法(如深度神经网络(DNN))拥有较强的非线性特征表征能力,可以学习样本数据集中的干净样本(即标签正确的样本)。具体来说,可以根据机器学习模型的损失函数分布,例如基于small

loss准则,筛选出样本数据中的噪声样本(即标签有误的样本),并增大干净样本对模型训练的影响,降低或者消除噪声样本的影响。但是,基于损失函数分布的样本筛选方式需要基于干净样本和噪声样本的损失函数分布不同的原则,如呈现双峰分布。在实际筛选过程中,尤其在训练开始阶段,干净样本和噪声样本的损失值都较大,导致都不能很好地拟合上述如双峰分布等损失函数分布。如果按照上述方式进行样本筛选,可能导致大量样本被误判,如干净样本被误判为噪声样本,噪声样本有可能被误判为干净样本,影响到机器学习模型的性能。
[0004]因此,相关技术中亟需一种提升利用含噪声样本集训练机器学习模型的性能。

技术实现思路

[0005]本申请提供了一种对象处理方法,解决了相关技术中检测准确度不高的问题。本申请还提供了对应的装置、设备、计算机可读存储介质以及计算机程序产品。
[0006]第一方面,本申请的实施例提供了一种对象处理方法,该方法可以获取到所述含噪声样本集合中各个样本对应的真实标签,并利用所述真实标签修正各个样本的标签。基于上述的标签推断和修正机制,可以识别出含噪声样本集合中的噪声样本并改善所有样本的标签,提高利用含噪声样本集合训练所述对象处理网络的训练质量,提升所述对象处理网络的处理性能。另一方面,本申请实施例对于所述含噪声样本集合不做限制,使得利用含噪声样本集合训练网络的方式具有较强的泛化能力。
[0007]具体地,将待处理对象输入至对象处理网络,经所述对象处理网络输出所述待处理对象的处理结果;其中,所述对象处理网络利用含噪声样本集合训练得到,所述含噪声样本集合包括至少一个标签有误的噪声样本,所述训练包括:
[0008]获取所述含噪声样本集合中目标样本的推断标签;
[0009]根据所述推断标签,修正所述目标样本的标签;
[0010]利用修正标签后的所述目标样本监督训练初始对象处理网络,得到所述对象处理网络。
[0011]可选的,在本申请的一个实施例中,所述获取所述含噪声样本集合中目标样本的推断标签,包括:
[0012]利用所述对象处理网络分别确定所述含噪声样本集合中各个样本的特征信息;
[0013]根据所述特征信息确定所述目标样本的多个参考样本,所述目标样本与所述参考样本之间的特征相似度满足预设条件;
[0014]根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的推断标签。
[0015]本实施例中,利用特征相似度确定所述目标样本的多个参考样本,并利用所述特征相似度确定所述目标样本的推断标签。具体来说,特征相似度可以用于表示所述参考样本对于推断所述目标样本真实标签的重要程度,因此,利用特征相似度确定所述目标样本的参考样本以及推断标签,能够获取到比较准确的推断标签。
[0016]可选的,在本申请的一个实施例中,所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定,且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。
[0017]本实施例中,可以同时根据所述目标样本的类内类间关系衡量其他样本对目标样本i真实标签的重要程度,准确性较高。
[0018]可选的,在本申请的一个实施例中,所述根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的推断标签,包括:
[0019]根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的标签概率分布,所述标签概率分布包括所述目标样本分别对应各个标签的概率,所述各个标签包括所述含噪声样本集合中的标签;
[0020]将所述标签概率分布中概率最大的标签作为所述目标样本的推断标签。
[0021]本实施例中,可以根据所述特征相似度,获取到所述目标样本在所有标签上的概率分布,即获取到所述目标样本的软化标签,能够获取到更加准确的所述目标样本的推断标签。
[0022]可选的,在本申请的一个实施例中,所述目标样本的推断标签利用对象处理分支网络所确定,所述对象处理分支网络同样基于所述含噪声样本集合训练。
[0023]本实施例中,可以利用所述含噪声样本集合同时训练多个对象处理分支网络,并将不同分支网络所确定的推断标签进行交换。该方式不仅可以克服网络分支在自我迭代过程中所产生的误差,还可以融合不同网络分支能够过滤不同噪声的优势。
[0024]可选的,在本申请的一个实施例中,所述根据所述推断标签,修正所述噪声样本的标签,包括:
[0025]利用所述对象处理网络确定所述目标样本的预测结果;
[0026]根据所述推断标签和所述预测结果修正所述目标样本的标签。
[0027]本实施例中,可以利用所述推断标签与所述对象处理网络的预测结果联合修正所述目标样本的标签,提升修正后的标签的准确性。
[0028]可选的,在本申请的一个实施例中,所述预测结果包括对所述目标样本或者所述目标样本进行数据增强后的样本的预测结果。
[0029]本实施例中,对所述目标样本进行增强,可以丰富样本数量,降低所述对象处理网
络产生过拟合的可能性。
[0030]可选的,在本申请的一个实施例中,所述根据所述推断标签和所述预测结果修正所述目标样本的标签,包括:
[0031]将所述推断标签和所述预测结果的加权和作为所述目标样本修正后的标签,所述推断标签和所述预测结果的权重根据所述推断标签所对应的概率确定。
[0032]本实施例中,将所述推断标签与所述预测结果的加权和作为修正后的标签,并将所述推断标签的置信度作为所述推断标签的权重,可以进一步提升修正后标签的准确性。
[0033]可选的,在本申请的一个实施例中,所述利利用修正标签后的所述目标样本监督训练初始对象处理网络,得到所述对象处理网络,包括:
[0034]根据所述目标样本的原始标签与所述推断标签是否相同,确定所述目标样本为干净样本还是噪声样本;
[0035]基于修正后的标签,利用所述含噪声样本集合中的干净样本和/本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象处理方法,其特征在于,包括:将待处理对象输入至对象处理网络,经所述对象处理网络输出所述待处理对象的处理结果;其中,所述对象处理网络利用含噪声样本集合训练得到,所述含噪声样本集合包括至少一个标签有误的噪声样本,所述训练包括:获取所述含噪声样本集合中目标样本的推断标签;根据所述推断标签,修正所述目标样本的标签;利用修正标签后的所述目标样本监督训练初始对象处理网络,得到所述对象处理网络。2.根据权利要求1所述的方法,其特征在于,所述获取所述含噪声样本集合中目标样本的推断标签,包括:利用所述对象处理网络分别确定所述含噪声样本集合中各个样本的特征信息;根据所述特征信息确定所述目标样本的多个参考样本,所述目标样本与所述参考样本之间的特征相似度满足预设条件;根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的推断标签。3.根据权利要求2所述的方法,其特征在于,所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定,且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的推断标签,包括:根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的标签概率分布,所述标签概率分布包括所述目标样本分别对应各个标签的概率,所述各个标签包括所述含噪声样本集合中的标签;将所述标签概率分布中概率最大的标签作为所述目标样本的推断标签。5.根据权利要求1所述的方法,其特征在于,所述目标样本的推断标签利用对象处理分支网络所确定,所述对象处理分支网络同样基于所述含噪声样本集合训练。6.根据权利要求1

5任一项所述的方法,其特征在于,所述根据所述推断标签,修正所述噪声样本的标签,包括:利用所述对象处理网络确定所述目标样本的预测结果;根据所述推断标签和所述预测结果修正所述目标样本的标签。7.根据权利要求6所述的方法,其特征在于,所述预测结果包括对所述目标样本或者所述目标样本进行数据增强后的样本的预测结果。8.根据权利要求6或7所述的方法,其特征在于,所述根据所述推断标签和所述预测结果修正所述目标样本的标签,包括:将所述推断标签和所述预测结果的加权和作为所述目标样本修正后的标签,所述推断标签和所述预测结果的权重根据所述推断标签所对应的概率确定。9.根据权利要求1

8任一项所述的方法,其特征在于,所述利用修正标签后的所述目标样本监督训练初始对象处理网络,得到所述对象处理网络包括:根据所述目标样本的原始标签与所述推断标签是否相同,确定所述目标样本为干净样
本还是噪声样本;基于修正后的标签,利用所述含噪声样本集合中的干净样本和/或噪声样本训练所述初始对象处理网络,得到所述对象处理网络。10.根据权利要求9所述的方法,其特征在于,所述利用所述含噪声样本集合中的干净样本和噪声样本训练所述初始对象处理网络,得到所述对象处理网络,包括:从所述干净样本和/或所述噪声样本中随机抽取样本与所述干净样本及其修正后的标签进行融合,获取融合后的样本;利用所述融合后的样本训练所述初始对象处理网络,得到所述对象处理网络。11.一种生成对象处理网络的方法,其特征在于,所述对象处理网络利用含噪声样本集合训练得到,所述含噪声样本集合包括至少一个标签有误的噪声样本,包括:获取所述含噪声样本集合中目标样本的推断标签;根据所述推断标签,修正所述目标样本的标签;利用修正标签后的所述目标样本监督训练初始对象处理网络,得到所述对象处理网络。12.根据权利要求11所述的方法,其特征在于,所述获取所述含噪声样本集合中目标样本的推断标签,包括:利用所述对象处理网络分别确定所述含噪声样本集合中各个样本的特征信息;根据所述特征信息确定所述目标样本的多个参考样本,所述目标样本与所述参考样本之间的特征相似度满足预设条件;根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的推断标签。13.根据权利要求12所述的方法,其特征在于,所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定,且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。14.根据权利要求12或13所述的方法,其特征在于,所述根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的推断标签,包括:根据所述目标样本分别与所述多个参考样本之间的特征相似度,确定所述目标样本的标签概率分布,所述标签概率分布包括所述目标样本分别对应各个标签的概率,所述各个标签包括所述含噪声样本集合中的标签;将所述标签概率分布中概率最大的标签作为所述目标样本的推断标签。15.根据权利要求11所述的方法,其特征在于,所述目标样本的推断标签利用对象处理分支网络所确定,所述对象处理分支网络同样基于所述含噪声样本集合训练。16.根据权利要求11

15任一项所述的方法,其特征在于,所述根据所述推断标签,修正所述噪声样本的标签,包括:利用所述对象处理网络确定所述目标样本的预测结...

【专利技术属性】
技术研发人员:张新雨解元钟钊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1