一种对象处理方法及装置制造方法及图纸

技术编号：35117808 阅读：17 留言：0更新日期：2022-10-05 09:45

本申请涉及人工智能领域，公开了一种对象处理方法及装置。所述方法包括：将待处理对象输入至对象处理网络，经所述对象处理网络输出所述待处理对象的处理结果；其中，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，所述训练包括：获取所述含噪声样本集合中目标样本的推断标签；根据所述推断标签，修正所述目标样本的标签；利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络。理网络。理网络。

全部详细技术资料下载

【技术实现步骤摘要】
一种对象处理方法及装置

[0001]本申请涉及人工智能
，尤其涉及一种对象处理方法及装置。

技术介绍

[0002]人工智能的发展离不开机器学习模型，而机器学习模型的训练依赖于样本数据的质量。在有监督学习中，样本数据中标注有标签信息，标签信息越准确，样本数据的质量越高。利用专家经验标注高质量的标签信息需要耗费较多的人力成本。为了降低成本，可以利用数据收集平台(如Amazon Mechanical Turk)或者网络爬虫等方式获取大量低成本的样本数据，这些样本数据中往往还有大量的噪声样本，噪声样本即包括错误的标签信息。
[0003]相关技术中，一些机器学习算法(如深度神经网络(DNN))拥有较强的非线性特征表征能力，可以学习样本数据集中的干净样本(即标签正确的样本)。具体来说，可以根据机器学习模型的损失函数分布，例如基于small
‑
loss准则，筛选出样本数据中的噪声样本(即标签有误的样本)，并增大干净样本对模型训练的影响，降低或者消除噪声样本的影响。但是，基于损失函数分布的样本筛选方式需要基于干净样本和噪声样本的损失函数分布不同的原则，如呈现双峰分布。在实际筛选过程中，尤其在训练开始阶段，干净样本和噪声样本的损失值都较大，导致都不能很好地拟合上述如双峰分布等损失函数分布。如果按照上述方式进行样本筛选，可能导致大量样本被误判，如干净样本被误判为噪声样本，噪声样本有可能被误判为干净样本，影响到机器学习模型的性能。
[0004]因此，相关技术中亟需一种提升利用含噪声样本集训练机器学习...

【技术保护点】

【技术特征摘要】
1.一种对象处理方法，其特征在于，包括：将待处理对象输入至对象处理网络，经所述对象处理网络输出所述待处理对象的处理结果；其中，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，所述训练包括：获取所述含噪声样本集合中目标样本的推断标签；根据所述推断标签，修正所述目标样本的标签；利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络。2.根据权利要求1所述的方法，其特征在于，所述获取所述含噪声样本集合中目标样本的推断标签，包括：利用所述对象处理网络分别确定所述含噪声样本集合中各个样本的特征信息；根据所述特征信息确定所述目标样本的多个参考样本，所述目标样本与所述参考样本之间的特征相似度满足预设条件；根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签。3.根据权利要求2所述的方法，其特征在于，所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定，且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。4.根据权利要求2或3所述的方法，其特征在于，所述根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签，包括：根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的标签概率分布，所述标签概率分布包括所述目标样本分别对应各个标签的概率，所述各个标签包括所述含噪声样本集合中的标签；将所述标签概率分布中概率最大的标签作为所述目标样本的推断标签。5.根据权利要求1所述的方法，其特征在于，所述目标样本的推断标签利用对象处理分支网络所确定，所述对象处理分支网络同样基于所述含噪声样本集合训练。6.根据权利要求1
‑
5任一项所述的方法，其特征在于，所述根据所述推断标签，修正所述噪声样本的标签，包括：利用所述对象处理网络确定所述目标样本的预测结果；根据所述推断标签和所述预测结果修正所述目标样本的标签。7.根据权利要求6所述的方法，其特征在于，所述预测结果包括对所述目标样本或者所述目标样本进行数据增强后的样本的预测结果。8.根据权利要求6或7所述的方法，其特征在于，所述根据所述推断标签和所述预测结果修正所述目标样本的标签，包括：将所述推断标签和所述预测结果的加权和作为所述目标样本修正后的标签，所述推断标签和所述预测结果的权重根据所述推断标签所对应的概率确定。9.根据权利要求1
‑
8任一项所述的方法，其特征在于，所述利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络包括：根据所述目标样本的原始标签与所述推断标签是否相同，确定所述目标样本为干净样
本还是噪声样本；基于修正后的标签，利用所述含噪声样本集合中的干净样本和/或噪声样本训练所述初始对象处理网络，得到所述对象处理网络。10.根据权利要求9所述的方法，其特征在于，所述利用所述含噪声样本集合中的干净样本和噪声样本训练所述初始对象处理网络，得到所述对象处理网络，包括：从所述干净样本和/或所述噪声样本中随机抽取样本与所述干净样本及其修正后的标签进行融合，获取融合后的样本；利用所述融合后的样本训练所述初始对象处理网络，得到所述对象处理网络。11.一种生成对象处理网络的方法，其特征在于，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，包括：获取所述含噪声样本集合中目标样本的推断标签；根据所述推断标签，修正所述目标样本的标签；利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络。12.根据权利要求11所述的方法，其特征在于，所述获取所述含噪声样本集合中目标样本的推断标签，包括：利用所述对象处理网络分别确定所述含噪声样本集合中各个样本的特征信息；根据所述特征信息确定所述目标样本的多个参考样本，所述目标样本与所述参考样本之间的特征相似度满足预设条件；根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签。13.根据权利要求12所述的方法，其特征在于，所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定，且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。14.根据权利要求12或13所述的方法，其特征在于，所述根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签，包括：根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的标签概率分布，所述标签概率分布包括所述目标样本分别对应各个标签的概率，所述各个标签包括所述含噪声样本集合中的标签；将所述标签概率分布中概率最大的标签作为所述目标样本的推断标签。15.根据权利要求11所述的方法，其特征在于，所述目标样本的推断标签利用对象处理分支网络所确定，所述对象处理分支网络同样基于所述含噪声样本集合训练。16.根据权利要求11
‑
15任一项所述的方法，其特征在于，所述根据所述推断标签，修正所述噪声样本的标签，包括：利用所述对象处理网络确定所述目标样本的预测结...

【专利技术属性】
技术研发人员：张新雨，解元，钟钊，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人