训练数据处理方法、分类模型训练方法及设备技术

技术编号：21954686 阅读：18 留言：0更新日期：2019-08-24 18:39

本发明专利技术提供一种训练数据处理方法、分类模型训练方法及设备，所述训练数据处理方法包括：获取多个训练数据，所述训练数据中包括样本图像及其标签信息；利用所述多个训练数据对分类模型进行训练，并判断是否达到设定的收敛条件；当未达到设定的收敛条件时，利用训练后的所述分类模型对各个样本图像进行分类并输出分类结果；利用与所述标签信息不一致的分类结果替换相应的标签信息，以更新所述训练数据。

Training Data Processing Method, Classification Model Training Method and Equipment

全部详细技术资料下载

【技术实现步骤摘要】
训练数据处理方法、分类模型训练方法及设备
本专利技术涉及人工智能领域，具体涉及一种训练数据处理方法、分类模型训练方法及设备。
技术介绍
在诸如机器学习、深度学习、神经网络等人工智能算法的众多应用场景中，训练数据的准确性对模型的性能起到至关重要的作用。具体地，在训练分类模型的过程中，需要使用样本数据及其标注作为训练数据，所谓标注是用于表示样本数据的实际类型的信息，也即标签信息。目前，多数情况下标注操作需要由人工完成，通过人工经验辨别样本数据的类型，并为其添加相应的标签信息。在某些应用场景中，可能会遇到样本数据的实际类型很难被辨别的情况，也即类型的界限比较模糊。尤其是在图像识别领域，例如对于某一样本图像而言，由于图像不清晰或者特征不明显等客观原因，使得人工很难确定其具体类别，这使得人工标注结果可能出现错误。错误的训练数据会使分类模型的训练很难收敛，进而影响分类模型的识别准确性。
技术实现思路
有鉴于此，本专利技术提供一种训练数据处理方法，包括：获取多个训练数据，所述训练数据中包括样本图像及其标签信息；利用所述多个训练数据对分类模型进行训练，并判断是否达到设定的收敛条件；当未达到设定的收敛条件时，利用训练后的所述分类模型对各个样本图像进行分类并输出分类结果；利用与所述标签信息不一致的分类结果替换相应的标签信息，以更新所述训练数据。可选地，所述方法被循环执行，在更新所述训练数据后，返回利用所述多个训练数据对分类模型进行训练的步骤，直至达到设定的收敛条件为止。可选地，所述收敛条件为损失值小于设定阈值。可选地，在利用所述多个训练数据对分类模型进行训练的步骤中，利用所述多个...

【技术保护点】
1.一种训练数据处理方法，其特征在于，包括：获取多个训练数据，所述训练数据中包括样本图像及其标签信息；利用所述多个训练数据对分类模型进行训练，并判断是否达到设定的收敛条件；当未达到设定的收敛条件时，利用训练后的所述分类模型对各个样本图像进行分类并输出分类结果；利用与所述标签信息不一致的分类结果替换相应的标签信息，以更新所述训练数据。

【技术特征摘要】
1.一种训练数据处理方法，其特征在于，包括：获取多个训练数据，所述训练数据中包括样本图像及其标签信息；利用所述多个训练数据对分类模型进行训练，并判断是否达到设定的收敛条件；当未达到设定的收敛条件时，利用训练后的所述分类模型对各个样本图像进行分类并输出分类结果；利用与所述标签信息不一致的分类结果替换相应的标签信息，以更新所述训练数据。2.根据权利要求1所述的方法，其特征在于，所述方法被循环执行，在更新所述训练数据后，返回利用所述多个训练数据对分类模型进行训练的步骤，直至达到设定的收敛条件为止。3.根据权利要求1或2所述的方法，其特征在于，所述收敛条件为损失值小于设定阈值。4.根据权利要求3所述的方法，其特征在于，在利用所述多个训练数据对分类模型进行训练的步骤中，利用所述多个训练数据中的至少部分训练数据对分类模型进行训练，直至损失值不再继续下降，以获取最低损失值。5.根据权利要求1-4中任一项所述的方法，其特征在于，利用与所述标签信息不一致的分类结果替换相应的标签信息，包括：从对各个所述样本图像的分类结果中确定与相应的所述标签信息不一致的分类结果，所述分类结果中包括对应于类...

【专利技术属性】
技术研发人员：马永培，熊健皓，赵昕，和超，张大磊，
申请(专利权)人：上海鹰瞳医疗科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人