【技术实现步骤摘要】
样本学习方法、数据标注设备、电子设备以及介质
[0001]本申请涉及数据标注
,特别是涉及一种样本学习方法、数据标注设备、电子设备以及介质。
技术介绍
[0002]通常,随着人们对产品设备使用的各种需求的提升,在使用产品设备进行数据标注时,用户往往希望能够既保持产品设备中数据标注的及时性,又保持产品设备中数据标注的准确性。
[0003]目前,在数据标注技术方面,为了准确地标注数据,往往基于预先定义好的标注规范和标签体系,采用人工标注对数据进行逐条或逐帧地标注,这导致人工标注费时费力,效率低下,单人天只能标注固定的数据量,使得成本较大。
技术实现思路
[0004]本申请实施例第一方面提供了一种样本学习方法,该方法包括获取已标注数据集和未标注数据集;根据已标注数据集构建网络模型;将已标注数据集和未标注数据集输入至网络模型,以利用网络模型对未标注数据集进行精度验证,得到模型精度;在模型精度不满足预设条件时,从未标注数据集中选取若干样本,并对若干样本对应的预标注数据进行人工审核以更新未标注数据集;再次执 ...
【技术保护点】
【技术特征摘要】
1.一种样本学习方法,其特征在于,所述方法包括:获取已标注数据集和未标注数据集;根据所述已标注数据集构建网络模型;将所述已标注数据集和所述未标注数据集输入至所述网络模型,以利用所述网络模型对所述未标注数据集进行精度验证,得到模型精度;在所述模型精度不满足预设条件时,从所述未标注数据集中选取若干样本,并对所述若干样本对应的预标注数据进行人工审核以更新所述未标注数据集;再次执行将所述已标注数据集和所述未标注数据集输入至所述网络模型,以利用所述网络模型对所述未标注数据集进行精度验证的步骤,通过多次迭代直至所述模型精度满足所述预设条件。2.根据权利要求1所述的方法,其特征在于,所述根据所述已标注数据集构建网络模型,包括:调用所述样本特征提取模块,对所述已标注数据集进行特征提取,得到第一图像特征;调用所述边缘样本挖掘模块,将所述第一图像特征分别输入第一预测分类器和第二预测分类器,分别得到多个类别的第一预测数据和多个类别的第二预测数据,其中,所述边缘样本挖掘模块包括第一预测分类器和第二预测分类器,所述第二预测分类器与所述第一预测分类器的网络结构相同;基于所述第一预测数据和所述第二预测数据,对所述样本特征提取模块和所述边缘样本挖掘模块进行构建,以得到所述网络模型。3.根据权利要求2所述的方法,其特征在于,所述网络模型包含损失函数,所述损失函数包括第一损失函数和第二损失函数;所述将所述已标注数据集和所述未标注数据集输入至所述网络模型,以利用所述网络模型对所述未标注数据集进行精度验证,得到模型精度,包括:针对所述已标注数据集,调用所述第一损失函数进行计算,得到第一预测损失;针对所述未标注数据集,调用所述第二损失函数进行计算,得到所述第二预测损失;基于所述第一预测损失和所述第二预测损失,对所述网络模块的网络参数进行更新,以得到更新后的网络模型。4.根据权利要求3所述的方法,其特征在于,所述样本特征提取模块包括编码器;所述基于所述第一预测损失和所述第二预测损失,对所述网络模块的网络参数进行更新,包括:基于所述第一预测损失与所述第二预测损失之间的最大值,对所述第一预测分类器的第一参数和所述第二预测分类器的第二参数进行更新,并停止更新所述编码器的参数;或基于所述第一预测损失与所述第二预测损失之间的最小值,对所述编码器的参数进行更新,并停止更新所述第一参数和所述第二参数。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于所述第一预测损失、所述最大值以及所述最小值,判断所述损失函数的损失值是否小于或等于预设阈值;
若小于或等于...
【专利技术属性】
技术研发人员:崔现军,李洪宇,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。