样本图像标注、模型训练方法、装置、设备以及存储介质制造方法及图纸

技术编号:34802890 阅读:66 留言:0更新日期:2022-09-03 20:09
本公开提供了一种样本图像标注、模型训练方法、装置、设备以及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:提取未标注的第一样本图像的图像特征;根据所述图像特征,获得表征所述第一样本图像中对象位置的位置特征、以及表征所述第一样本图像中对象分类的多种分类特征;根据所述多种分类特征,确定所述第一样本图像的伪标注信息;根据所述图像特征、位置特征以及多种分类特征,获得表征所述伪标注信息正确性的置信度;根据所述置信度和所述伪标注信息,对所述第一样本图像进行标注。应用本公开实施例提供的方案,能够提高样本图像标注的准确性。能够提高样本图像标注的准确性。能够提高样本图像标注的准确性。

【技术实现步骤摘要】
样本图像标注、模型训练方法、装置、设备以及存储介质


[0001]本公开涉及人工智能
,具体为深度学习、图像处理、计算机视觉
,可应用于OCR(Optical Character Recognition,光学字符识别)等场景。

技术介绍

[0002]随着人工智能技术的快速发展,神经网络模型在各个领域的应用越来越广泛。不同的神经网络模型对输入图像进行图像处理从而实现不同的功能,例如,OCR模型能够实现字符识别。在应用各种神经网络模型进行图像处理之前,需要先对神经网络模型进行训练。一种情况下,在采用有监督训练方式对神经网络模型进行训练时,需要应用样本图像以及样本图像的标注信息,这样训练过程中可以根据神经网络模型对样本图像进行图像处理的输出结果与上述标注信息之间的差异进行模型参数调整,使得神经网络模型能够得到训练。
[0003]因此,在训练神经网络模型之前,需要人工对各个样本图像进行标注。

技术实现思路

[0004]本公开提供了一种样本图像标注、模型训练方法、装置、设备以及存储介质。
[0005]根据本公开的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种样本图像标注方法,包括:提取未标注的第一样本图像的图像特征;根据所述图像特征,获取所述第一样本图像中对象的位置特征、和所述对象的多种分类特征;根据所述多种分类特征,确定所述第一样本图像的伪标注信息;根据第一参考特征,获取所述伪标注信息的置信度,所述第一参考特征包括:所述图像特征、所述位置特征和所述多种分类特征;根据所述置信度和所述伪标注信息,对所述第一样本图像进行标注。2.根据权利要求1所述的方法,其中,所述根据所述置信度和所述伪标注信息,对所述第一样本图像进行标注,包括:响应于确定所述置信度大于预设的阈值程度,确定所述伪标注信息为所述第一样本图像的标注信息;响应于确定所述置信度小于或等于所述阈值程度,对所述第一样本图像进行标注,得到标注信息。3.根据权利要求1所述的方法,其中,所述根据所述多种分类特征,确定所述第一样本图像的伪标注信息,包括:获取所述多种分类特征的融合特征;根据所述融合特征,确定所述伪标注信息;所述第一参考特征还包括:所述融合特征。4.根据权利要求1所述的方法,其中,所述提取未标注的第一样本图像的图像特征,包括:将未标注的第一样本图像输入预先训练的图像标注模型中检测子网络的图像特征提取层,得到所述图像特征;其中,所述图像标注模型还包括:置信度预测子网络,所述检测子网络还包括:位置特征获得层和多个分类特征获得层;所述根据所述图像特征,获取所述第一样本图像中对象的位置特征、和所述对象的多种分类特征,包括:将所述图像特征输入所述位置特征获得层和所述多个分类特征获得层,分别得到所述位置特征和所述多种分类特征;所述根据所述第一参考特征,获取所述伪标注信息的置信度,包括:将所述第一参考特征输入所述置信度预测子网络,得到所述置信度。5.一种模型训练方法,包括:将第二样本图像输入待训练的图像标注模型中检测子网络的图像特征提取层,得到所述第二样本图像的样本图像特征,其中,所述图像标注模型还包括:置信度预测子网络,所述检测子网络还包括:位置特征获得层和多个分类特征获得层;将所述样本图像特征输入所述位置特征获得层和所述多个分类特征获得层,分别得到所述第二样本图像中对象的样本位置特征和所述对象的多种样本分类特征;获取所述第二样本图像的标注信息;基于所述第一参考特征,确定所述检测子网络进行对象检测的网络损失,所述第一参
考特征包括:所述标注信息和所述多种样本分类特征;将所述第二参考特征输入所述置信度预测子网络,得到所述标注信息的样本置信度,所述第二参考特征包括:所述样本图像特征、所述样本位置特征和所述多种样本分类特征;基于所述网络损失和所述样本置信度,调整所述图像标注模型的网络参数。6.根据权利要求5所述的方法,其中,所述第二样本图像为未标注图像;所述获取所述第二样本图像的标注信息,包括:根据所述多种样本分类特征,确定所述第二样本图像的伪标注信息,并将所确定的伪标注信息作为所述第二样本图像的标注信息。7.根据权利要求6所述的方法,其中,所述检测子网络还包括:融合特征获得层;所述根据所述多种样本分类特征,确定所述第二样本图像的伪标注信息,包括:将所述多种样本分类特征输入所述融合特征获得层进行特征融合,得到样本融合特征;根据所述样本融合特征,确定所述伪标注信息;所述第一参考特征还包括:所述样本融合特征;所述第二参考特征还包括:所述样本融合特征。8.根据权利要求5所述的方法,其中,所述第二样本图像为已标注图像,所述第一参考特征还包括:样本位置特征。9.一种样本图像标注装置,包括:图像特征提取模块,用于提取未标注的第一样本图像的图像特征;第一特征获得模块,用于根据所述图像特征,获取所述第一样本图像中对象的位置特征、和所述对象的多种分类特征;伪标注信息确定模块,用于根据所述多种分类特征,确定所述第一样本图像的伪标注信息;置信度获得模块,用于根据第一参考特征,获取所述伪标注信息的置信度,所述第一参考特征包括:所述图像特征、所述位置特征和所述...

【专利技术属性】
技术研发人员:王鹏谢群义钦夏孟姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1