图像识别方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:33133079 阅读:29 留言:0更新日期:2022-04-17 00:53
本公开提供了一种图像识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,应用于图像识别场景,以至少解决相关技术中模型识别的准确率较低的技术问题。具体实现方案为:获取目标图像,其中,目标图像包括待识别对象;利用目标模型对目标图像进行对象识别,得到识别结果;其中,目标模型分别使用多组训练数据通过机器学习训练得到,多组训练数据至少包括:第一组训练数据、第二组训练数据、第三组训练数据,第一组训练数据、第二组训练数据、第三组训练数据的损失梯度不同。练数据的损失梯度不同。练数据的损失梯度不同。

【技术实现步骤摘要】
图像识别方法、装置、电子设备以及存储介质


[0001]本公开涉及人工智能
,具体为深度学习、计算机视觉
,应用于图像识别场景,尤其涉及一种图像识别方法、装置、电子设备以及存储介质。

技术介绍

[0002]目前的文本识别算法大部分基于对于拼音类型文字的识别方式进行改进,但是,目前对于汉字识别的需求逐渐增长,多数场景需要进行准确的汉字识别,然而现有的模型识别效果较差。

技术实现思路

[0003]本公开提供了一种图像识别方法,以至少解决相关技术中模型识别的准确率较低的技术问题。
[0004]根据本公开的一方面,提供了一种图像识别方法,包括:获取目标图像,其中,目标图像包括待识别对象;利用目标模型对目标图像进行对象识别,得到识别结果;其中,目标模型分别使用多组训练数据通过机器学习训练得到,多组训练数据至少包括:第一组训练数据、第二组训练数据、第三组训练数据,第一组训练数据、第二组训练数据、第三组训练数据的损失梯度不同。
[0005]可选地,该方法还包括:获取目标训练数据;利用目标训练数据对原始模型进行训练,得本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,包括:获取目标图像,其中,所述目标图像包括待识别对象;利用目标模型对所述目标图像进行对象识别,得到识别结果;其中,所述目标模型分别使用多组训练数据通过机器学习训练得到,所述多组训练数据至少包括:第一组训练数据、第二组训练数据、第三组训练数据,所述第一组训练数据、所述第二组训练数据、所述第三组训练数据的损失梯度不同。2.根据权利要求1所述的方法,其中,所述方法还包括:获取目标训练数据;利用所述目标训练数据对原始模型进行训练,得到第一训练结果;基于所述第一训练结果确定所述目标训练数据对应的第一损失梯度;基于所述第一损失梯度对所述目标训练数据进行分组,得到所述多组训练数据;利用所述多组训练数据对所述原始模型进行训练,得到所述目标模型。3.根据权利要求2所述的方法,其中,基于所述第一损失梯度对所述目标训练数据进行分组,得到所述多组训练数据,包括:基于预设损失梯度和所述第一损失梯度对所述目标训练数据进行分组,得到第一组训练数据、第二组训练数据和第三组训练数据,其中,所述第一组训练数据的损失梯度大于所述第二组训练数据的损失梯度、所述二组训练数据的损失梯度大于所述第三组训练数据的损失梯度。4.根据权利要求2至3中任一项所述的方法,其中,利用所述多组训练数据对所述原始模型进行训练,得到所述目标模型,包括:对第一组训练数据进行增强处理,得到第四组训练数据;利用第二组训练数据、第三组训练数据和所述第四组训练数据对所述原始模型进行训练,得到所述目标模型。5.根据权利要求4所述的方法,其中,利用所述第二组训练数据、所述第三组训练数据和所述第四组训练数据对所述原始模型进行训练,得到所述目标模型,包括:利用所述第二组训练数据、所述第三组训练数据和所述第四组训练数据对所述原始模型进行训练,得到第二训练结果;对所述第三组训练数据中的每个数据进行标识处理,得到标识处理后的第三组训练数据,其中,所述标识处理后的第三组训练数据中每个数据包含至少一个目标标识;基于所述第四组训练数据和所述标识处理后的第三组训练数据对所述目标训练数据进行更新,得到更新后的目标训练数据;利用所述第二训练结果对所述更新后的目标训练数据进行分组,得到所述多组训练数据;利用所述多组训练数据对所述原始模型进行训练,得到所述目标模型。6.根据权利要求5所述的方法,其中,所述方法还包括:检测所述标识处理后的第三组训练数据中每个数据包含目标标识的目标数量;响应于所述处理后的第三组训练数据存在目标数据包含目标标识的目标数量大于或等于预设数量,从所述处理后的第三组训练数据中删除所述目标数据,得到删除处理后的第三组训练数据;
基于所述第四组训练数据和所述删除处理后的第三组训练数据对所述目标训练数据进行更新,得到更新后的目标训练数据。7.根据权利要求2至6中任一项所述的方法,其中,所述方法还包括:响应于所述多组训练数据的数据总量小于预设数量,停止利用所述多组训练数据对所述原始模型进行训练。8.一种图像识别装置,包括:图像获取模块,用于获取目标图像,其中,所述目标图像包括待识别对象;对象识别模块,用于利用目标模型对所述目标图像进行对象识别,得到识别结果;其中,所述目标模型分别使用多组训练数据通过机器学习训练得到,所述多组训练数据至少包括:第一组训练数据、第二组训练数据、第三组训练数据,所述第一组训练数据、...

【专利技术属性】
技术研发人员:杨夏浛钦夏孟谢群义徐杨柳张胜姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1