一种图像识别模型的训练方法及图像识别方法技术

技术编号:32607166 阅读:24 留言:0更新日期:2022-03-12 17:32
本申请公开了一种图像识别模型的训练方法以及图像识别方法。所述图像识别模型的训练方法包括:获取图像数据以及图像数据的辅助信息,根据图像数据以及所述辅助信息生成视觉原型数据;获取训练样本以及训练样本对应的特定视觉原型数据;使用训练样本训练原始图像识别模型,在训练过程中基于所述特定视觉原型数据确定训练产生的训练损失数据,并训练直至所述训练损失数据满足预设条件,得到训练完成的图像识别模型。所述图像识别方法包括:获取待识别的目标图像;根据训练完成的图像识别模型对所述目标图像进行识别,得到识别结果。采用所述方法,抑制了训练样本中的噪声图像对图像识别模型的训练的干扰,提高了图像识别模型的学习效率及准确率。习效率及准确率。习效率及准确率。

【技术实现步骤摘要】
一种图像识别模型的训练方法及图像识别方法


[0001]本申请涉及数据处理
,具体涉及一种图像识别模型的训练方法、 装置及设备。本申请还涉及一种图像识别方法、装置及设备。本申请还涉及一 种图像识别系统。

技术介绍

[0002]目前,图像识别有着广泛应用,神经网络(Neural Networks)是一种常用的图 像识别模型,一般通过获取图像数据作为训练样本对原始神经网络进行训练得 到训练完成的神经网络,将包含待识别内容的图像作为训练好的神经网络的输 入,识别出待识别内容的相关信息。训练样本的质量和数量对于模型训练非常 重要。实际中可以使用文本标签到搜索引擎搜索图像数据,可满足训练样本的 数量。但是搜索到的图像数据中带有较多噪声图像,会对模型训练产生干扰。 现有技术中,针对搜索到的图像数据进行人工标注以减少训练样本中的噪声图 像。但是人工标注处理效率较低并且成本较高。
[0003]因此,如何抑制训练样本中噪声图像对图像识别模型训练的干扰,是需要 解决的问题。

技术实现思路

[0004]本申请实施例提供的图像识别模型的训练本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取训练完成的图像识别模型,所述训练完成的图像识别模型通过使用训练样本训练原始图像识别模型,在训练过程中基于所述训练样本对应的特定视觉原型数据确定训练产生的训练损失数据,并训练直至所述训练损失数据满足预设条件而得到;其中,所述特定视觉原型数据为根据图像数据以及所述图像数据的辅助信息生成的视觉原型数据;获取待识别的目标图像;根据所述训练完成的图像识别模型,对所述目标图像进行识别,得到识别结果。2.根据权利要求1所述的方法,其特征在于,还包括:基于所述图像数据与所述图像数据的辅助信息之间的匹配度生成所述视觉原型数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述图像数据与所述图像数据的辅助信息之间的匹配度生成所述视觉原型数据,包括:根据所述图像数据的辅助信息,生成特定类型的文本分类关系;根据所述图像数据生成所述特定类型的视觉分类关系;通过图匹配算法确定所述文本分类关系与所述视觉分类关系之间的匹配度,生成所述特定类型对应的视觉原型数据。4.根据权利要求3所述的方法,其特征在于,所述根据所述图像数据的辅助信息,生成特定类型的文本分类关系,包括:从所述辅助信息中抽取所述特定类型的文本描述信息;从所述文本描述信息中提取文本向量;根据所述文本向量之间的相似关系生成所述特定类型的文本分类关系。5.根据权利要求4所述的方法,其特征在于,所述根据所述图像数据生成所述特定类型的视觉分类关系,包括:通过神经网络分类模型将所述图像数据进行分类,得到分类结果;确定分类结果中特定类型的置信度评分满足预设置信度阈值的图像数据,作为参与生成所述特定类型对应的视觉原型数据的图像数据;根据所述参与生成所述特定类型对应的视觉原型数据的图像数据,生成所述特定类型对应的视觉分类关系。6.根据权利要求5所述的方法,其特征在于,所述通过图匹配算法确定所述视觉分类关系与所述文本分类关系之间的匹配度,生成所述特定类型对应的视觉原型数据,包括:通过相对熵匹配算法确定所述特定类型的视觉分类关系与文本分类关系之间的相似度,作为所述匹配度;根据所述匹配度确定图像特征的权重,根据所述权重以及所述图像特征生成所述视觉原型数据;其中,所述图像特征为参与生成所述视觉原型数据的图像数据的特征。7.根据权利要求1所述的方法,其特征在于,所述在训练过程中基于所述特定视觉原型数据确定训练产生的训练损失数据,包括:确定所述训练样本与所述特定视觉原型数据之间的相似度;将所述相似度作为所述训练样本的噪声权重,使用所述噪声权重与交叉熵损失函数构成加权交叉熵损失函数;根据所述加权交叉熵损失函数计算每次训练产生的训练损失数据。
8.根据权利要求7所述的方法,其特征在于,所述确定所述训练样本与所述特定视觉原型数据之间的相似度,包括:计算所述训练样本与所述特定视觉原型数据之间的距离值,将所述距离值作为所述相似度。9.一种图像识别模型的训练方法,其特征在于,包括:获取图像数据以及所述图像数据的辅助信息,根据所述图像数据以及所述辅助信息生成视觉原型数据;获取训练样本以及所述训练样本对应的特定视觉原型数据;使用所述训练样本训练原始图像识别模型,在训练过程中基于所述特定视觉原型数据确定训练产生的训练损失数据,并训练直至所述训练损失数据满足预设条件,得到训练完成的图像识别模型。10.根据权利要求9所述的方法,其特征在于,所述根据所述图像数据以及所述辅助信息生成视觉原型数据,包括:基于所述图像数据与所述图像数据的辅助信息之间的匹配度生成所述视觉原型数据。11.根据权利要求10所述的方法,其特征在于,所述基于所述图像数据与所述图像数据的辅助信息之间的匹配度生成所述视觉原型数据,包括:根据所述图像数据的辅助信息,生成特定类型的文本分类关系;根据所述图像数据生成所述特定类型的视觉分类关系;通过图匹配算法确定所述文本分类关系与所述视觉分类关系之间的匹配度,生成所述特定类型对应的视觉原型数据。12.根据权利要求11所述的方法,其特征在于,所述根据所述图像数据的辅助信息,生成特定类型的文本分类关系,包括:从所述辅助信息中抽取所述特定类型的文本描述信息;从所述文本描述信息中提取文本向量;根据所述文本向量之间的相似关系生成所述特定类型的文本分类关系。13.根据权利要求12所述的方法,其特征在于,所述根据所述图像数据生成所述特定类型的视觉分类关系,包括:通过神经网络分类模型将所述图像数据进行分类,得到分类结果;确定分类结果中特定类型的置信度评分满足预设置信度阈值的图像数据,作为参与生成所述特定类型对应的视觉原型数据的图像数据;根据所述参与生成所述特定类型对应的视觉原型数据的图像数据,生成所述特定类型对应的视觉分类关系。14.根据权利要求13所述的方法,其特征在于,所述通过...

【专利技术属性】
技术研发人员:成乐乐
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1