图像识别模型训练及图像识别方法、装置、电子设备制造方法及图纸

技术编号：25088048 阅读：22 留言：0更新日期：2020-07-31 23:32

本申请公开了一种图像识别模型训练及图像识别方法、装置、电子设备及存储介质，能够快速生成大量标注好的训练样本，降低训练成本，提高训练效率，该图像识别模型训练方法包括：从包含标识的第一图像中提取包含标识的贴图模板；将贴图模板添加到多个第二图像中，获得多个样本图像；将样本图像和样本图像对应的标注标签作为训练样本添加到训练样本集中，标注标签是基于样本图像中的贴图模板包含的标识所属的标识类别确定的；基于训练样本集训练图像识别模型，获得能够识别出图像中包含的标识所属标识类别的图像识别模型。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型训练及图像识别方法、装置、电子设备
本申请涉及计算机
，尤其涉及一种图像识别模型训练及图像识别方法、装置、电子设备。
技术介绍
本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。现有的训练图像识别模型的方法通常是：对图像中包含的对象进行人工标注，将标注好的图像作为训练样本，对图像识别模型进行训练。但是，当需要识别的对象种类上升到数以千计或者数以万计时，人工标注的效率极低。
技术实现思路
针对上述技术问题，非常需要一种改进的方法，能够快速生成大量标注好的训练样本，降低训练成本，提高训练效率。一方面，本申请一实施例提供了一种图像识别模型训练方法，包括：从包含标识的第一图像中提取包含标识的贴图模板；将所述贴图模板添加到多个第二图像中，获得多个样本图像；将样本图像和样本图像对应的标注标签作为训练样本添加到训练样本集中，所述标注标签是基于样本图像中的贴图模板包含的标识所属的标识类别确定的；基于所述训练样本集训练图像识别模型，获得能够识别出图像中包含的标识所属标识类别的图像识别模型。可选地，所述从包含标识的第一图像中提取包含标识的贴图模板，具体包括：确定包含标识的第一图像中的前景区域和背景区域，所述前景区域中包含所述标识；将所述第一图像中背景区域内的像素点设置为透明；从透明化处理后的第一图像中获取包含前景区域的图像，确定为包含所述标识的贴图模板。>可选地，所述将所述贴图模板添加到多个第二图像中，获得多个样本图像，具体包括：针对每个第二图像，将所述第二图像中图像特征满足预设条件的区域确定为贴图区域，和/或将所述第二图像中的指定区域确定为贴图区域；将所述贴图模板添加到多个第二图像中的贴图区域内，获得多个样本图像。可选地，所述将所述贴图模板添加到多个第二图像中的贴图区域内，具体包括：针对每个第二图像，根据所述第二图像中的贴图区域的图像特征，对所述贴图模板进行仿真变换，将仿真变换后的贴图模板添加到所述第二图像中。可选地，每个训练样本还包括：贴图模板在样本图像中的位置信息；所述图像识别模型包括：目标检测模型和特征提取模型；所述基于所述训练样本集训练图像识别模型，具体包括：基于所述训练样本集中各个训练样本中的样本图像和贴图模板在所述样本图像中的位置信息，训练所述目标检测模型，所述目标检测模型用于确定输入图像中的标识在输入图像中的位置信息；针对每个训练样本，获取所述样本图像中包含所述位置信息对应的标识的目标图像；基于各个训练样本对应的目标图像和标注标签，训练所述特征提取模型，所述特征提取模型用于从输入图像中提取标识特征，以基于提取的标识特征与各个标识类别的标识特征的匹配度确定输入图像对应的标识类别。可选地，所述方法还包括：获取第三图像；基于已训练的目标检测模型，确定所述第三图像中的标识在所述第三图像中的目标位置信息；根据所述第三图像对应的目标位置信息，从所述第三图像中提取出包含标识的目标图像；基于已训练的特征提取模型，从所述目标图像中提取标识特征；确定所述目标图像的标识特征与各个标识类别的标识特征的匹配度；若最大匹配度大于第一阈值，则将所述最大匹配度对应的标识类别确定为所述第三图像的标注标签；将所述第三图像、所述目标位置信息和所述第三图像的标注标签作为一个训练样本添加到所述训练样本集中。可选地，所述图像识别模型还包括：分类模型；所述方法还包括：针对每个第三图像，若所述第三图像的目标图像对应的最大匹配度小于第二阈值，则将所述第三图像的目标图像和标注标签作为负样本添加到负样本集中；将所述训练样本集中的训练样本对应的目标图像和标注标签作为正样本添加到正样本集中；所述基于所述训练样本集训练图像识别模型，还包括：基于所述负样本集和所述正样本集，训练所述分类模型。可选地，所述方法还包括：获取第四图像；基于已训练的目标检测模型，确定所述第四图像中的标识在所述第四图像中的目标位置信息；根据所述第四图像对应的目标位置信息，从所述第四图像中提取出包含标识的目标图像；基于已训练的分类模型，确定所述第四图像的目标图像对应的标识类别以及对应的分类概率值；若所述分类概率值小于第三阈值，则将所述第四图像的目标图像和所述第四图像的目标图像对应的标注标签作为负样本添加到所述负样本集中，所述第四图像的目标图像对应的标注标签是基于所述第四图像的目标图像对应的标识类别确定的。一方面，本申请一实施例提供了一种图像识别方法，包括：获取待识别图像；基于已训练的图像识别模型，识别所述待识别图像中包含的标识所属的标识类别；其中，训练所述图像识别模型的训练样本集中的每个训练样本包括一个样本图像和标注标签，所述样本图像为添加了贴图模板的图像，所述标注标签是基于所述样本图像中的贴图模板包含的标识所属的标识类别确定的，所述贴图模板是从包含标识的第一图像中提取的。可选地，所述图像识别模型包括：目标检测模型和特征提取模型；所述基于已训练的图像识别模型，识别所述待识别图像中包含的标识所属的标识类别，具体包括：基于所述目标检测模型，确定所述待识别图像中包含的标识在所述待识别图像中的目标位置信息；根据所述目标位置信息，从所述待识别图像中提取包含标识的目标图像；基于所述特征提取模型，从所述目标图像中提取标识特征；确定提取的标识特征与各个标识类别的标识特征的匹配度，获取最大匹配度对应的标识类别；根据所述最大匹配度对应的标识类别，确定所述待识别图像中包含的标识所属的标识类别。可选地，所述图像识别模型还包括：分类模型；所述根据所述最大匹配度对应的标识类别，确定所述待识别图像中包含的标识所属的标识类别，具体包括：若所述最大匹配度大于上限阈值，则将所述最大匹配度对应的标识类别确定为所述待识别图像中包含的标识所属的标识类别；若所述最大匹配度不大于所述上限阈值且所述最大匹配度不小于下限阈值，则基于所述分类模型确定所述目标图像对应的标识类别，将所述目标图像对应的标识类别确定为所述待识别图像中包含的标识所属的标识类别。一方面，本申请一实施例提供了一种图像识别模型训练装置，包括：模板提取模块，用于从包含标识的第一图像中提取包含标识的贴图模板；样本获取模块，用于将所述贴图模板添加到多个第二图像中，获得多个样本图像，将样本图像和样本图像对应的标注标签作为训练样本添加到训练样本集中，所述标注标签是基于样本图像中的贴图模板包含的标识所属的标识类别确定的；训练模块，用于基于所述训练样本集训练图像识别模型，获得能够识别出图像中包含的标识所属标识类别的图像识别模型。可选地，所述模板提取模块，具体用于：本文档来自技高网...

【技术保护点】
1.一种图像识别模型训练方法，其特征在于，包括：/n从包含标识的第一图像中提取包含标识的贴图模板；/n将所述贴图模板添加到多个第二图像中，获得多个样本图像；/n将样本图像和样本图像对应的标注标签作为训练样本添加到训练样本集中，所述标注标签是基于样本图像中的贴图模板包含的标识所属的标识类别确定的；/n基于所述训练样本集训练图像识别模型，获得能够识别出图像中包含的标识所属标识类别的图像识别模型。/n

【技术特征摘要】
1.一种图像识别模型训练方法，其特征在于，包括：
从包含标识的第一图像中提取包含标识的贴图模板；
将所述贴图模板添加到多个第二图像中，获得多个样本图像；
将样本图像和样本图像对应的标注标签作为训练样本添加到训练样本集中，所述标注标签是基于样本图像中的贴图模板包含的标识所属的标识类别确定的；
基于所述训练样本集训练图像识别模型，获得能够识别出图像中包含的标识所属标识类别的图像识别模型。

2.根据权利要求1所述的方法，其特征在于，所述从包含标识的第一图像中提取包含标识的贴图模板，具体包括：
确定包含标识的第一图像中的前景区域和背景区域，所述前景区域中包含所述标识；
将所述第一图像中背景区域内的像素点设置为透明；
从透明化处理后的第一图像中获取包含前景区域的图像，确定为包含所述标识的贴图模板。

3.根据权利要求1所述的方法，其特征在于，所述将所述贴图模板添加到多个第二图像中，获得多个样本图像，具体包括：
针对每个第二图像，将所述第二图像中图像特征满足预设条件的区域确定为贴图区域，和/或将所述第二图像中的指定区域确定为贴图区域；
将所述贴图模板添加到多个第二图像中的贴图区域内，获得多个样本图像。

4.根据权利要求3所述的方法，其特征在于，所述将所述贴图模板添加到多个第二图像中的贴图区域内，具体包括：
针对每个第二图像，根据所述第二图像中的贴图区域的图像特征，对所述贴图模板进行仿真变换，将仿真变换后的贴图模板添加到所述第二图像中。

5.根据权利要求1至4中任一项所述的方法，其特征在于，每个训练样本还包括：贴图模板在样本图像中的位置信息；所述图像识别模型包括：目标检测模型和特征提取模型；
所述基于所述训练样本集训练图像识别模型，具体包括：
基于所述训练样本集中各个训练样本中的样本图像和贴图模板在所述样本图像中的位置信息，训练所述目标检测模型，所述目标检测模型用于确定输入图像中的标识在输入图像中的位置信息；
针对每个训练样本，获取所述样本图像中包含所述位置信息对应的标识的目标图像；
...

【专利技术属性】
技术研发人员：胡宜峰，吕玥，吕晓新，李雨珂，杨卫强，朱浩齐，
申请(专利权)人：网易杭州网络有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人