一种图像识别模型训练方法、图像识别方法及装置制造方法及图纸

技术编号：40292167 阅读：6 留言：0更新日期：2024-02-07 20:42

本申请实施例提供了一种图像识别模型训练方法、图像识别方法及装置，涉及计算机视觉技术领域，包括：获取对图像识别模型进行训练的训练样本；通过图像识别模型的第一特征提取模块对第一样本图像进行特征提取，得到第一样本图像的第一图像特征；通过图像识别模型的第二特征提取模块对第二样本图像进行特征提取，得到第二样本图像的第二图像特征；通过图像识别模型的特征融合模块对第一图像特征和第二图像特征进行特征融合，得到融合图像特征；通过图像识别模型的识别结果输出模块对融合图像特征进行处理，得到预测识别结果；基于预测识别结果和标注信息对图像识别模型的模型参数进行调整，得到训练好的图像识别模型，提高进行图像识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉，特别是涉及一种图像识别模型训练方法、图像识别方法及装置。

技术介绍

1、深度学习技术是机器学习(英文：machine learning，简称：ml)领域中一个研究方向，深度学习技术引入机器学习，是为了使得机器学习更接近于最初的目标，即人工智能(英文：artificial intelligence，简称：ai)，最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。基于深度学习技术的图像识别模型能够学习样本图像的内在规律和表示层次，在进行深度学习的过程中所获得的信息，对图像识别模型进行图像识别具有很大的帮助。

2、基于深度学习技术的图像识别模型可以应用于计算机视觉领域的目标分类、目标检测、语义分割、实例分割、文本定位等场景。在工业缺陷检测领域中，图像识别模型可以用于识别工业目标中的缺陷区域。然而，不同的工业目标会具有不同的固定纹理特征。例如，工业场景中的工件、产品常常具有固定且复杂的纹理。识别具有复杂纹理的工业目标中的缺陷区域时，工业目标上的缺陷区域可能与背景区域的纹理相似，基于图像识别模型识别工业目标中的缺陷区域时，会产生漏检或误检，也就是基于图像识别模型进行图像识别的准确性较低。

技术实现思路

1、本申请实施例的目的在于提供一种图像识别模型训练方法、图像识别方法及装置，以提高基于图像识别模型进行图像识别的准确性。具体技术方案如下：

2、第一方面，为了达到上述目的，本申请实施例提供了一种图像识别模型训练方法，所述方法包括：

3、获取用于对图像识别模型进行训练的训练样本；其中，每一训练样本包括：第一样本图像、第二样本图像和所述第一样本图像的标注信息；所述第一样本图像为样本场景中包含待检测对象的图像；所述第二样本图像为所述样本场景中不包含待检测对象的图像；所述标注信息包括：所述第一样本图像中包含所述待检测对象的样本图像区域的位置；

4、通过所述图像识别模型的第一特征提取模块对所述第一样本图像进行特征提取，得到所述第一样本图像的第一图像特征；

5、通过所述图像识别模型的第二特征提取模块对所述第二样本图像进行特征提取，得到所述第二样本图像的第二图像特征；

6、通过所述图像识别模型的特征融合模块，对所述第一图像特征和所述第二图像特征进行特征融合，得到融合图像特征；

7、通过所述图像识别模型的识别结果输出模块，对所述融合图像特征进行处理，得到所述第一样本图像的预测识别结果；其中，所述预测识别结果包括：所述第一样本图像中包含所述待检测对象的预测图像区域的位置，以及所述预测图像区域包含所述待检测对象的概率；

8、基于所述预测识别结果和所述标注信息，对所述图像识别模型的模型参数进行调整，得到训练好的图像识别模型。

9、可选的，在所述通过所述图像识别模型的第一特征提取模块对所述第一样本图像进行特征提取，得到所述第一样本图像的第一图像特征之前，所述方法还包括：

10、通过第一调整函数，对所述第一样本图像的目标图像参数进行调整，并通过第二调整函数，对所述第二样本图像的目标图像参数进行调整；其中，所述第一调整函数与所述第二调整函数不同；所述目标图像参数包括以下至少一项：图像中像素点的偏移、图像的亮度、图像的对比度；

11、所述通过所述图像识别模型的第一特征提取模块对所述第一样本图像进行特征提取，得到所述第一样本图像的第一图像特征，包括：

12、通过所述图像识别模型的第一特征提取模块对调整后的所述第一样本图像进行特征提取，得到所述第一样本图像的第一图像特征；

13、所述通过所述图像识别模型的第二特征提取模块对所述第二样本图像进行特征提取，得到所述第二样本图像的第二图像特征，包括：

14、通过所述图像识别模型的第二特征提取模块对调整后的所述第二样本图像进行特征提取，得到所述第二样本图像的第二图像特征。

15、可选的，所述通过所述图像识别模型的特征融合模块，对所述第一图像特征和所述第二图像特征进行特征融合，得到融合图像特征，包括：

16、通过所述图像识别模型的特征融合模块，基于所述第一图像特征对应的注意力向量，以及所述第二图像特征对应的注意力向量，对所述第一图像特征和所述第二图像特征进行特征融合，得到融合图像特征。

17、可选的，所述通过所述图像识别模型的特征融合模块，基于所述第一图像特征对应的注意力向量，以及所述第二图像特征对应的注意力向量，对所述第一图像特征和所述第二图像特征进行特征融合，得到融合图像特征，包括：

18、通过所述图像识别模型的特征融合模块，计算所述第一图像特征对应的注意力向量与所述第二图像特征的乘积，得到第三图像特征，以及计算所述第二图像特征对应的注意力向量与所述第一图像特征的乘积，得到第四图像特征；

19、通过所述特征融合模块，对所述第一图像特征、第二图像特征、第三图像特征和第四图像特征进行特征融合，得到融合图像特征。

20、可选的，所述获取用于对图像识别模型进行训练的训练样本，包括：

21、获取第一训练图像集和第二训练图像集；其中，所述第一训练图像集包括：所述样本场景中包含待检测对象的图像；所述第二训练图像集包括：所述样本场景中不包含待检测对象的图像；

22、从所述第一训练图像集中随机选取一个图像，作为第一样本图像；

23、从所述第二训练图像集中随机选取一个图像，得到该第一样本图像对应的第二样本图像；

24、生成包含第一样本图像、对应的第二样本图像，以及所述第一样本图像的标注信息的训练样本。

25、可选的，所述第二特征提取模块包括：第一残差子模块、第一注意力子模块、第二残差子模块和第二注意力子模块；

26、所述通过所述图像识别模型的第二特征提取模块对所述第二样本图像进行特征提取，得到所述第二样本图像的第二图像特征，包括：

27、通过所述第一残差子模块，对所述第二样本图像进行卷积处理，得到所述第二样本图像的特征图，作为第一特征图；其中，所述第一特征图中的元素与所述第二样本图像中的图像区域相对应，每一元素表示对应的图像区域的图像特征；

28、通过所述第一注意力子模块，对所述第一特征图中的各元素进行加权处理，得到第二特征图；

29、通过所述第二残差子模块，对所述第二特征图进行卷积处理，得到第三特征图；

30、通过所述第二注意力子模块，对所述第三特征图中的各元素进行加权处理，得到第四特征图，作为所述第二样本图像的第二图像特征。

31、可选的，所述识别结果输出模块包括：特征计算子模块和识别结果预测子模块；

32、所述通过所述图像识别模型的识别结果输出模块，对所述融合图像特征进行处理，得到所述第一样本图像的预测识别结果，包括：

33、通过所述特征计算子模块，对所述融合图像特征进行卷积处理，得到处本文档来自技高网...

【技术保护点】

1.一种图像识别模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述通过所述图像识别模型的第一特征提取模块对所述第一样本图像进行特征提取，得到所述第一样本图像的第一图像特征之前，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述通过所述图像识别模型的特征融合模块，对所述第一图像特征和所述第二图像特征进行特征融合，得到融合图像特征，包括：

4.根据权利要求3所述的方法，其特征在于，所述通过所述图像识别模型的特征融合模块，基于所述第一图像特征对应的注意力向量，以及所述第二图像特征对应的注意力向量，对所述第一图像特征和所述第二图像特征进行特征融合，得到融合图像特征，包括：

5.根据权利要求1所述的方法，其特征在于，所述获取用于对图像识别模型进行训练的训练样本，包括：

6.根据权利要求1所述的方法，其特征在于，所述第二特征提取模块包括：第一残差子模块、第一注意力子模块、第二残差子模块和第二注意力子模块；

7.根据权利要求1所述的方法，其特征在于，所述识别结果输出模块

8.一种图像识别方法，其特征在于，所述方法包括：

9.根据权利要求8所述的方法，其特征在于，在所述通过所述图像识别模型的特征融合模块，对预先存储的模板图像的图像特征和所述待检测图像的图像特征进行特征融合，得到融合图像特征之前，所述方法还包括：

10.一种图像识别模型训练装置，其特征在于，所述装置包括：

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

12.一种图像识别装置，其特征在于，所述装置包括：

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：

14.一种电子设备，其特征在于，包括：

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-7，或者权利要求8-9任一所述的方法。

...

【技术特征摘要】

1.一种图像识别模型训练方法，其特征在于，所述方法包括：

5.根据权利要求1所述的方法，其特征在于，所述获取用于对图像识别模型进行训练的训练样本，包括：

6.根据权利要求1所述的方法，其特征在于，所述第二特征提取模块包括：第一残差子模块、第一注意力子模块、第二残差子模块和第二注意力子...

【专利技术属性】
技术研发人员：李剑飞，朱加乐，邓志辉，
申请(专利权)人：杭州海康机器人股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人