一种目标识别与检测的人工智能模型方法技术

技术编号：40229069 阅读：4 留言：0更新日期：2024-02-02 22:31

本发明专利技术公开了一种目标识别与检测的人工智能模型方法，包括以下步骤：首先进行源图像的Grad‑CAM显著图生成；其次依据源图像的Grad‑CAM显著图对源图像生成掩码,再依据源图像的掩码提取源图像的前景信息；采用Grad‑CAM方法生成显著图，将源图像提取的前景信息作为补丁，在目标图Grad‑CAM区域进行合成后生成图像。同时分别对增强图像中源图像区域和目标图像区域中的语义百分比图进行求和，作为增强图像中源图像和目标图像的新的语义标签比例，而非直接利用增强图像中源图像和目标图像的面积比。本发明专利技术提出的基于显著图引导的细粒度数据增强方法，可以通过Grad‑CAM显著图的引导，在源图像中选择前景用于生成增强图像，避免引入无效区域，并可以在一定程度上提升性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能视觉领域，尤其涉及一种目标识别与检测的人工智能模型方法。

技术介绍

0、技术背景

1、在人工智能的发展过程中，计算机视觉已经成为了一个相当重要的分支，尤其是图像识别与分类技术。计算机视觉图像识别任务是指利用计算机算法来识别和分类图像中的物体、场景、人脸等。然而，图像识别任务也面临着一些挑战，其中之一就是数据稀缺。数据稀缺指的是在给定任务和类别下可用的标记数据量相对较少或不足的情况。当可用的数据量很少时，模型容易过度拟合训练数据，过度记忆噪声或样本的特定特征。会导致模型在新样本上表现不佳，缺乏鲁棒性。数据稀缺也会导致标注困难。标记大规模数据集通常需要大量的时间、人力和专业知识。对于某些特定领域或细粒度任务，由于特定类别的标记复杂性，很难获得大规模的准确标记数据。

2、现有技术中，在深度学习的推动下，细粒度图像分类已经取得了一定的进展，但由于其分类的复杂性，性能仍然远远不能满足实际应用的需求；其复杂性主要源于两个方面：一方面，细粒度类别之间的差异通常相对微小，可能仅限于特定的形状、纹理或颜色等细微差异；另一方面，同一类别内的样本可能存在大量的形态、姿态、光照、尺度等变化，这种类内变异性进一步增加了细粒度图像分类的难度。基于上述前提，提出基于显著图引导的细粒度数据增强方法，数据增强可有效解决上述问题。数据增强是通过对现有数据进行变换或扩充来增加样本数量和多样性。例如，可以进行平移、旋转、缩放、剪切等操作来生成新的训练样本，增加模型的鲁棒性。然而，传统的数据增强方法虽然能够扩充数据集，但往往

3、因此，有必要提供一种目标识别与检测的人工智能模型方法来解决上述问题。在细粒度图像分类问题中，同一类别的样本之间的差异通常比较小，而不同类别的样本之间的差异往往体现在一些细微的特征上，这使得细粒度分类问题比较困难。而混合图像数据增强方法，可以在一定程度上弥补这种差异，提高模型在细粒度分类问题上的性能。

技术实现思路

1、本专利技术的目的在于提供一种目标识别与检测的人工智能模型方法，从而克服上述现有技术中细类度图像分类的难度很难获得大规模的准确标记数据、数据集的多样性，提高模型的泛化能力的不足，

2、为解决上述技术问题，本专利技术提供如下技术方案：一种目标识别与检测的人工智能模型方法，有效增强模型校准的样本置信度。首先，输入源图像，采用grad-cam方法生成显著图；其次，依据源图像的grad-cam显著图对源图像生成掩码；第三依据源图像的掩码提取源图像的前景信息；针对目标图像，采用grad-cam方法生成显著图，将源图像提取的前景信息作为补丁，在目标图grad-cam区域进行合成，完成增强图像的生成；最后，通过生成的grad-cam显著图，计算新生成的增强图像中源图像和目标图像的语义占比，最终作为增强图像的标签。由于显著图可以帮助我们理解人类视觉系统在观察图像时所关注的区域，并提供有关图像中显著性区域的定位和分割信息；该方法通过grad-cam显著图的引导，在源图像中选择前景用于生成增强图像，避免引入背景区域干扰。通过grad-cam评估新生成增强图像的标签，使得增强图像与对应的标签更加匹配。

3、本专利技术是通过以下技术方案来实现的：一种目标识别与检测的人工智能模型方法，包括以下步骤：

4、步骤一：输入源图像，采用轻量级方法grad-cam生成显著图；

5、步骤二：依据源图像的grad-cam显著图对源图像生成掩码；

6、步骤三：依据源图像的掩码提取源图像的前景信息；

7、步骤四：输入目标图像，采用轻量级方法grad-cam生成显著图；

8、步骤五：将源图像提取的前景信息作为补丁，在目标图grad-cam区域进行合成；

9、步骤六：计算最终的增强图像的新标签。

10、作为本专利技术所述的目标识别与检测的人工智能模型方法的一种优选方案定位源图像及目标图像中具有显著性语音含义的前景区域，以此为基础，通过源图像及目标图像显著语义信息替换实现数据增强；所设计的数据增强方法能精准定位有效前景信息实现数据多样化拓展，以此提升数据增强方法鲁棒性。

11、作为本专利技术所述的目标识别与检测的人工智能模型方法的一种优选方案所述步骤一中，为了获得类别c的grad-cam显著图首先计算第k个特征图对类别c的权重

12、

13、其中，z为特征图的像素个数，表示第k个特征图的权重，yc表示类别c的得分梯度，ak为卷积层最后一层特征映射后第k个通道的特征图，表示ak中第(i，j)个特征点；

14、最终的grad-cam显著图表示如下：

15、

16、其中，φ(·)表示在特征图维度上进行上采样以匹配输入图像大小的操作，表示源图像第k个显著性图，relu为激活函数，s代表的是源图像。

17、作为本专利技术所述目标识别与检测的人工智能模型方法的一种优选方案，所述步骤二中，依据源图像的显著图生成掩码。对显著图进行阈值化处理，根据显著图中像素的强度来选择阈值，生成二进制的掩码。

18、作为本专利技术所述的目标识别与检测的人工智能模型方法的一种优选方案所述步骤三中，依据源图像的掩码提取源图像的前景信息，对于源图像is的显著图检测可以表示为：

19、

20、其中，代表源图像is的显著图，fgrad-cam(·)代表grad-cam显著图生成模型；在显着图中搜索具有最大显著值的像素；m表示掩码矩阵，可以通过以下公式计算：

21、

22、其中，argmax(·)代表取最大值的参数函数。

23、作为本专利技术所述的目标识别与检测的人工智能模型方法的一种优选方案所述步骤四中，输入目标图像，采用轻量级方法grad-cam生成显著图；最终的grad-cam显著图表示如下：

24、

25、其中，φ(·)表示在特征图维度上进行上采样以匹配输入图像大小的操作，表示第k个特征图的权重，表示目标图像第k个显著性图，ak为最后一层卷积层的特征映射，t代表的是目标图像。

26、作为本专利技术所述的目标识别与检测的人工智能模型方法的一种优选方案所述步骤五中，将源图像提取的前景信息作为补丁，在目标图grad-cam区域进行合成，两个图像的混合可以定义为：

27、imix＝m⊙is+(1-m)⊙it (6)

28、其中，imix表示混合图像，m∈{0，1}w×h表示二进制掩码，⊙表示逐元素乘法。m∈{0，1}w×h

29、作为本专利技术所述的目标识别与检测的人工智能模型方法的一种优选方案所述本文档来自技高网...

【技术保护点】

1.一种目标识别与检测的人工智能模型方法，其特征在于：应用于细粒度图像分类的研究；通过基于显著图的引导选择源图像前景用于混合，避免引入无效区域；

2.根据权利要求1所述的目标识别与检测的人工智能模型方法，其特征在于，定位源图像及目标图像中具有语音含义的前景区域，以此为基础，通过源图像及目标图像显著语义信息替换实现数据增强；所设计的数据增强方法能定位前景信息实现数据多样化拓展，以此提升数据增强方法鲁棒性。

3.根据权利要求1所述的目标识别与检测的人工智能模型方法，其特征在于，所述步骤一采用轻量级的Grad-CAM方法生成显著图可以表示为如下形式：

4.根据权利要求3所述的目标识别与检测的人工智能模型方法，其特征在于，所述步骤二依据源图像的显著图生成掩码；对显著图进行阈值化处理，根据显著图中像素的强度来选择一个合适的阈值，生成二进制的掩码。

5.根据权利要求4所述的目标识别与检测的人工智能模型方法，其特征在于，所述步骤三依据源图像的掩码提取源图像的前景信息；

6.根据权利要求1所述的目标识别与检测的人工智能模型方法，其特征在

7.根据权利要求1所述的目标识别与检测的人工智能模型方法，其特征在于，步骤五中将源图像提取的前景信息作为补丁，在目标图Grad-CAM区域进行合成；

8.根据权利要求4所述的目标识别与检测的人工智能模型方法，其特征在于，所述步骤六中计算最终的增强图像的新标签；

...

【技术特征摘要】

3.根据权利要求1所述的目标识别与检测的人工智能模型方法，其特征在于，所述步骤一采用轻量级的grad-cam方法生成显著图可以表示为如下形式：

4.根据权利要求3所述的目标识别与检测的人工智能模型方法，其特征在于，所述步骤二依据源图...

【专利技术属性】
技术研发人员：熊芳强，朱皓能，朱纪源，
申请(专利权)人：江苏东蓝信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人