图像识别方法、装置和存储介质及电子设备制造方法及图纸

技术编号：40840999 阅读：12 留言：0更新日期：2024-04-01 15:07

本申请公开了一种图像识别方法、装置和存储介质及电子设备。其中，该方法包括：获取目标特征图；对目标特征图执行通道维度的第一卷积操作，得到第一通道维度的第一特征图；对第一特征图执行空间维度的第二卷积操作，得到第二特征图；对第二特征图执行空间维度的第三卷积操作，得到第三特征图；对第三特征图执行通道维度的第四卷积操作，得到第二通道维度的第四特征图；利用第四特征图，对目标图像进行图像识别；还可应用在智慧交通、辅助驾驶等场景，可涉及图像识别、人工智能等技术。本申请解决了相关技术缺少兼顾精度和计算量的图像识别方式的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机领域，具体而言，涉及一种图像识别方法、装置和存储介质及电子设备。

技术介绍

1、随着卷积神经网络的发展，语义分割、深度估计、计数、姿态估计等图像识别的应用也得到较快的发展，这些应用在产品中落地时，需要具备较好的精度，以保证用户的体验效果；另一方面，当上述图像识别的应用被用于手机、车机、无人机、机器人等低算力平台中时，往往需要算法具有较少的计算量，以确保应用可以流畅运行，但精度和计算量之间存在冲突，也即越高的精度就需要越大的计算量，相关技术也并未提供一种兼顾精度和计算量的图像识别方式。因此，相关技术存在缺少兼顾精度和计算量的图像识别方式的问题。

2、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本申请实施例提供了一种图像识别方法、装置和存储介质及电子设备，以至少解决相关技术存在缺少兼顾精度和计算量的图像识别方式的技术问题。

2、根据本申请实施例的一个方面，提供了一种图像识别方法，包括：获取目标特征图，其中，上述目标特征图用于表示待识别的目标图像对应的特征；对上述目标特征图执行通道维度的第一卷积操作，得到第一通道维度的第一特征图，其中，上述第一通道维度小于上述目标特征图的初始通道维度；对上述第一特征图执行空间维度的第二卷积操作，得到第二特征图，其中，上述第二特征图的第一空间维度大于上述目标特征图的初始空间维度，上述第二特征图的空间分辨率大于上述目标特征图的初始分辨率；对上述第二特征图执行上述空间维度的第三卷积操作，得到第三特征图

3、根据本申请实施例的另一方面，还提供了一种图像识别装置，包括：获取单元，用于获取目标特征图，其中，上述目标特征图用于表示待识别的目标图像对应的特征；第一执行单元，用于对上述目标特征图执行通道维度的第一卷积操作，得到第一通道维度的第一特征图，其中，上述第一通道维度小于上述目标特征图的初始通道维度；第二执行单元，用于对上述第一特征图执行空间维度的第二卷积操作，得到第二特征图，其中，上述第二特征图的第一空间维度大于上述目标特征图的初始空间维度，上述第二特征图的空间分辨率大于上述目标特征图的初始分辨率；第三执行单元，用于对上述第二特征图执行上述空间维度的第三卷积操作，得到第三特征图，其中，上述第三特征图的第二空间维度等于上述初始空间维度，上述第三特征图的空间分辨率等于上述第二特征图的空间分辨率；第四执行单元，用于对上述第三特征图执行通道维度的第四卷积操作，得到第二通道维度的第四特征图，其中，上述第二通道维度等于上述初始通道维度；识别单元，用于利用上述第四特征图，对上述目标图像进行图像识别。

4、作为一种可选的方案，上述第二执行单元包括：第一执行装置，用于对上述第一特征图执行高维度和宽维度的上行卷积操作，得到第一输出特征图，其中，上述第一输出特征图的高维度大于上述目标特征图的初始高维度，上述第一输出特征图的宽维度大于上述目标特征图的初始宽维度，上述第一输出特征图的空间分辨率大于上述初始分辨率；第一获取装置，用于基于上述第一输出特征图，获取上述第二特征图；上述第三执行单元包括：第二执行装置，用于对上述第二特征图执行上述高维度和上述宽维度的下行卷积操作，得到第二输出特征图，其中，上述第二输出特征图的高维度等于上述初始高维度，上述第二输出特征图的宽维度等于上述初始宽维度，上述第二输出特征图的空间分辨率等于上述第一输出特征图的空间分辨率；第二获取装置，用于基于上述第二输出特征图，获取上述第三特征图。

5、作为一种可选的方案，上述第一执行装置包括：第一执行子装置，用于对上述第一特征图执行上述高维度的第一目标卷积操作，得到第一目标特征图；第二执行子装置，用于对上述第一目标特征图执行上述宽维度的第二目标卷积操作，得到第二目标特征图；或，第三执行子装置，用于对上述第一特征图执行上述宽维度的第二目标卷积操作，得到第三目标特征图；第四执行子装置，用于对上述第三目标特征图执行上述高维度的第一目标卷积操作，得到第四目标特征图；上述第一获取装置包括：第一获取子装置，用于在上述第一输出特征图包括上述第二目标特征图的情况下，将上述第二目标特征图确定为上述第二特征图；或，第二获取子装置，用于在上述第一输出特征图包括上述第四目标特征图的情况下，将上述第四目标特征图确定为上述第二特征图。

6、作为一种可选的方案，上述第一执行装置包括：第一执行子装置，用于对上述第一特征图执行上述高维度的第一目标卷积操作，得到第一目标特征图；以及，第三执行子装置，用于对上述第一特征图执行上述宽维度的第二目标卷积操作，得到第三目标特征图；上述第一获取装置包括：第三获取子装置，用于将上述第一目标特征图和上述第三目标特征图确定为上述第二特征图；或，第四获取子装置，用于整合上述第一目标特征图和上述第三目标特征图，得到上述第二特征图。

7、作为一种可选的方案，上述第二执行装置包括：第五执行子装置，用于在上述将上述第一目标特征图和上述第三目标特征图确定为上述第二特征图之后，对上述第一目标特征图执行上述高维度的第一下行卷积操作，得到第一输出子特征图；以及，第六执行子装置，用于在上述将上述第一目标特征图和上述第三目标特征图确定为上述第二特征图之后，对上述第三目标特征图执行上述宽维度的第二下行卷积操作，得到第二输出子特征图；第五获取子装置，用于在上述将上述第一目标特征图和上述第三目标特征图确定为上述第二特征图之后，整合上述第一输出子特征图以及上述第二输出子特征图，得到上述第二输出特征图。

8、作为一种可选的方案，上述装置还包括：第三获取装置，用于在上述获取目标特征图之前，获取待识别的上述目标图像；第四获取装置，用于在上述获取目标特征图之前，将上述目标图像输入下采样模块，得到上述目标图像对应的底层特征；第五获取装置，用于在上述获取目标特征图之前，将上述底层特征输入残差卷积模块，得到上述目标图像对应的全局高层语义特征；第六获取装置，用于在上述获取目标特征图之前，基于上述全局高层语义特征，获取上述目标特征图。

9、作为一种可选的方案，上述装置还包括：第七获取装置，用于在上述获取目标特征图之前，获取目标终端采集到的、多张连续的待识别图像，其中，上述目标终端的计算能力值小于或等于预设阈值；第八获取装置，用于在上述获取目标特征图之前，响应于上述目标终端触发的任务执行请求，从上述多张连续的待识别图像确定出上述目标图像，其中，上述任务执行请求用于请求上述目标终端执行密集估计视觉感知任务，上述密集估计视觉感知任务为对上述目标图像进行图像识别、以得到密集估计结果的任务。

10、根据本申请实施例的又一个方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或本文档来自技高网...

【技术保护点】

1.一种图像识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求2所述的方法，其特征在于，

4.根据权利要求2所述的方法，其特征在于，

5.根据权利要求4所述的方法，其特征在于，在所述将所述第一目标特征图和所述第三目标特征图确定为所述第二特征图之后，所述对所述第二特征图执行所述高维度和所述宽维度的下行卷积操作，得到第二输出特征图，包括：

6.根据权利要求1至5中任一项所述的方法，其特征在于，在所述获取目标特征图之前，所述方法还包括：

7.根据权利要求1至5中任一项所述的方法，其特征在于，在所述获取目标特征图之前，所述方法还包括：

8.一种图像识别装置，其特征在于，包括：

9.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序可被终端设备或计算机运行时执行所述权利要求1至7任一项中所述的方法。

10.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求

11.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。

...

【技术特征摘要】

1.一种图像识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求2所述的方法，其特征在于，

4.根据权利要求2所述的方法，其特征在于，

6.根据权利要求1至5中任一项所述的方法，其特征在于，在所述获取目标特征图之前，所述方法还包括：

7.根据权利要求1至5中任一项所述的方法，其特征在于...

【专利技术属性】
技术研发人员：李德辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人