图像数据处理方法、装置和存储介质制造方法及图纸

技术编号：40193931 阅读：34 留言：0更新日期：2024-01-26 23:56

本申请涉及一种图像数据处理方法、装置和存储介质。该方法包括：通过第一映射处理，将图像数据映射至第一特征图像数据，该第一特征图像数据的尺寸小于图像数据；对第一特征图像数据的通道特征和/或空间特征进行提取，确定第二特征图像数据；对所述第二特征图像数据的尺寸进行放大，确定第三特征图像数据，该第三特征图像数据的尺寸大于第一特征图像数据；对第三特征图像数据进行归一化处理，确定图像数据的预测结果。根据本申请实施例，可以在不引入新算子的情况下，大大减少了模型的计算量和参数量，使得模型能够部署于端侧，同时能够在图像数据处理中保证模型的准确率，加快模型的运算速度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种图像数据处理方法、装置和存储介质。

技术介绍

1、随着人工智能(artificial intelligence，ai)技术的不断发展，其中在计算机视觉领域，深度神经网络模型在自动驾驶、城市管理、智慧农业等应用中展现出了巨大的作用，通过深度神经网络模型可以实现对图像等视觉数据的内容理解。

2、然而，用于视觉领域的深度神经网络模型通常需要较大的计算量和参数量，实际运算速度较慢，使得模型难以在端侧进行部署。因此，如何在保证模型精度的情况下减少模型的计算量和参数量，加快模型运算速度，成为了亟需解决的问题。

技术实现思路

1、有鉴于此，提出了一种图像数据处理方法、装置和存储介质。

2、第一方面，本申请的实施例提供了一种图像数据处理方法。该方法包括：

3、通过第一映射处理，将图像数据映射至第一特征图像数据，该第一特征图像数据的尺寸小于图像数据；

4、对第一特征图像数据的通道特征和/或空间特征进行提取，确定第二特征图像数据；

<本文档来自技高网...

【技术保护点】

1.一种图像数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述第二特征图像数据的尺寸进行放大，确定第三特征图像数据，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述第三特征图像数据被分为一个或多个预定区域，每个预定区域内包括N个像素点，N为大于2的正整数，所述对所述第二特征图像数据的尺寸进行放大，确定第三特征图像数据，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述第一映射处理包括线性或非线性映射处理，所述第二映射处理包括线性或非线性映射处理。

5.根据权利要求4所述的方法，其...

【技术特征摘要】

1.一种图像数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述第二特征图像数据的尺寸进行放大，确定第三特征图像数据，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述第三特征图像数据被分为一个或多个预定区域，每个预定区域内包括n个像素点，n为大于2的正整数，所述对所述第二特征图像数据的尺寸进行放大，确定第三特征图像数据，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述第一映射处理包括线性或非线性映射处理，所述第二映射处理包括线性或非线性映射处理。

5.根据权利要求4所述的方法，其特征在于，所述通过第一映射处理，将图像数据映射至第一特征图像数据，包括：

6.根据权利要求4所述的方法，其特征在于，所述通过第二映射处理，将所述第二特征图像数据映射至第四特征图像数据，包括：

7.根据权利要求1-6任一项所述的方法，其特征在于，所述对所述第一特征图像数据的通道特征和/或空间特征进行提取，确定第二特征图像数据，包括：

8.根据权利要求7所述的方法，其特征在于，所述第二特征图像数据包括第二空间特征图像数据和第二通道特征图像数据，所述利用多层感知机mlp对所述第一特征图像数据的通道特征和/或空间特征进行提取，确定所述第二特征图像数据，包括：

9.根据权利要求1-8任一项所述的方法，其特征在于，所述方法用于神经网络模型的一个或多个中间层。

10.一种图像数据处理装置，其特征在于，所述装置包括：

11.根据权利要求10所述的装置，其特征在于，所述第二确定模块，用于...

【专利技术属性】
技术研发人员：朱铭健，韩凯，郭健元，胡海林，王云鹤，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人