一种图像识别方法、图像识别模型训练方法及装置制造方法及图纸

技术编号：39932943 阅读：18 留言：0更新日期：2024-01-08 21:57

本申请实施例提供了一种图像识别方法、图像识别模型训练方法及装置，涉及图像处理技术领域。本申请实施例的技术方案包括：获取待识别图像，并将待识别图像拆分为预设尺寸的多个图像块。然后利用预先训练的图像识别模型分别对每个图像块基于自注意力机制进行特征提取，得到各图像块的第一加权特征图，再利用图像识别模型对各第一加权特征图进行分组，并分别对每组第一加权特征图基于自注意力机制进行特征提取，得到各组第一加权特征图的第二加权特征图。之后利用图像识别模型基于各第二加权特征图，确定对待识别图像包括的指定对象的识别结果。从而实现了提高图像识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像处理，特别是涉及一种图像识别方法、图像识别模型训练方法及装置。

技术介绍

1、对图像采用自注意力机制进行图像识别，能够利用图像中特征之间的相关性，从而获取更准确地图像识别结果。例如图像识别结果包括：图像中是否包含指定对象、图像中的指定对象的类型和/或指定对象在图像中的位置等。具体实现过程为：将待识别的图像划分为多个图像块(patches)，然后在每个图像块内使用自注意力机制，从而获得每个图像块内的各特征之间的相关性，并以此得到图识别结果。

2、但仅利用每个图像块内的各特征之间的相关性得到的图像识别结果仍不够准确。

技术实现思路

1、本申请实施例的目的在于提供一种图像识别方法、图像识别模型训练方法及装置，以实现提高图像识别的准确性。具体技术方案如下：

2、在本申请实施例的第一方面，首先提供了一种图像识别方法，所述方法包括：

3、获取待识别图像，并将所述待识别图像拆分为预设尺寸的多个图像块；

4、利用预先训练的图像识别模型分别对每个...

【技术保护点】

1.一种图像识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述图像识别模型包括第一注意力层；所述利用预先训练的图像识别模型分别对每个图像块基于自注意力机制进行特征提取，得到各图像块的第一加权特征图，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一注意力层包括第一变换子层；所述利用所述第一注意力层分别基于每个图像块的图像空间加权特征图，得到各图像块的第一加权特征图，包括：

4.根据权利要求1所述的方法，其特征在于，所述图像识别模型包括第一卷积层和第一聚类层；所述利用所述图像识别模型对各第一加权特征图进行分组，包...

【技术特征摘要】

1.一种图像识别方法，其特征在于，所述方法包括：

4.根据权利要求1所述的方法，其特征在于，所述图像识别模型包括第一卷积层和第一聚类层；所述利用所述图像识别模型对各第一加权特征图进行分组，包括：

5.根据权利要求4所述的方法，其特征在于，所述利用所述第一聚类层对各第一卷积特征图进行聚类，得到对各第一卷积特征图的分组结果，包括：

6.根据权利要求4所述的方法，其特征在于，所述图像识别模型还包括第二注意力层；所述利用所述...

【专利技术属性】
技术研发人员：王发发，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人