一种图像处理方法、装置和介质制造方法及图纸

技术编号：36538577 阅读：18 留言：0更新日期：2023-02-01 16:30

本公开一个或多个实施例提供一种图像处理方法、装置和介质，其中，该方法包括：对待处理的目标图像进行卷积处理得到特征图；将所述特征图输入ViT，依次通过所述ViT中的编码块对特征图进行特征提取，直至得到最后一个编码块输出的特征图；编码块对输入的特征图进行特征提取，包括：对输入所述编码块的特征图进行卷积运算，得到局部特征；对输入编码块的特征图进行下采样处理，对所述下采样处理之后的特征图通过自注意力机制模块进行全局特征提取，得到全局特征；将所述局部特征和所述全局特征进行融合，得到第一融合特征；基于所述第一融合特征，得到所述编码块输出的特征图，所述输出的特征图用于表示输入编码块的特征图的图像特征。特征。特征。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像处理方法、装置和介质

[0001]本说明书一个或多个实施例涉及计算机视觉技术，尤其涉及一种图像处理方法、装置和介质。

技术介绍

[0002]Transformer框架首次被提出是用于自然语言处理，由于其使用自注意力机制(而非局部卷积)来捕捉全局的上下文信息，被证明是一种强大的特征提取范式，在机器翻译任务上具有卓越的性能。Vision Transformer(ViT)是Transformer用于计算机视觉任务的一项开创性工作，它将标准Transformer中的编码块应用于视觉任务，将输入图像划分为块，并将图像块类比成自然语言处理任务中的一个单词。
[0003]ViT的设计在实现各种视觉任务的更高性能方面显示出巨大的前景，在图像处理上显示出较高的性能。但是，ViT的计算复杂度较高，计算效率较低，这就使得工程实践中应用ViT时耗费的资源较大，处理效率不高。

技术实现思路

[0004]有鉴于此，本说明书一个或多个实施例提供一种图像处理方法、装置和介质。
[0005]为实现上述目的，本说明书一个或多个实施例提供技术方案如下：
[0006]根据本说明书一个或多个实施例的第一方面，提出了一种图像处理方法，该方法包括：
[0007]对待处理的目标图像进行卷积处理得到特征图；
[0008]将所述特征图输入ViT，依次通过所述ViT中的编码块对所述特征图进行特征提取，直至得到最后一个编码块输出的特征图；
[0009]其中，所述ViT中的编码块对输入的特征图进行特征提...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法，其特征在于，所述方法包括：对待处理的目标图像进行卷积处理得到特征图；将所述特征图输入ViT，依次通过所述ViT中的编码块对所述特征图进行特征提取，直至得到最后一个编码块输出的特征图；其中，所述ViT中的编码块对输入的特征图进行特征提取，具体包括：对输入所述编码块的特征图进行卷积运算，得到局部特征；对输入所述编码块的特征图进行下采样处理，对所述下采样处理之后的特征图通过自注意力机制模块进行全局特征提取，得到全局特征；将所述局部特征和所述全局特征进行融合，得到第一融合特征；基于所述第一融合特征，得到所述编码块输出的特征图，所述输出的特征图用于表示输入所述编码块的特征图的图像特征。2.根据权利要求1所述的方法，其特征在于，所述ViT中的编码块对输入的特征图进行特征提取，还包括；对输入所述编码块的特征图进行特征补偿处理，得到补偿特征；所述对所述下采样处理之后的特征图通过自注意力机制模块进行全局特征提取，得到全局特征，包括：将所述补偿特征与所述下采样处理之后的特征图进行融合，得到第二融合特征；通过自注意力机制模块对所述第二融合特征进行处理，得到注意力输出特征；融合所述注意力输出特征和所述第二融合特征，得到所述全局特征。3.根据权利要求2所述的方法，其特征在于，所述对输入所述编码块的特征图进行特征补偿处理，得到补偿特征，包括：对所述特征图进行最大池化处理，得到所述补偿特征。4.根据权利要求1所述的方法，其特征在于，所述基于所述第一融合特征，得到所述编码块输出的特征图，包括：对所述第一融合特征，通过所述编码块中的前馈网络进行特征处理，得到所述编码块输出的特征图。5.根据权利要求1
‑
4任一项所述的方法，其特征在于，所述将所述局部特征和所述全局特征进行融合，得到第一融合特征，包括：对所述局部特征和全局特征，分别通过注意力机制模块进行特征处理，得到局部特征对应的第一融合权重、以及全局特征对应的第二融合权重；根据所述第一融合权重和第二融合权重，对所述局部特征和全局特征进行融合，得到所述第一融合特征。6.根据权利要求5所述的方法，其特征在于，所述对所述局部特征和全局特征分别通过注意力机制模块进行特...

【专利技术属性】
技术研发人员：高莉，聂栋，任小枫，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人