基于随机游走核自注意力机制的图像处理方法及装置制造方法及图纸

技术编号：36805912 阅读：20 留言：0更新日期：2023-03-09 00:14

本说明书实施例提供基于随机游走核自注意力机制的图像处理方法及装置，其中所述基于随机游走核自注意力机制的图像处理方法包括：基于目标图像处理任务获得待处理图像；将所述待处理图像输入至图像处理模型进行图像处理，其中，所述图像处理模型是基于随机游走核自注意力机制的神经网络模型；获得所述图像处理模型输出的所述待处理图像对应的图像处理结果。通过本方法使得Transformer结构的图像处理模型可以处理更长长度的图像序列，进而使得图像处理模型可以处理更精细力度的图像，使得图像处理模型具有更高的泛化行。处理模型具有更高的泛化行。处理模型具有更高的泛化行。

全部详细技术资料下载

【技术实现步骤摘要】
基于随机游走核自注意力机制的图像处理方法及装置

[0001]本说明书实施例涉及图像处理
，特别涉及基于随机游走核自注意力机制的图像处理方法。

技术介绍

[0002]在图像分类、图像分割、目标检测等计算机视觉任务中，Transformer结构均取得了较好的性能，在图像处理任务中，通常是将图像分成多个小的图像块，然后将多个图像块排列成一个序列作为模型的输入，多个图像块提供了更高细粒度的图像，同时也导致了更长的输入序列，这使得Transformer结构中的自注意力机制的计算复杂度和空间复杂度在训练和应用时都更加复杂。
[0003]因此，需要研究一种泛化行更好，且更加有效针对视觉任务的自注意力机制和图像处理模型，从而提高Transformer结构的处理效率。

技术实现思路

[0004]有鉴于此，本说明书实施例提供了基于随机游走核自注意力机制的图像处理方法。本说明书一个或者多个实施例同时涉及基于随机游走核自注意力机制的图像处理装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面，提供了一种基于随机游走核自注意力机制的图像处理方法，包括：
[0006]基于目标图像处理任务获得待处理图像；
[0007]将所述待处理图像输入至图像处理模型进行图像处理，其中，所述图像处理模型是基于随机游走核自注意力机制的神经网络模型；
[0008]获得所述图像处理模型输出的所述待处理图像对应的图像处理结果。...

【技术保护点】

【技术特征摘要】
1.一种基于随机游走核自注意力机制的图像处理方法，包括：基于目标图像处理任务获得待处理图像；将所述待处理图像输入至图像处理模型进行图像处理，其中，所述图像处理模型是基于随机游走核自注意力机制的神经网络模型；获得所述图像处理模型输出的所述待处理图像对应的图像处理结果。2.如权利要求1所述的方法，所述图像处理模型包括嵌入层、编码器、任务处理模块；将所述待处理图像输入至图像处理模型进行图像处理，包括：将所述待处理图像分割为多个待处理子图像；将所述多个待处理子图像分别输入至所述嵌入层，获得每个待处理子图像对应的待处理子图像编码矩阵；将每个待处理子图像编码矩阵输入至所述编码器，获得图像编码矩阵，其中，所述编码器包括基于随机游走核自注意力机制的编码层；将所述图像编码矩阵输入至所述任务处理模块，获得所述任务处理模块输出的图像处理结果。3.如权利要求2所述的方法，所述编码器包括n个顺次连接的编码层，每个编码层包括基于随机游走核自注意力层和前馈神经网络层，其中，n为大于等于2的正整数；对于任一编码层，包括：接收待处理子图像特征矩阵；将所述待处理子图像特征矩阵输入至基于随机游走核自注意力层，获得第一子层矩阵；将所述第一子层矩阵输入至前馈神经网络层，获得子图像特征矩阵。4.如权利要求3所述的方法，对于第1个编码层，接收待处理子图像特征矩阵，包括：接收所述子图像待编码矩阵；对于除第1个编码层的其他编码层，接收待处理子图像特征矩阵，包括：接收上一个编码层输出的子图像特征矩阵。5.如权利要求3所述的方法，将所述待处理子图像特征矩阵输入至基于随机游走核自注意力层，获得第一子层矩阵，包括：对所述待处理子图像特征矩阵进行线性转换得到键矩阵、查询矩阵和值矩阵，并确定游走核矩阵；根据所述查询矩阵和所述游走核矩阵获得第...

【专利技术属性】
技术研发人员：张轶飞，郑可成，沈宇军，刘宇，黄梁华，阳展韬，张晗，赵德丽，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人