图像处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34964974 阅读:33 留言:0更新日期:2022-09-17 12:45
本发明专利技术涉及计算机视觉技术领域,提供一种图像处理方法、装置、电子设备及存储介质,其中方法包括:获取待处理图像;将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征;基于所述图像特征,对所述待处理图像进行图像处理;所述特征提取模型包括正交自注意力模块,所述正交自注意力模块用于将所述待处理图像的令牌投影到正交空间进行自注意力转换。本发明专利技术提供的方法、装置、电子设备及存储介质,特征提取模型中的正交自注意力模块,可以将待处理图像的令牌投影到正交空间进行自注意力转换,降低了自注意力转换的复杂度,提高了图像特征的提取质量,因此保证了图像处理的有效性。像处理的有效性。像处理的有效性。

【技术实现步骤摘要】
图像处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机视觉
,尤其涉及一种图像处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能的快速发展,研究者们成功地将Transformer网络中的自注意力机制应用于图像处理中的图像特征提取中。
[0003]然而,现有的自注意力机制存在计算复杂度高的问题,针对这一问题,现有技术中通过减少令牌数量,降低了全局自注意力机制的计算复杂度,但伴随着丢失细粒度图像特征信息的问题。
[0004]因此,如何在降低图像特征提取的复杂度的同时,又能不丢失细粒度图像特征信息的前提下,进行图像特征提取,是图像处理
亟待解决的问题。

技术实现思路

[0005]本专利技术提供一种图像处理方法、装置、电子设备及存储介质,用以解决现有技术中进行图像特征提取时复杂度高的缺陷。
[0006]本专利技术提供一种图像处理方法,包括:获取待处理图像;将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征;基于所述图像特征,对所述待处理图像进行图像处理;所述特征提取模型包括正交自注意力模块,所述正交自注意力模块用于将所述待处理图像的令牌投影到正交空间进行自注意力转换。
[0007]根据本专利技术提供的一种图像处理方法,所述特征提取模型包括级联的多个特征提取模块,所述多个特征提取模块包括正交特征提取模块,所述正交特征提取模块包括级联的所述正交自注意力模块和前向传播网络;所述将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征,包括:将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,所述上一令牌是所述当前的特征提取模块之前的特征提取模块输出的;将最尾的特征提取模块输出的令牌作为所述图像特征。
[0008]根据本专利技术提供的一种图像处理方法,在所述当前的特征提取模块为正交特征提取模块的情况下,所述将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,包括:将所述上一令牌输入到当前的特征提取模块的正交自注意力模块,由所述正交自
注意力模块将所述上一令牌进行正交化,得到正交令牌,再对所述正交令牌进行多头注意力计算,将计算所得的正交注意力特征进行逆正交化,并对逆正交化后的注意力特征与所述上一令牌进行融合,得到所述正交自注意力模块输出的当前自注意力特征;将所述当前自注意力特征输入到当前的特征提取模块的前向传播网络,得到所述前向传播网络输出的当前令牌。
[0009]根据本专利技术提供的一种图像处理方法,所述多个特征提取模块还包括窗口特征提取模块,所述窗口特征提取模块包括级联的窗口自注意力模块和前向传播网络,所述窗口自注意力模块用于将所述待处理图像的令牌以滑动窗口的形式划分后进行自注意力转换。
[0010]根据本专利技术提供的一种图像处理方法,在所述当前的特征提取模块为窗口特征提取模块的情况下,所述将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,包括:将所述上一令牌输入到当前的特征提取模块的窗口自注意力模块,由所述窗口自注意力模块将所述上一令牌进行窗口划分,得到窗口令牌,再对所述窗口令牌进行多头注意力计算,将计算所得的窗口注意力特征进行窗口合并,并对窗口合并后的注意力特征与所述上一令牌进行融合,得到所述窗口自注意力模块输出的当前自注意力特征;将所述当前自注意力特征输入到当前的特征提取模块的前向传播网络,得到所述前向传播网络输出的当前令牌。
[0011]根据本专利技术提供的一种图像处理方法,所述前向传播网络包括第一卷积层,所述第一卷积层用于提取位置信息。
[0012]根据本专利技术提供的一种图像处理方法,所述前向传播网络包括第一分支和第二分支,所述第一分支和所述第二分支的输入相同,所述第一分支和所述第二分支的输出相加作为所述前向传播网络的输出;所述第一分支包括顺次连接的第一归一化层、第一全连接层、激活层、所述第一卷积层和第二全连接层;在所述第一卷积层的卷积核步长为1的情况下,所述第二分支的输入与输出相同;在所述第一卷积层的卷积核步长大于1的情况下,所述第二分支包括顺次连接的第二归一化层和第二卷积层,所述第二卷积层的卷积核步长与所述第一卷积层的卷积核步长相同。
[0013]本专利技术还提供一种图像处理装置,包括:获取单元,用于获取待处理图像;特征提取单元,用于将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征;图像处理单元,用于基于所述图像特征,对所述待处理图像进行图像处理;所述特征提取模型包括正交自注意力模块,所述正交自注意力模块用于将所述待处理图像的令牌投影到正交空间进行自注意力转换。
[0014]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述图像处理方法。
[0015]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算
机程序被处理器执行时实现如上述任一种所述图像处理方法。
[0016]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述图像处理方法。
[0017]本专利技术提供的图像处理方法、装置、电子设备及存储介质,特征提取模型中的正交自注意力模块,可以将待处理图像的令牌投影到正交空间进行自注意力转换,降低了自注意力转换的复杂度,提高了图像特征的提取质量,因此保证了图像处理的有效性。
附图说明
[0018]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是本专利技术提供的图像处理方法的流程示意图;图2是本专利技术提供的正交特征提取模块的结构示意图;图3是本专利技术提供的卷积编码器的结构示意图;图4是本专利技术提供的正交自注意力模块进行自注意力转换的流程示意图;图5是本专利技术提供的窗口特征提取模块的结构示意图;图6是本专利技术提供的窗口特征提取模块进行窗口自注意力转换的流程示意图;图7是本专利技术提供的第一卷积层的卷积核步长大于1的情况下,前向传播网络的结构示意图;图8是本专利技术提供的第一卷积层的卷积核步长为1的情况下,前向传播网络的结构示意图;图9是本专利技术提供的特征提取模型的结构示意图;图10是本专利技术提供的图像处理装置的结构示意图;图11是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0020]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获取待处理图像;将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征;基于所述图像特征,对所述待处理图像进行图像处理;所述特征提取模型包括正交自注意力模块,所述正交自注意力模块用于将所述待处理图像的令牌投影到正交空间进行自注意力转换。2.根据权利要求1所述的图像处理方法,其特征在于,所述特征提取模型包括级联的多个特征提取模块,所述多个特征提取模块包括正交特征提取模块,所述正交特征提取模块包括级联的所述正交自注意力模块和前向传播网络;所述将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征,包括:将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,所述上一令牌是所述当前的特征提取模块之前的特征提取模块输出的;将最尾的特征提取模块输出的令牌作为所述图像特征。3.根据权利要求2所述的图像处理方法,其特征在于,在所述当前的特征提取模块为正交特征提取模块的情况下,所述将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,包括:将所述上一令牌输入到当前的特征提取模块的正交自注意力模块,由所述正交自注意力模块将所述上一令牌进行正交化,得到正交令牌,再对所述正交令牌进行多头注意力计算,将计算所得的正交注意力特征进行逆正交化,并对逆正交化后的注意力特征与所述上一令牌进行融合,得到所述正交自注意力模块输出的当前自注意力特征;将所述当前自注意力特征输入到当前的特征提取模块的前向传播网络,得到所述前向传播网络输出的当前令牌。4.根据权利要求2所述的图像处理方法,其特征在于,所述多个特征提取模块还包括窗口特征提取模块,所述窗口特征提取模块包括级联的窗口自注意力模块和前向传播网络,所述窗口自注意力模块用于将所述待处理图像的令牌以滑动窗口的形式划分后进行自注意力转换。5.根据权利要求4所述的图像处理方法,其特征在于,在所述当前的特征提取模块为窗口特征提取模块的情况下,所述将所述待处理图像的上一令牌输入到当前的特征提...

【专利技术属性】
技术研发人员:赫然黄怀波周晓强
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1