【技术实现步骤摘要】
一种基于深度学习的分组非局部注意力方法
[0001]本专利技术属于深度学习领域,适用于各类三维度特征处理类别,具体涉及一种基于深度学习的分组非局部注意力方法。
技术介绍
[0002]注意力机制目前广泛运用于深度学习领域,注意力机制往往起着对特征的相关信息增强和非相关信息衰弱的作用,作用域分为对单一特征进行空间或者通道的注意力方式和对多个特征进行联合注意力的方式。
[0003]目前从类别上可将注意力机制分为通道注意力、空间注意力、时间注意力、非局部注意力。
[0004]通道注意力往往是对输入特征进行通道方面的信息搜寻与特征增强,常见的通道注意力往往是伴随着全局池化层和FC层得到一个embeding选择矩阵,用这个选择矩阵与原始特征进行点乘得到输出。
[0005]空间注意力相反是对输入特征进行空间维度上的信息搜寻与特征增强,常见的空间注意力采用了空间上的平均池化核最大池获取一个embeding选择矩阵,之后对embeding进行上采样后与原始特征进行点乘得到输出。
[0006]时间注意力与前两者不同的是,它往往的作用对象是多个输入特征,并且为了使注意力机制的效果最大化,这些特征往往拥有对应像素点的假性相关性,即输入特征在同样的坐标位置下所代表的的涵义大致相同,在图像处理领域也可以理解为两幅图像是经过“对齐”处理过后的,在这种前提下,将输入特征之间互相点乘,便可以进行每个像素点上的信息过滤和增强。
[0007]非局部注意力的作用域并不局限于一个输入或多个输入,大多数非局部注意力方法会 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的分组非局部注意力方法,其特征在于,步骤如下:步骤1.对原始输入进行预处理;步骤2.对预处理特征进行切片,得到n个A输入所拆分得到的小特征CF和n个B输入所拆分得到的小特征NF;步骤3.遍历待增强特征所对应的n个小特征进行相关性选择,得到最终需要的K个小特征NF;步骤4.将K个NF与CF进行组内非局部注意力操作,得到增强后的CF;步骤5.遍历结束后将所有经过增强后的CF特征进行拼接处理得到最终输出特征。2.根据权利要求1所述的一种基于深度学习的分组非局部注意力方法,其特征在于,步骤1具体方法如下;F
pre
=Conv
pre
(F
orin
)其中F
pre
表示处理结果特征,包括A
pre
和B
pre
其中B
pre
的作用是对A
pre
进行辅助增强,使得A
pre
能够从B
pre
获得更充分的信息来增强A
pre
;Conv
pre
表示卷积层计算过程;F
orin
表示初始输入特征,包括A
orin
和B
orin
;此步骤处理的目的在于将特征的数据处理成适应于注意力结构的特征数据。3.根据权利要求2所述的一种基于深度学习的分组非局部注意力方法,其特征在于,步骤2具体方法如下;骤2具体方法如下;其中n表示切块数量,根据实际应用情况适应性定义,要求被处理特征必须能够切成完整的n个小特征;和分别表示A
pre
和B
pre
切块后的小矩阵,他们之间的维度是相等的;Split表示切块处理,会根据切块数量在空间维度上对A
pre
和B
pre
均等切割。4.根据权利要求3所述的一种基于深度学习的分组非局部注意力方法,其特征在于,步骤3具体方法如下;步骤4.将K个NF与CF进行组内非局部注意力操作,得到增强后的CF;其中,K表示需要选择的数量,根据实际应用情况适应性定义;NF表示所选择得到的B特征所包括的小特征;CF表示当前所遍历到的A特征所包括的小特征,Search是一个抽象化的搜索算法,其具体步骤如下:F
CF
=repeat(CF)F
cat
=concat(F
CF
,B
pre
)F
max
=Maxpool(L(F
cat
))F
avg...
【专利技术属性】
技术研发人员:颜成钢,汤乐,毛钰,高宇涵,孙垚棋,朱尊杰,陈楚翘,王鸿奎,王廷宇,殷海兵,张继勇,李宗鹏,赵治栋,
申请(专利权)人:杭电丽水研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。