基于带自注意力机制脉冲神经网络的图片识别系统技术方案

技术编号:37152058 阅读:34 留言:0更新日期:2023-04-06 22:09
基于带自注意力机制脉冲神经网络的图片识别系统,包括:编码模块、注意力模块、解码模块。编码模块由卷积编码层和位置编码构成,接收输入图片序列生成包含输入图片序列特征信息的脉冲序列。注意力模块由多层自注意力块组成,接收脉冲序列序列,分别经过时间和空间自注意力操作的处理,输出时空特征更丰富的脉冲序列。解码模块接收脉冲序列,通过序列池化压缩提取到最终的特征向量并送入分类头,得到图片识别结果。本发明专利技术构建了一种新型的基于脉冲神经网络用于图片识别的架构,并在图片识别任务上达到了在脉冲神经网络中截至目前业界最先进的效果。先进的效果。先进的效果。

【技术实现步骤摘要】
基于带自注意力机制脉冲神经网络的图片识别系统


[0001]本专利技术属于人工智能、脉冲神经网络
,涉及利用人工智能尤其是脉冲神经网络的图像识别技术,特别涉及一种基于带自注意力机制脉冲神经网络的图片识别系统。

技术介绍

[0002]在目前训练脉冲神经网络的网络架构中,主要都在是用传统的卷积神经网络架构。而卷积神经网络因为其局部感受野的特性,需要堆叠很多层才能最后获得一个较大的感受野。而近些年提出来的自注意力模型则是解决了这个问题,因为自注意力操作所带来的全局感受野,自注意力模型在自然语言处理领域带来了极大的影响,已经成为了具有主导地位的方法。因为其在建模长距离联系的强大能力,它也被应用在了视觉领域,并且取得了颇有成效的结果。但由于其缺少卷积神经网络所拥有的归纳偏置,需要大量的数据进行训练,此外其训练时所表现出来的次优化性使其难以训练,上述种种因素导致现如今自注意力模型还并没有被应用在脉冲神经网络领域。
[0003]而在图片识别领域,目前所使用的模型大多为基于传统神经网络的卷积神经网络和自注意力模型。但这些模型在实际应用时都面临着功耗本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于带自注意力机制脉冲神经网络的图片识别系统,其特征在于,包括:编码模块,经过一层卷积编码层将输入的图片序列转化为脉冲序列,再加入可学习的位置编码,得到带有时空信息的图片脉冲序列;注意力模块,由若干层多头自注意力块堆叠而成,每层多头自注意力块由层归一化、时间多头注意力机制、空间多头注意力机制和多层感知器四个模块构成;所述层归一化将所述带有时空信息的图片脉冲序列进行归一化处理,稳定网络的学习过程;所述时间多头注意力机制进行时间维度上特征的抽取,所述空间注意力机制对空间维度上特征进行抽取,所述多层感知器为网络增加非线性因素,增强网络的表征能力;解码模块,接收经过注意力模块处理后的脉冲序列,通过序列池化得到最终的特征向量,最后送入全连接头进行图片识别。2.根据权利要求1所述基于带自注意力机制脉冲神经网络的图片识别系统,其特征在于,所述编码模块包括卷积编码层和位置编码;所述卷积编码层是一个面向脉冲神经网络设计的卷积神经网络,用于将输入的图片序列转化为脉冲序列;所述位置编码用于在所述脉冲序列中加入时空的相对次序信息。3.根据权利要求1所述基于带自注意力机制脉冲神经网络的图片识别系统,其特征在于,所述卷积编码层和注意力模块中的脉冲神经元使用膜电位表示状态,使用常微分方程更新状态,方程参数为具有非线性时变特性的神经元内参数,脉冲神经元状态由当前状态和输入突触的影响共同更新,脉冲神经元本身的实时膜电位随时间推移有向静息电位恢复的趋势。4.根据权利要求3所述基于带自注意力机制脉冲神经网络的图片识别系统,其特征在于,所述脉冲神经元对应的状态方程数学式如下:其中,H[t]和V[t]分别对应脉冲神经元在时间步t=1,2,...,T接受输入后和触发脉冲后的膜电位,当t=0时,神经元状态均初始化为0;X[t]是时间步t时接受来自上一层网络的输入,经过脉冲神经元处理后转化成脉冲序列,τ是膜时间常数,定义如下式:C
m
表示脉冲神经元的膜电容,g
l
为脉冲神经元的膜电导;触发脉冲的公式如下:S[t]=Θ(H[t]

V
th
)S[t]是时间步t时的输出脉冲,Θ(x)是阶跃函数,当x>0时,Θ(x)=1,否则Θ(x)=0,V
th
是激发脉冲的阈值;更新触发脉冲之后的H[t],得到V[t]的公式为:V[t]=H[t](1

S[t])+V
reset
S[t]V
reset
是触发脉冲之后的重置电位。
5.根据权利要求4所述基于带自注意力机制脉冲神经网络的图片识别系统,其特征在于,采用模拟梯度函数替代反向传播时脉冲神经元的激发函数在计算图中的位置,模拟梯度函数公式为:求导后导数为:α为人为指定的超参数,用于控制模拟梯度函数的坡度。6.根据权利要求1所述基于带自注意力机制脉冲神经网络的图片识别系统,其特征在于,所述时间注意力机制和空间注意力机制均为自注意力操作,分别在时间维度和...

【专利技术属性】
技术研发人员:杨旭李煜东雷云霖陈耀宇
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1