The invention discloses an image classification method based on visual cortex processing mechanism and pulse supervised learning, which comprises the following steps: 1) input an image in the form of a dynamic picture, and then process the input in three different space-time scales; 2) obtain the response of a simple neuron in layer V1; 3) obtain the response of a complex neuron in layer V1; The response of V4 layer neurons is obtained; 5) training output layer connection; 6) input test samples. The image classification process of the invention is closer to the real brain processing process, and the image classification method can better extract the local orientation information of the input image, so the image classification can be better. Moreover, this method only needs to train the connection of output layer, and does not need to be trained by layer by layer, so it has higher efficiency. The classification accuracy of the method on handwritten digits is about 96%, and the classification accuracy is high.
【技术实现步骤摘要】
基于视觉皮层处理机制及脉冲监督学习的图像分类方法
本专利技术涉及图像处理
,特别涉及一种图像分类方法。
技术介绍
在使用神经网络处理图像分类的问题上,目前存在两种网络。一种是传统的神经网络,比如BP神经网络、卷积神经网络,虽然它们的准确度较高,但是需要使用误差反传来一层一层地调整连接,导致学习的效率比较低,而且使用的神经元和生物神经元有很大的差别,因而缺乏生物上的支撑。另一种是脉冲神经网络(SNN),因其使用的是脉冲神经元(对输入进行积累,到达某一程度后神经元才会有输出)而更加接近生物实际。在SNN中用于处理图像分类的方法比较少,有液体状态机以及基于STDP的分类方法,但是这些方法的分类准确度较低。
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于视觉皮层处理机制及脉冲监督学习的图像分类方法,其通过模拟大脑视觉皮层的处理机制对图像进行预处理,然后再使用脉冲监督学习来调整输出层的连接,以使分类过程更接近于真实大脑的处理过程,同时解决现有使用传统神经网络处理图像分类问题时存在效率低、脉冲神经网络分类准确率低的问题。本专利技术基于视觉皮层处理机制及脉冲监督学习的图像分类方法,包括以下步骤:1)以动态图片的形式输入图像,图像被表达成关于图片像素位置(x,y)和时间t的光强分布I(x,y,t);然后在三个不同的时空尺度r=0,1,2下处理输入,第一个尺度r=0,此时的输入等同于原始输入,另外两个尺度需要连续地使用一个高斯核函数对上一尺度的输入进行模糊化;三种输入Ir(x,y,t)表达成:I0(x,y,t)=I(x,y,t)其中*表示卷积运算,然后使用一个三维 ...
【技术保护点】
1.基于视觉皮层处理机制及脉冲监督学习的图像分类方法,其特征在于:包括以下步骤:1)以动态图片的形式输入图像,图像被表达成关于图片像素位置(x,y)和时间t的光强分布I(x,y,t);然后在三个不同的时空尺度r=0,1,2下处理输入,第一个尺度r=0,此时的输入等同于原始输入,另外两个尺度需要连续地使用一个高斯核函数对上一尺度的输入进行模糊化;三种输入Ir(x,y,t)表达成:I0(x,y,t)=I(x,y,t)
【技术特征摘要】
1.基于视觉皮层处理机制及脉冲监督学习的图像分类方法,其特征在于:包括以下步骤:1)以动态图片的形式输入图像,图像被表达成关于图片像素位置(x,y)和时间t的光强分布I(x,y,t);然后在三个不同的时空尺度r=0,1,2下处理输入,第一个尺度r=0,此时的输入等同于原始输入,另外两个尺度需要连续地使用一个高斯核函数对上一尺度的输入进行模糊化;三种输入Ir(x,y,t)表达成:I0(x,y,t)=I(x,y,t)其中*表示卷积运算,然后使用一个三维高斯滤波器对输入进行滤波:其中σV1simple=1.25;2)求取V1层简单型神经元的响应,V1层简单型神经元被建模为线性的28个空间-时间-方位滤波器波器,其感受野为一高斯函数的三阶导数;将V1层简单型神经元集群的第k个滤波器描述为一个和该滤波器方向平行的单位向量uk=(uk,x,uk,y,uk,t),k=1,2,...,28,只有当输入对应的朝向和滤波器方向相同时,这个滤波器才会被激活;然后在空间位置(x,y)拥有空间-时间方位k的简单型神经元的线性响应为:其中X=3-Y-T,T和Y为求和变量,X、Y、T的取值范围为[0,3],且三者之和等于3,av1lin=6.6048;把线性响应Lk,r归一化到一条高斯包络线内便得到简单型神经元的响应:其中αfilt2rate,r=15Hz将无单位的滤波器响应转换为神经元的放电频率,αV1rect=1.9263,αV1norm=1,σV1norm=3.35,αV1semi=0.1;3)求取V1层复杂型神经元的响应,对简单型神经元的响应做局部加权求和即可得到复杂型神经元的响应:其中αV1cormlex=0.1,σV1complex=1.6;最终所求取到的复杂型神经元的响应为神经元的平均放电频率;4)求取V4层神经元的响应,V1层复杂型神经元将通过频率为上述所求得的...
【专利技术属性】
技术研发人员:李秀敏,罗胜元,薛方正,
申请(专利权)人:重庆大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。