一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法技术

技术编号：15640479 阅读：570 留言：0更新日期：2017-06-16 06:11

本发明专利技术提出了一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法。本发明专利技术受到生物视觉分层系统的启发，在图像的特征提取部分，采用HMAX模型模拟感受野的细胞运行机制，先利用Gabor滤波强化图像的边缘信息，再对经过Gabor滤波后的各个方向的图像进行max pooling处理，达到提取最主要的特征及降维处理的目的。在特征图像数据处理方法，选用了相位编码技术，将图像的像素信息转换为脉冲现象，这样不仅考虑了图像的空间信息，还考虑了图像的时间信息。本发明专利技术有一定的生物性基础，具有良好的可行性与鲁棒性，并且其对于图像的识别与分类，尤其是在噪声图像中的准确性大大的提高了。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法
本专利技术涉及模式识别和类脑计算领域，具体涉及一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法。
技术介绍
模式识别是人工智能领域的目前最热的话题之一，它的目标通过对采集的图像进行一定的处理以获得目标场景的相关信息。但中科院谭铁牛院士在2016中国人工智能大会(CCAI2016)上指出：通用的模式识别系统任重道远——其主要瓶颈在于鲁棒性、自适应性和可泛化性三个方面。这些技术难题使得模式识别的发展无法适应社会与当前市场的需求。而类脑计算不仅模拟人的大脑，而且综合了其他学科，其中包括信号处理科学、计算机技术、统计学、物理学、应用数学、认知科学神和经生理学等，引起了各国政府和研究机构的广泛关注，并在模式识别的三大瓶颈问题方面有了重大的突破。美国和欧盟对此也投入了巨资，先后推出了各自的人脑研究计划：美国的“人类大脑计划”(HumanBrainProject)致力于从神经元层面探索神经元、神经回路与大脑功能间的关系，欧盟的“大脑活动图谱计划”(BrainActivityMapProject，或称BrainInitiative)则致力于模拟整个人脑。脉冲神经网络是类脑计算领域的专家和学者提出的第三代神经网络，其与基于脉冲频率编码信息的传统人工神经网络相比，拥有更强大的计算能力，可以模拟各种神经信号和任意的连续函数，非常适合实现大脑神经信号的处理问题，是进行复杂时空信息处理的有效工具。虽然当前对应技术难题的基于脉冲神经网络的模式识别系统研究才刚刚起步，国内外的文献不是很多，但是学者们已经开始提出富有成效和创新十足...
一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法

【技术保护点】
一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法，其特征在于该方法包括以下步骤：步骤1.生物视觉系统的特征提取步骤1.1.S1层的Gabor滤波处理S1层代表的是视觉皮层感受野中的简单细胞处理图像信号的方式；感受野的V1区简单细胞进行单元的匹配时，利用稀疏编码的高阶滤波器提取特征；稀疏编码的形式是：

【技术特征摘要】
1.一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法，其特征在于该方法包括以下步骤：步骤1.生物视觉系统的特征提取步骤1.1.S1层的Gabor滤波处理S1层代表的是视觉皮层感受野中的简单细胞处理图像信号的方式；感受野的V1区简单细胞进行单元的匹配时，利用稀疏编码的高阶滤波器提取特征；稀疏编码的形式是：SC＝AH其中sci，ai，hj是单位稀疏块SC的元素，A为稀疏编码的基函数，H是稀疏稀疏；A的表达形式是：||·||f是Frobenius范式，μ是正常数；Gabor响应G(x,y)可以近似的转换成稀疏编码的形式：G(x,y)＝S(x,y)·K(x,y),其中S(x,y)表示复杂的sine函数，它的取值范围是[-1,1]，因此满足上述基函数A的形式；K(x,y)是二维离散高斯方程的包络函数，λ表示波长，它的值不能超过图像长宽的1/5；是相位偏移，取值在[-180°,180°],γ表示长宽比，它决定了图像经过Gabor滤波后的形状；σ取决于带宽b：利用Gabor滤波的实部部分对图像特征进行学习：x'＝xcosθ+ysinθ,y'＝-xsinθ+ycosθ并分别设偏移相位波长λ与带宽b为0°，10与1，因此σ＝0.56λ；在S1层中，对一张大小为n×n的图片，选取0°,45°,90°,135°四个方向，窗口大小为mG×mG的Gabor滤波，得到四幅大小均为n×n的滤波图像：步骤1.2.C1层的maxpooling处理图像经S1层后强化了其的边缘信息，在C1层利用maxpooling进行特征的提取与降维，其具体表达如下：其中m是maxpooling的滑动窗口的大小；将得到的图像一次拼接，然后将新图像转换为一个向量：步骤2.脉冲编码选择相位编码来产生脉冲序列；编码单元的结构由三部分组成：阳性神经元，阴性神经元，输出神经元；在整个编码过程中，每一个传入的尖峰信号代表一个神经元活动，连接到一个感受野区域，即一个编码单元连接到一个像素；阈下膜电位振荡也与动作电位相关，在RF中每个像素的强度值被转换成一个精心处理的时间动作电位的周期振荡，描述为余弦函数：其中是第i个编码神经元的震荡函数，呈周期性；A是振幅，ω代表角速度，φ0是初始相位，第i个编码神经元的偏移相位φi的计算公式是：φi＝φ0+(i-1)·Δφ其中Δφ是最小的偏移单位，其值为2π/n...

【专利技术属性】
技术研发人员：徐小良，金昕，卢文思，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人