【技术实现步骤摘要】
模仿生物视觉神经元的图像分类方法、系统、装置及介质
本专利技术涉及计算机视觉领域,特别涉及模仿生物视觉神经元的图像分类方法、系统、装置及介质。
技术介绍
图像分类是一个热门的研究领域,有着巨大的商业价值,多用于辅助图像识别技术,例如人脸识别、车牌识别、图像检测、图像搜索等。目前,有不少研究人员在图像分类方面进行了大量的研究,深度学习被引入图像分类,并在广泛的应用中受到越来越多的关注。但是深度学习已知的缺陷依然存在,如:需要太多经过标注的数据、模型训练需要占用太多昂贵的资源、对数据细微的抖动,出现算法失效的情况等。如图3所示,Hubel和Wiesel两位博士在1958年的猫视觉皮层实验中,首次观察到视觉初级皮层的神经元对移动的边缘刺激敏感,并定义了简单和复杂细胞,发现了视功能视野逐渐变化现象,出现了视觉纹状皮质现象。专利技术人一直主张人工智能要从神经生物学受启发,也阅读了国外大量视觉神经元“视觉纹状皮质现象”的研究,认为这种现象与特征的稳定识别有关。目前CNN网络对于旋转、缩放、平移等变化的同一类物体识 ...
【技术保护点】
1.一种模仿生物视觉神经元的图像分类方法,包括对待分类的图像进行预处理;基于CNN网络构建分类模型,分类模型至少包括卷积层、池化层;对分类模型进行训练,得到训练好的分类模型;通过训练好的分类模型进行图像分类,获得分类结果,其特征在于,在CNN网络的卷积层中按如下步骤运行:/n步骤1:设定输入图像和学习权值,学习权值的卷积核高度、卷积核宽度分别与输入图像的图像高度、图像宽度相同;/n步骤2:将输入图像的图像通道维度上的数据扁平化到图像高度和图像宽度的维度上;/n步骤3:将经扁平化处理得到的输入图像的张量使用滑动窗口进行提取处理;/n步骤4:对学习权值进行稀疏化处理;/n步骤5 ...
【技术特征摘要】
1.一种模仿生物视觉神经元的图像分类方法,包括对待分类的图像进行预处理;基于CNN网络构建分类模型,分类模型至少包括卷积层、池化层;对分类模型进行训练,得到训练好的分类模型;通过训练好的分类模型进行图像分类,获得分类结果,其特征在于,在CNN网络的卷积层中按如下步骤运行:
步骤1:设定输入图像和学习权值,学习权值的卷积核高度、卷积核宽度分别与输入图像的图像高度、图像宽度相同;
步骤2:将输入图像的图像通道维度上的数据扁平化到图像高度和图像宽度的维度上;
步骤3:将经扁平化处理得到的输入图像的张量使用滑动窗口进行提取处理;
步骤4:对学习权值进行稀疏化处理;
步骤5:将经提取处理得到的输入图像的张量与经稀疏化处理得到学习权值的张量进行矩阵乘法运算,得到的计算结果作为输出的特征图,并对输出的特征图采用非线性激活函数处理。
2.根据权利要求1所述的一种模仿生物视觉神经元的图像分类方法,其特征在于:在步骤1中,设定输入图像,表示为X(batch,heightx,widthx,in_channels),X的4个维度分别表示为样本数、图像高度、图像宽度、图像通道;设定学习权值,表示为W(heightx,widthx,heightw×widthw,out_channels),学习权值W的四个维度分别表示为卷积核高度、卷积核宽度、输入通道数、输出通道数,其中,学习权值W的卷积核高度与输入图像X的图像高度相同,学习权值W的卷积核宽度与输入图像X的图像宽度相同。
3.根据权利要求2所述的一种模仿生物视觉神经元的图像分类方法,其特征在于:在步骤2中,将输入图像X在图像通道上的数据扁平化到图像高度和图像宽度的维度上,扁平化处理后得到的张量表示为
4.根据权利要求3所述的一种模仿生物视觉神经元的图像分类方法,其特征在于:在步骤3中,将经扁平化处理得到的张量Xflatten使用(heightw,widthw)的滑动窗口进行提取处理,按照如下公式计算:
其中,strides是移动步长,k_size=heightw=widthw,height...
【专利技术属性】
技术研发人员:吴亚,魏守卫,
申请(专利权)人:苏州万高电脑科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。