一种基于塑性卷积神经网络的可扩展类别的图像识别方法技术

技术编号：23315864 阅读：20 留言：0更新日期：2020-02-11 18:04

本发明专利技术属于图像识别领域，公开了一种基于塑性卷积神经网络的可扩展类别的图像识别方法。本发明专利技术通过构造一个具有元学习的能力的卷积塑性神经网络，并针对应用所需，管理、建立相应的待识别类别库，结合塑性神经网络，利用待识别库作数据支撑，使用循环判定的方法，对输入图片进行识别并返回识别结果。本发明专利技术解决了传统的目标识别方法的可识别类别的扩展性的问题，其优势在于当有未知类别需要识别时，只需要将该未知类别的一张或几张图片样本存储至待识别类别库中，而无需重新训练神经网络或调整识别算法，且对于样本的需求量要小于传统方法。

An image recognition method based on plastic convolution neural network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于塑性卷积神经网络的可扩展类别的图像识别方法
本专利技术属于图像识别领域，涉及目标图像识别的计算方法，尤其是卷积神经网络与塑性神经网络相结合的具有元学习能力的目标识别方法，并利用该方法实现可扩展类别的图像识别。
技术介绍
图像识别技术和方法是当今时代信息化产业下的产物，同时也是计算机视觉和数字图像处理研究领域下的一个非常热门的研究方向，图像识别技术在当今世界的军事、医疗、民用领域都有着非常广泛的应用，在机器人导航系统中、无人驾驶技术、智能视频的监控、工业产品检测与生产过程监控、航空航天等诸多领域内，图像识别技术都是不可缺少的。因此，图像识别也成为当今世界理论上和应用上的研究热点，同时它也是图像处理和计算机视觉学科的重要分支。总的来说，其目的是为了让计算机代替人类去处理大量的物理信息，特别是来自图片的信息。同时，随着神经网络算法的兴起和高速发展，使用各种神经网络方法进行图片识别已经成为了一种主流而有效的研究手段。近年来，在目前的公开测试结果中几乎所有的最佳识别效果均是由各种神经网络结构实现的，该方法已经成为了图片识别的重要手段。当前进行图片识别的神经网络架构基本都采用了基于卷积神经网络原理的计算方法，包括大量的商业化的ORC识别技术、人脸识别技术、物体识别技术等。基于卷积神经网络的各种变种架构在识别原理上与卷积神经网络学习的过程一致，即先学习后判断。基于卷积神经网络的图像识别方法在学习环节中，其本质上都是利用链式求导计算损失函数对每个权重的偏导数(梯度)，然后根据梯度下降公式更新权重，即网络中的各个参数。...

【技术保护点】
1.一种基于塑性卷积神经网络的可扩展类别的图像识别方法，其特征在于，包括以下步骤：/n第一步，基于卷积神经网络和塑性神经网络，构造一个具有元学习能力的卷积塑性神经网络，其中，卷积塑性神经网络由11层结构组成，最前和最后分别为输入层和输出层，第2-9层为卷积池化层交替结构组成，第10层为由塑性网络层构造的classification层；卷积塑性神经网络通过对图片数据的学习能够学会如何学习，从而通过一个类别的1张或几张图片就能习得该类别的特征，实现从几个类别中找到与待识别图片最相似的类别；其包含以下两个步骤:/n(1.1)建立一个塑性神经网络用于数据计算；/n(1.2)基于Imagenet开源数据集对(1.1)中的网络进行训练,训练步骤如下：/n(1.2.1)进行参数初始化，将数据集划分为训练集数据和测试集数据；/n(1.2.2)以K-way-N-shot数据结构作为训练集数据的数据结构，其中，K-way表示每次待识别类别的数目，N-shot表示每个待识别类别的样本数目，加上一张待识别图片样本，共K×N+1张图片，每个类别均有一个唯一的标签，共K个编码标签，以上图片和标签作为一组训练数据，...

【技术特征摘要】
1.一种基于塑性卷积神经网络的可扩展类别的图像识别方法，其特征在于，包括以下步骤：
第一步，基于卷积神经网络和塑性神经网络，构造一个具有元学习能力的卷积塑性神经网络，其中，卷积塑性神经网络由11层结构组成，最前和最后分别为输入层和输出层，第2-9层为卷积池化层交替结构组成，第10层为由塑性网络层构造的classification层；卷积塑性神经网络通过对图片数据的学习能够学会如何学习，从而通过一个类别的1张或几张图片就能习得该类别的特征，实现从几个类别中找到与待识别图片最相似的类别；其包含以下两个步骤:
(1.1)建立一个塑性神经网络用于数据计算；
(1.2)基于Imagenet开源数据集对(1.1)中的网络进行训练,训练步骤如下：
(1.2.1)进行参数初始化，将数据集划分为训练集数据和测试集数据；
(1.2.2)以K-way-N-shot数据结构作为训练集数据的数据结构，其中，K-way表示每次待识别类别的数目，N-shot表示每个待识别类别的样本数目，加上一张待识别图片样本，共K×N+1张图片，每个类别均有一个唯一的标签，共K个编码标签，以上图片和标签作为一组训练数据，64组训练数据为一个batch，以batch为单位使用构造的网络进行计算并更新网络参数，直到完成M个batch；
(1.2.3)对测试集数据进行测试，当测试准确率大于P时...

【专利技术属性】
技术研发人员：王戟，杨文婧，杨绍武，黄达，徐利洋，黄万荣，胡亚清，刘向阳，沙建松，颜豪杰，梁卓，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人