一种基于LSTM的二维图像的目标类别判识方法技术

技术编号:17389967 阅读:96 留言:0更新日期:2018-03-04 14:40
本发明专利技术提供了一种基于LSTM的二维图像的目标类别判识方法,包括以下步骤:S1、依照从外至内的环状串联的方式将二维图像转化为一维矢量,依照行序串联的方式将二维图像转化为一维矢量,依照从列序串联的方式将二维图像转化为一维矢量;S2、将上述三种转化方式所得到的一维矢量全部送入LSTM网络进行训练或者判识,然后输出三种结果;S3、将LSTM网络输出的三种结果进行融合,并基于最终的融合结果进行目标判识。本发明专利技术的有益效果是:对二维图像使用不同的方式得到一维向量可以充分利用二维图像在空间上的组织关系,明显提高判别的正确率,且具有很好的可解释性。

A target classification method for two-dimensional image based on LSTM

The present invention provides an identification method of two-dimensional image LSTM based target category, which comprises the following steps: S1, in accordance with the ring from outside to inside the serial mode to the two-dimensional image into a one-dimensional vector, in accordance with the order for serial mode to the two-dimensional image into a one-dimensional vector, in accordance with the order from the column series way the two-dimensional image into a one-dimensional vector; S2, the above three kinds of one-dimensional vector transformation are all sent to the LSTM network training and recognition, and then the output results of three; S3, the combination of three kinds of results based on the output of the LSTM network, and the final fusion results of target identification. The beneficial effect of the invention is that one dimensional vector can be acquired in different ways for two-dimensional images, which can make full use of the organizational relationship of two-dimensional images in space, and obviously improve the accuracy of discrimination, and has good interpretability.

【技术实现步骤摘要】
一种基于LSTM的二维图像的目标类别判识方法
本专利技术涉及图像识别,尤其涉及一种基于LSTM的二维图像的目标类别判识方法。
技术介绍
LSTM(长短时记忆)深度网络在目标类别判识中具有重要的应用,但是其仅限于目标表达为一维数据的情形。LSTM网络的主要优势在于能够比较充分利用到序列在时序上的关联信息。图1给出了LSTM整体结构示意图,为了解决传统RNN网络存在的梯度消失问题,即后面时间节点对于前面时间节点的感知力下降。LSTM设计了独具特色的Cell结构来实现记忆功能,保持后续时间节点对于之前时间节点的感知能力,同LSTM还设计了“遗忘门”(ForgetGate)来选择性的对之前的信息进行遗忘,以过滤掉不必要的冗余信息。一个序列中的各数据段按照先后顺序依次送入到LSTM网络中进行处理。数据段划分的示意图见图2。假如当前时刻处理的序列中的数据段由序列中的字母I,T,W,H,V,A,S,E,N组成,则下一时刻处理的序列中的数据段由序列中的字母T,W,H,V,A,S,E,N,D组成,下下时刻处理的序列中的数据段由序列中的字母W,H,V,A,S,E,N,D,G组成,以此类推。此处数据段划分本文档来自技高网...
一种基于LSTM的二维图像的目标类别判识方法

【技术保护点】
一种基于LSTM的二维图像的目标类别判识方法,其特征在于,包括以下步骤:S1、依照从外至内的环状串联的方式将二维图像转化为一维矢量,依照行序串联的方式将二维图像转化为一维矢量,依照从列序串联的方式将二维图像转化为一维矢量;S2、将上述三种转化方式所得到的一维矢量全部送入LSTM网络进行训练或者判识,然后输出三种结果;S3、将LSTM网络输出的三种结果进行融合,并基于最终的融合结果进行目标判识。

【技术特征摘要】
1.一种基于LSTM的二维图像的目标类别判识方法,其特征在于,包括以下步骤:S1、依照从外至内的环状串联的方式将二维图像转化为一维矢量,依照行序串联的方式将二维图像转化为一维矢量,依照从列序串联的方式将二维图像转化为一维矢量;S2、将上述三种转化方式所得到的一维矢量全部送入LSTM网络进行训练或者判识,然后输出三种结果;S3、将LSTM网络输出的三种结果进行融合,并基于最终的融合结果进行目标判识。2.根据权利要求1所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:在步骤S1中,行序串联是将一个图像矩阵的第一行、第二行一直到最后一行对应的矢量依次首尾相连结合为一个一维矢量;列序串联是将一个图像矩阵的第一列、第二列一直到最后一列依次首尾相连结合为一个一维矢量,图像矩阵最左边的列称为第一列,图像矩阵最右边的列称为最后一列;从外至内环状串联是从外至内依照环状的方式对图像像素进行串联,得到一维向量。3.根据权利要求1所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:在步骤S3中,将不同序列在LSTM的输出结果作为特征进行串联融合。4.根据权利要求3所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:根据步骤S1中的三种转化方式分,对于一张图片,将其得到的三种一维向量一起送入一个LSTM网络,得到的输出结果进行串联,再使用softmax进行分类。5.根据权利要求4所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:只训练一个LSTM网络,与softmax一起构成一个整体。6.根据权利要求1所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:在步骤S3中,采用加权得分融合的方式对不同序列LSTM的得分结果进行融合。7.根据权利要求6所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:根据步骤S1中的三种转化方式分别得到三类样本,对每类样本,都训练...

【专利技术属性】
技术研发人员:徐勇吴帅
申请(专利权)人:哈尔滨工业大学深圳研究生院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1