一种流形上的智能目标识别方法技术

技术编号:28751830 阅读:17 留言:0更新日期:2021-06-09 10:16
本发明专利技术公开了一种流形上的智能目标识别方法,方法流程包括:原始图像输入、流形特征建模、智能网络学习、网络更新优化、识别结果输出等五个部分。本发明专利技术首先利用协方差特征矩阵对原始图像进行流形特征建模,从而将提取的流形特征作为智能学习网络的输入;之后,基于黎曼流形理论与矩阵微分原理,对流形上的深度学习网络进行梯度模型推导,同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题,利用黎曼优化方法获得最优的参数值,最终学习到流形上的智能目标识别网络。本发明专利技术有效利用数据的几何结构,降低了计算复杂度,可以精确地、快速地识别目标,具有较高的识别准确率和学习效率。高的识别准确率和学习效率。高的识别准确率和学习效率。

【技术实现步骤摘要】
一种流形上的智能目标识别方法


[0001]本专利技术涉及目标识别
,特别提供了一种流形上的智能目标识别方法。

技术介绍

[0002]成像目标识别是无人飞行器实现精确制导的关键核心技术。在目标识别过程中,不仅有光照条件、物体姿态、复杂背景等外部因素影响,还有目标本身成像中的几何变换和类内差异较小等内部因素影响。如何在复杂的环境因素下进行高效的识别一直是自动目标识别领域的一个重大难题。近年来,深度学习以其强大的学习能力在目标识别领域取得了优异表现,而针对目标识别领域中具有良好特性的流形结构数据,深度学习方法的优势则受到限制。现有的多数深度学习方法都是针对向量数据而设计,若直接将流形数据作为其输入,将无法同时发挥流形数据与深度学习方法的各自优势。

技术实现思路

[0003]鉴于此,本专利技术的目的在于提供一种流形上的智能目标识别方法,以解决无人飞行器在复杂环境下的目标识别问题。
[0004]本专利技术提供的技术方案是:一种流形上的智能目标识别方法,包括以下步骤:
[0005]1)对输入图像进行预处理,预处理后的多个图像构成图像集,建立图像集的协方差特征矩阵;
[0006]2)将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类;
[0007]3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数;
[0008]4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数;
[0009]5)将待测图像输入更新参数后的智能学习网络,得到目标识别的分类。
[0010]所述建立图像集的协方差特征模型,包括以下步骤:
[0011]对于每个包含n张图片的图像集M
set
={I1,I2,

,I
n
},提取图像集中每幅图像I
i
对应的特征,构成特征向量i=1,2,

,n,s
i
代表第i幅图像的d维特征向量;表示图像集中所图像特征向量的均值,即那么每个图像集表示为d
×
d的协方差特征矩阵X:
[0012]所述将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类,包括以下步骤:
[0013]协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=W
T
XW,其中待学习的W为学习变换矩阵;
[0014]将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有f
QR
(Y)=YR-1
=Q,其中f
QR
(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵;
[0015]Q输入至欧氏映射层得到G,则有G=f
pro
(Q)=QQ
T
,其中f
pro
(Q)为映射函数;将
[0016]G作为全连接层的输入,再经过softmax层进行分类。
[0017]所述通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数,包括以下步骤:
[0018][0019]W
t+1
=Γ(W
t-λgrad
R
L(W))
[0020]其中,W
t+1
表示下一次更新的权值参数,W
t
为当前第t次迭代的权值参数,Γ(
·
)表示拉回映射算子,λ表示学习速率,grad
R
L(W)表示黎曼梯度,是流形学习层的代价函数L(W)关于W的欧氏梯度的正则成分;
[0021]根据矩阵链式法则求得相应的欧氏梯度的表达式为:
[0022][0023]其中L(Y)表示流形转换层的代价函数;
[0024]将W
t+1
带入步骤2)中的学习变换矩阵W,实现学习变换矩阵的更新。
[0025]所述在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数,包括以下步骤:
[0026]对于流形学习层,参数更新的公式为:
[0027][0028]上式中X为流形学习层的输入,Y为流形学习层的输出;L(W)表示流形学习层的代价函数,L(Y)表示流形转换层的代价函数;
[0029]将与步骤2)中的学习变换矩阵W叠加后作为新的W,用于替换上次迭代的W,实现学习变换矩阵的更新;
[0030]对于流形转换层,参数更新的公式为:
[0031][0032]上式中A
btril
=A
tril-(A)
Ttril
,A
tril
表示将矩阵A的所有上三角阵元素设为0;L
pro
为流形映射层的代价函数;E为单位矩阵;
[0033]将与步骤2)中的流形学习层的输出Y叠加后作为新的Y,用于替换上次迭代的Y,实现流形学习层的输出更新。
[0034]本专利技术提供的一种流形上的智能目标识别方法,有益效果如下:基于数据的流形几何结构来设计深度学习网络,将微分几何理论与深度学习理论相结合,提出一种基于流形的深度图像集识别网络。同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题,此专利技术有效利用
数据的几何结构,降低了计算复杂度,不仅在识别准确率上有所提高,同时在训练和测试速度上也有大幅度提升。
附图说明
[0035]下面结合附图及实施方式对本专利技术作进一步详细的说明:
[0036]图1为本专利技术提供的一种流形上的智能目标识别方法流程示意图;
[0037]图2为本专利技术提供的一种流形上的智能目标识别方法中图像集识别结果示意图。
具体实施方式
[0038]下面将结合具体的实施方案对本专利技术进行进一步的解释,但并不局限本专利技术。
[0039]一种流形上的智能目标识别方法,包括:
[0040]步骤一:输入原始图像。
[0041]步骤二,对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模。
[0042]步骤三,基于数据的流形几何结构来设计深度学习网络。
[0043]步骤四,推导流形上的深度学习网络的梯度模型。
[0044]步骤五,使用基于矩阵链式法则的反向传播算法更新网络参数。
[0045]步骤六,输出识别结果。
[0046]所述步骤二对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模中包括如下步骤:
[0047]步骤2-1,提取每幅图像对应的特征,构成特征向量s
i
代表第i幅图像样本的d维特征向量。
[0048]步骤2-2,构建每个图像集中所有图像的特征向量矩阵,并计算图像集中所有矩阵特征向量的平均值。
[0049本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流形上的智能目标识别方法,其特征在于包括以下步骤:1)对输入图像进行预处理,预处理后的多个图像构成图像集,建立图像集的协方差特征矩阵;2)将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类;3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数;4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数;5)将待测图像输入更新参数后的智能学习网络,得到目标识别的分类。2.根据权利要求1所述的一种流形上的智能目标识别方法,其特征在于,所述建立图像集的协方差特征模型,包括以下步骤:对于每个包含n张图片的图像集M
set
={I1,I2,

,I
n
},提取图像集中每幅图像I
i
对应的特征,构成特征向量s
i
代表第i幅图像的d维特征向量;表示图像集中所图像特征向量的均值,即那么每个图像集表示为d
×
d的协方差特征矩阵X:3.根据权利要求1所述的一种流形上的智能目标识别方法,其特征在于:所述将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类,包括以下步骤:协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=W
T
XW,其中待学习的W为学习变换矩阵;将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有f
QR
(Y)=YR-1
=Q,其中f
QR
(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵;Q输入至欧氏映射层得到G,则有G=f
pro
(Q)=QQ
T
,其中f
pro
(Q)...

【专利技术属性】
技术研发人员:史泽林向伟刘云鹏刘天赐邬抒航蓝德岩
申请(专利权)人:中国科学院沈阳自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1