基于卷积神经网络的SAR目标交互行为识别方法技术

技术编号:21915329 阅读:14 留言:0更新日期:2019-08-21 12:50
一种基于卷积神经网络的SAR目标交互行为识别方法,从SAR图像序列中检测出运动目标,用卷积神经网络识别运动目标类型,提取运动目标交互行为中运动信息作为特征,构建目标的运动特征矩阵,用卷积神经网络进行SAR目标交互行为类型识别。本发明专利技术可有效解决单链隐马尔可夫模型无法完全表述交互行为的问题,也无需将特征分层设计,能够正确识别出SAR图像序列中有交互行为的两个目标构成的目标群事件,获得较优的交互行为识别性能。

SAR Target Interactive Behavior Recognition Based on Convolutional Neural Network

【技术实现步骤摘要】
基于卷积神经网络的SAR目标交互行为识别方法
本专利技术涉及图像处理、特征提取、目标识别等领域,尤其涉及一种SAR目标交互行为识别方法。
技术介绍
行为识别是合成孔径雷达(SyntheticApertureRadar,SAR)图像序列内容解译和分析中一个重要组成部分。行为识别旨在通过观察个体的动作来判断个体所做出的行为。交互行为识别则是通过观察有相互关联的多目标复杂行为来判断目标群的事件。通过识别目标的个体和交互行为,我们能更准确地对SAR图像序列中所发生的事件做出判断。近些年来,隐马尔可夫模型(HiddenMarkovModels,HMM)被应用在行为识别领域。由于HMM能够提供动态时间规整,因此可用于描述物体在时间域上的运动模式,并可进行动态行为建模和分析。HMM及其改进算法已经成为时间序列建模的常用方法之一。但是在交互行为识别中,每个目标在某一时刻的运动状态不仅依赖于自身在前一时刻的状态,同时也取决于另一目标在前一时刻的状态,HMM的结构却不能体现出这种相互的关系。另一方面,随着目标数量的增长,观察序列的长度、HMM中状态的数目和参数都会迅速增长,从而增加了HMM参数估计的复杂度。耦合隐马尔可夫模型(CoupledHiddenMarkovModels,CHMM)可解决复杂多目标行为识别,可提供一种更为有效的过程建模方法。CHMM是一种用于描述两个或多个相互关联(条件概率依赖)的随机过程统计特性的概率模型,它可以看成是通过在多个HMM状态序列之间引入耦合条件概率而得到的一种多HMM链模型,可用于对两个相互关联的随机过程进行建模和分类,因此适合用来学习和描述多个数据之间的交互作用。但是,在设计交互行为特征时,特别是对特征进行分层设计时,需要许多先验知识和经验,同时随着交互目标数量的增长,参数估计的复杂度也会随着增加。
技术实现思路
为了克服现有方法对交互行为识别的不足,本专利技术提出一种基于卷积神经网络(ConvolutionalNeuralNetworks,CNN)的SAR目标交互行为识别方法,该方法能够正确识别出SAR图像序列中有交互行为的两个目标构成的目标群事件,获得较优的交互行为识别性能。本专利技术解决其技术问题所采用的技术方案是:一种基于卷积神经网络的SAR目标交互行为识别方法,包括以下步骤:步骤1,采用Surendra背景更新算法从SAR图像序列中检测出运动目标所在的位置;步骤2,用卷积神经网络识别运动目标类型,输入为运动目标图像,输出为该目标的类型;其中,采用的卷积神经网络模型共有8层,包括6个卷积层和2个全连接层,每2层卷积层叠加一个最大池化层,最后通过2个全连接层输出模型预测标签,使用ReLU激活函数,卷积层采用零填充技术,最大池化层使用重叠汇聚技术,第一层全连接层使用Dropout技术,并以0.5的概率随机将全连接层中神经元的输出值清零;步骤3,提取运动目标交互行为中运动信息作为特征,构建目标的运动特征矩阵如下所示:矩阵的每一行代表在第k帧中目标i的速度目标j的速度目标i与目标j间的距离目标i与目标j的运动速度之差k=1,2,3,4......n,矩阵行数n表示选取的图像帧数;步骤4,用卷积神经网络进行SAR目标交互行为类型识别,输入为运动特征矩阵输出为该交互行为的类型;其中,卷积神经网络模型共有4层,包含2个卷积层和2个全连接层,2个卷积层后接有池化层,采用最大池化,下采样窗口的大小取2×2,滑动步长取2,ReLU非线性激活函数作用于每层卷积层,Softmax非线性函数作用于第2个全连接层的输出节点,卷积层中卷积核的滑动步长全部取2,输入特征图的周围没有补零,两个全连接层隐含节点个数分别为128和4,Dropout正则化方法应用于第2个卷积层和第1层全连接层。进一步,所述步骤1中,采用Surendra背景更新算法从SAR图像序列中检测出运动目标所在的位置;首先将交互行为序列的第1帧图像I1作为背景B1,选取阈值T,设定迭代次数初始值m=1,最大迭代次数MAXSTEP,采用Surendra背景更新算法,对当前帧的帧差分图像|Ii-Ii-1|的像素值进行判断,对像素值小于阈值的位置替换更新:Bi=0.1*Ii(x,y)+(1-0.1)Ii-1(x,y)(1)其中,Bi(x,y)为背景图像在(x,y)的灰度值,Ii(x,y)为输入的第i帧图像,Ii-1(x,y)为输入的第i-1帧图像,0.1为更新速度;迭代次数m=m+1,继续重复求帧差分图像,对差值图像的像素值进行判断和更新,当迭代次数达到MAXSTEP时结束迭代,此时Bi(x,y)当作背景图像;将实时输入的交互行为的场景图像Ii(x,y)与构建好的背景模型Bi(x,y)进行差分,检测出目标所在的位置,基于背景差法的二值化图像描述为:Di(x,y)=|Ii(x,y)-Bi(x,y)|(2)其中,Mi(x,y)为坐标(x,y)的二值化像素值,(x,y)为二维图像的平面坐标;对转换后的二值图像采用形态学除噪,滤除过小的目标;在整个过程中,需要构建自适应的全局阈值T,即选择T的初始估计值,用阈值T将图像分割成G1与G2区域,并对区域G1和G2中的所有像素计算平均灰度值μ1和μ2,更新阈值T=1/2(μ1+μ2),直到逐次迭代所得到的T值之差的绝对值小于1。更进一步,所述步骤3中,交互行为采用运动信息作为特征,个体目标的运动速度为:v=(P2(x,y)-P1(x,y))/(t2-t1)(4)其中,P2(x,y)与P1(x,y)代表同一目标在时刻t2和时刻t1所在的位置,v为速度,是一向量值,包含了方向和大小;两个目标之间的距离和运动速度之差为:d=||PA(x,y)-PB(x,y)||(5)vd=||vA||-||vB||(6)其中PA(x,y)与PB(x,y)代表目标A与目标B在同一时刻所在的位置,||PA(x,y)-PB(x,y)||代表目标A与目标B之间的距离绝对值,||vA||与||vB||代表目标A与目标B速度的大小;利用上述3种不同的运动特征构建目标的运动特征矩阵如下所示:本专利技术的有益效果表现在:采用卷积神经网络的SAR目标交互行为识别方法,可有效解决单链隐马尔可夫模型无法完全表述交互行为的问题,也无需将特征分层设计,提高交互行为的识别率。附图说明图1为本专利技术的一种基于卷积神经网络的SAR目标交互行为识别方法流程图。图2为运动目标类型识别卷积神经网络结构图。图3为交互行为类型识别卷积神经网络结构图。具体实施方式下面结合附图和实施例对本专利技术作进一步说明。参照图1~图3,一种基于卷积神经网络的SAR目标交互行为识别方法,包括以下步骤:步骤1,运动目标检测本实施例采用自主构建的多目标交互行为SAR图像数据库进行,交互行为包括超越、尾随、相遇、会合四种。首先将交互行为序列的第1帧图像I1作为背景B1。选取阈值T,设定迭代次数初始值m=1,最大迭代次数MAXSTEP为5,采用Surendra背景更新算法,对当前帧的帧差分图像|Ii-Ii-1|的像素值进行判断,对像素值小于阈值的位置替换更新:Bi=0.1*Ii(x,y)+(1-0.1)Ii-1(x,y)(1)其中,Bi(x,y)为背景图像在(x,y)的灰度值,Ii(x,y)为输入的第i帧图像本文档来自技高网
...

【技术保护点】
1.一种基于卷积神经网络的SAR目标交互行为识别方法,其特征在于:所述方法包括以下步骤:步骤1,采用Surendra背景更新算法从SAR图像序列中检测出运动目标所在的位置;步骤2,用卷积神经网络识别运动目标类型,输入为运动目标图像,输出为该目标的类型;其中,采用的卷积神经网络模型共有8层,包括6个卷积层和2个全连接层,每2层卷积层叠加一个最大池化层,最后通过2个全连接层输出模型预测标签,使用ReLU激活函数,卷积层采用零填充技术,最大池化层使用重叠汇聚技术,第一层全连接层使用Dropout技术,并以0.5的概率随机将全连接层中神经元的输出值清零;步骤3,提取运动目标交互行为中运动信息作为特征,构建目标的运动特征矩阵Fi

【技术特征摘要】
1.一种基于卷积神经网络的SAR目标交互行为识别方法,其特征在于:所述方法包括以下步骤:步骤1,采用Surendra背景更新算法从SAR图像序列中检测出运动目标所在的位置;步骤2,用卷积神经网络识别运动目标类型,输入为运动目标图像,输出为该目标的类型;其中,采用的卷积神经网络模型共有8层,包括6个卷积层和2个全连接层,每2层卷积层叠加一个最大池化层,最后通过2个全连接层输出模型预测标签,使用ReLU激活函数,卷积层采用零填充技术,最大池化层使用重叠汇聚技术,第一层全连接层使用Dropout技术,并以0.5的概率随机将全连接层中神经元的输出值清零;步骤3,提取运动目标交互行为中运动信息作为特征,构建目标的运动特征矩阵Fim,如下所示:矩阵的每一行代表在第k帧中目标i的速度目标j的速度目标i与目标j间的距离目标i与目标j的运动速度之差k=1,2,3,4......n,矩阵行数n表示选取的图像帧数;步骤4,用卷积神经网络进行SAR目标交互行为类型识别,输入为运动特征矩阵Fim,输出为该交互行为的类型;其中,卷积神经网络模型共有4层,包含2个卷积层和2个全连接层,2个卷积层后接有池化层,采用最大池化,下采样窗口的大小取2×2,滑动步长取2,ReLU非线性激活函数作用于每层卷积层,Softmax非线性函数作用于第2个全连接层的输出节点,卷积层中卷积核的滑动步长全部取2,输入特征图的周围没有补零,两个全连接层隐含节点个数分别为128和4,Dropout正则化方法应用于第2个卷积层和第1层全连接层。2.如权利要求1所述的一种基于卷积神经网络的SAR目标交互行为识别方法,其特征在于:所述步骤1中,采用Surendra背景更新算法从SAR图像序列中检测出运动目标所在的位置;首先将交互行为序列的第1帧图像I1作为背景B1,选取阈值T,设定迭代次数初始值m=1,最大迭代次数MAXSTEP,采用Surendra背景更新算法,对当前帧的帧差分图像|Ii-Ii-1|的像素值进行判断...

【专利技术属性】
技术研发人员:宦若虹杨鹏
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1