一种零样本侧扫声呐图像目标分类方法技术

技术编号:25398890 阅读:59 留言:0更新日期:2020-08-25 23:04
本发明专利技术公开了一种零样本侧扫声呐图像目标分类方法,根据任意待识别侧扫声呐图像目标类别信息,获取同类别的常规光学图像,并对其进行类别标注,获取一些较为容易获得的不包含待识别类别目标的侧扫声呐图像。然后使用针对侧扫声呐图像的风格迁移方法,以常规光学图像和侧扫声呐图像作为输入,生成某特定类别的仿真侧扫声呐图像,并根据生成的仿真侧扫声呐图像数据集训练深度神经网络,最后,使用由仿真侧扫声呐数据集训练得到的深度神经网络即可应用于对某特定类别的侧扫声呐图像进行分类识别。本发明专利技术可以在没有可用训练样本的情况下,依然准确的实现某特定类别目标的侧扫声呐图像分类,解决因样本无法获取导致的无法训练识别网络的问题。

【技术实现步骤摘要】
一种零样本侧扫声呐图像目标分类方法
本专利技术涉及零样本侧扫声呐图像目标分类方法,特别是一种采用伪样本合成的零样本侧扫声呐图像目标分类方法。
技术介绍
侧扫声呐是水下探测、目标搜寻等领域应用最为广泛的传感器,近年来,随着海洋开发活动的开展,声呐设备的应用已经不仅仅局限于军事应用,在商业和民用领域也有广泛的应用,如海底资源检测、石油勘探、海上救援、海底地形地貌图自动绘制及鱼群探测等等。然而目前的水下机器人大多只具备侧扫声呐图像数据获取功能,对侧扫声呐图像的解释和判读依然主要靠人工进行。当扫测海域面积大、特征地貌数量庞大时,使用人工识别需要耗费大量的人力及时间,若使水下机器人具有自主目标识别能力,则将极大改善这一问题。当前的监督学习方法都需要大量的带有标注的训练样本进行大量的学习,才可获得较好的分类效果,然而侧扫声呐图像数据获取难度复杂、成本高,导致包含目标的可用的训练样本数量十分稀少,甚至某些不常见类别,完全没有可用的训练样本。与传统的监督学习方法不同,零样本目标识别方法的目的在于识别那些训练过程中没有训练样本的类别;零样本目标识别方法受人类识别未见类样本的过程启发得到,例如,人类通过观察某一目标的光学图像和对应的侧扫声呐图像,即可根据其他类别的光学图像,想象出该类别的侧扫声呐图像的大概表象。
技术实现思路
针对上述现有技术,本专利技术要解决的技术问题是提供一种采用伪样本合成的零样本侧扫声呐图像目标分类方法,通过待识别类别的常规光学图像和一些其他类别的侧扫声呐图像,合成该待识别类别的仿真侧扫声呐图像,从而将零样本问题转换为监督学习问题,从而克服因没有可用训练样本导致的无法应用监督学习的问题。为解决上述技术问题,本专利技术的一种零样本侧扫声呐图像目标分类方法,包括以下步骤:步骤一:确定待识别的侧扫声呐图像目标的类别,然后获取与待识别的侧扫声呐图像目标类别相同的光学图像数据集并将其作为源领域数据集;步骤二:获取不包含待识别的侧扫声呐图像目标类别的侧扫声呐图像;步骤三:构建一个卷积神经网络分类模型,包括伪样本合成网络和样本分类网络;步骤四:进行卷积神经网络分类模型训练:将光学图像数据集作为伪样本合成网络的内容输入,将步骤二获取的侧扫声呐图像作为伪样本合成网络的风格输入,伪样本生成网络融合内容输入和风格输入并生成仿真侧扫声呐图像,即待识别类别的伪样本,对所有光学图像进行伪样本合成后,得到伪样本数据集,伪样本数据集中图像的类别信息与对应的光学图像类别信息一致;步骤五:进行卷积神经网络分类模型训练:样本分类网络以伪样本数据集为输入,类别预测为输出,通过前向传播方法,计算分类损失值,然后使用误差反向传播算法将损失值反向传播,通过随机梯度下降算法调整分类网络中的神经元连接权重参数;步骤六:对损失值设定最小阈值,判断分类网络是否训练完成:若分类损失值大于最小阈值,重复步骤五;否则,则训练完成,保存分类网络全部参数,即可使用该分类网络,对真实侧扫声呐图像进行分类预测。本专利技术还包括:1.步骤四中伪样本生成网络融合内容输入和风格输入并生成仿真侧扫声呐图像具体为:伪样本生成网络采用自编码网络结构,包括编码器和解码器,编码器提取光学图像的特征,并进行特征白化操作,得到白化后的光学图像特征,然后编码器提取侧扫声呐图像的特征,并进行中心化操作,再将白化后的光学图像特征与侧扫声呐图像特征融合进行反白化变换,得到融合后的特征,融合后的特征传入解码器,解码器将融合后的特征映射成图像,得到伪样本。2.解码器将融合后的特征映射成图像包括:解码器进行特征上采样,对上采样后的特征图中激活值为0的部分填充随机噪声。本专利技术的有益效果:本专利技术根据任意待识别侧扫声呐图像目标类别信息,获取同类别的常规光学图像,并对其进行类别标注,获取一些较为容易获得的不包含待识别类别目标的侧扫声呐图像。然后使用本专利技术中所述的针对侧扫声呐图像的风格迁移方法,以常规光学图像和侧扫声呐图像作为输入,生成某特定类别的仿真侧扫声呐图像,并根据生成的仿真侧扫声呐图像数据集训练深度神经网络,最后,使用由仿真侧扫声呐数据集训练得到的深度神经网络即可应用于对某特定类别的侧扫声呐图像进行分类识别。本专利技术与现有技术相比,本专利技术使用与待识别侧扫声呐图像目标类别相同的常规光学图像及其他容易获得的侧扫声呐图像,合成对于某个特定待识别类别的仿真侧扫声呐图像,即伪样本,并通过伪样本训练分类网络,以此来实现在没有可用训练样本的情况下,依然可以准确的实现某特定类别目标的侧扫声呐图像分类,克服因样本无法获取导致的无法训练识别网络的难题。本方法通过对难以获得可用训练样本的目标类别,通过专用的风格迁移方法对这些类别合成伪样本,从而将零样本问题转换为传统的监督学习问题,同时对于伪特征合成,采用更为高效的风格迁移合成模型,通过使用尽可能多的侧扫声呐图像作为风格图像,从而保证了生成伪样本风格的丰富性,从而使得训练得到的样本分类网络对各种不同型号侧扫声呐采集的数据均具有很好的分类能力。附图说明图1是本专利技术方法实现过程框图。图2是本专利技术零样本分类方法网络结构框图。图3是构建的侧扫声呐图像数据集。图4是构建的源领域图像数据集样本示例。图5是输入的光学图像及侧扫声呐图像示例,侧扫声呐图像放置于光学图像左上角。图6是以图5中示例图像为输入,生成的伪样本。图7是部分分类结果示例。具体实施方式下面结合附图对本专利技术具体实施方式做进一步说明。结合图1和图2,本专利技术技术方案包括以下几个步骤:步骤一:明确待识别的侧扫声呐图像目标类别,首先获取与待识别类别相同类别的常规光学图像数据集,并将其命名为源领域数据集;步骤二:通过网络搜索等方式获取一些容易获取的不包含待识别类别的侧扫声呐图像;步骤三:构建一个卷积神经网络分类模型,卷积神经网络分类模型分为两个子网络,第一为伪样本合成网络,第二为样本分类网络。步骤四:训练时,将光学图像数据集作为伪样本合成网络的内容输入,将获取的不包含特定待识别类别样本的侧扫声呐图像作为伪样本合成网络的风格输入;伪样本生成网络融合光学图像的内容和侧扫声呐图像的风格,生成仿真侧扫声呐图像,对所有光学图像进行伪样本合成后,得到伪样本数据集,伪样本数据集中图像的类别信息与对应的光学图像类别信息一致;步骤五:训练时,卷积神经网络分类模型的分类网络以伪样本数据集为输入,类别预测为输出,通过前向传播方法,计算分类损失值,然后使用误差反向传播算法将损失值反向传播,通过随机梯度下降算法调整分类网络中的神经元连接权重参数;步骤六:通过对损失值设定最小阈值,判断分类网络是否训练完成,若分类损失值大于最小阈值,重复步骤五,若分类损失值小于或等于最小阈值,则训练完成,保存分类网络全部参数,此时,即可使用该分类网络,对真实侧扫声呐图像进行分类预测。步骤四中,风格迁移方法为专用于侧扫声呐图像风格迁移应用的方本文档来自技高网...

【技术保护点】
1.一种零样本侧扫声呐图像目标分类方法,其特征在于,包括以下步骤:/n步骤一:确定待识别的侧扫声呐图像目标的类别,然后获取与待识别的侧扫声呐图像目标类别相同的光学图像数据集并将其作为源领域数据集;/n步骤二:获取不包含待识别的侧扫声呐图像目标类别的侧扫声呐图像;/n步骤三:构建一个卷积神经网络分类模型,包括伪样本合成网络和样本分类网络;/n步骤四:进行卷积神经网络分类模型训练:将光学图像数据集作为伪样本合成网络的内容输入,将步骤二获取的侧扫声呐图像作为伪样本合成网络的风格输入,伪样本生成网络融合内容输入和风格输入并生成仿真侧扫声呐图像,即待识别类别的伪样本,对所有光学图像进行伪样本合成后,得到伪样本数据集,伪样本数据集中图像的类别信息与对应的光学图像类别信息一致;/n步骤五:进行卷积神经网络分类模型训练:样本分类网络以伪样本数据集为输入,类别预测为输出,通过前向传播方法,计算分类损失值,然后使用误差反向传播算法将损失值反向传播,通过随机梯度下降算法调整分类网络中的神经元连接权重参数;/n步骤六:对损失值设定最小阈值,判断分类网络是否训练完成:若分类损失值大于最小阈值,重复步骤五;否则,则训练完成,保存分类网络全部参数,即可使用该分类网络,对真实侧扫声呐图像进行分类预测。/n...

【技术特征摘要】
1.一种零样本侧扫声呐图像目标分类方法,其特征在于,包括以下步骤:
步骤一:确定待识别的侧扫声呐图像目标的类别,然后获取与待识别的侧扫声呐图像目标类别相同的光学图像数据集并将其作为源领域数据集;
步骤二:获取不包含待识别的侧扫声呐图像目标类别的侧扫声呐图像;
步骤三:构建一个卷积神经网络分类模型,包括伪样本合成网络和样本分类网络;
步骤四:进行卷积神经网络分类模型训练:将光学图像数据集作为伪样本合成网络的内容输入,将步骤二获取的侧扫声呐图像作为伪样本合成网络的风格输入,伪样本生成网络融合内容输入和风格输入并生成仿真侧扫声呐图像,即待识别类别的伪样本,对所有光学图像进行伪样本合成后,得到伪样本数据集,伪样本数据集中图像的类别信息与对应的光学图像类别信息一致;
步骤五:进行卷积神经网络分类模型训练:样本分类网络以伪样本数据集为输入,类别预测为输出,通过前向传播方法,计算分类损失值,然后使用误差反向传播算法将损失值反向传播,通过随机梯度下降算法调整分类网络中的神经元连接权...

【专利技术属性】
技术研发人员:叶秀芬李传龙刘文智李海波刘红黄汉杰陈宝伟
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1