基于迁移学习的内河船舶重识别方法、设备及存储介质技术

技术编号:24458293 阅读:19 留言:0更新日期:2020-06-10 16:13
本发明专利技术提供了一种基于迁移学习的内河船舶重识别方法、设备及存储介质,重识别方法利用风格迁移后的行人重识别数据集,初始化一个CNN模型得到第一重识别模型,并利用第一重识别模型对无标签的内河船舶数据集进行特征提取;利用无监督K‑Means聚类算法,对第一重识别模型提取的特征进行聚类,得到具有伪标签的第一内河船舶数据集;利用第一内河船舶数据集对第一重识别模型微调,得到内河船舶重识别模型。利用内河船舶重识别模型,得到每一张待识别内河船舶图像的候选图像列表。本发明专利技术提出的基于迁移学习的内河船舶重识别方法不需要对内河船舶数据集进行标注,很好的解决了现有技术中在同域场景下内河船舶数据集有限、标注成本大以及精度不高的问题。

Method, equipment and storage medium of inland river ship weight recognition based on Transfer Learning

【技术实现步骤摘要】
基于迁移学习的内河船舶重识别方法、设备及存储介质
本专利技术涉及计算机视觉
,特别涉及基于迁移学习的内河船舶重识别方法、设备及存储介质。
技术介绍
随着计算机视觉技术的不断发展,大规模的摄像头布置在城市的各个角落,行人重识别技术结合目前大量的图像和视频数据,在智能视频监控以及智能安保等领域,发挥着越来越重要的作用。得益于深度学习算法的快速发展、硬件计算能力的迅速提升以及大规模数据集如CUHK03、Market-1501、MSMT17等的公布,行人重识别技术在一些标准公开数据集上的测试准确率已经得到了显著提高。现有技术中,应用最为广泛的重识别方法的基本思想是把重识别问题转换为分类问题,方法缺点是对于给定一个目标域,需要大量有标签的数据集来初始化CNN模型。具体地,以内河船舶重识别方法为例,其基本方法为,首先,利用一个特定场景的大量有标签的数据集预训练一个CNN(卷积神经网络)模型,比如采用ResNet-50模型;然后,提取输入图像的全局特征,之后接一个全连接层和softmax分类器,把每一类内河船舶视为一类,通过优化分类损失函数来训练这个模型。尽管基于深度神经卷积网络的方法取得了显著的进展,而现实中,针对一个特定的场景,往往拿不到这么多的数据集从而导致模型的测试性能不佳。进一步地,不仅如此,人为对数据集进行标注往往又花费较大的人力和物力。这其中,较为典型的就是内河船舶重识别方法,就普遍面临这样的问题,目前针对内河船舶重识别的数据集非常有限,同时给定一个特定的内河船舶重识别场景,为了达到令人满意的识别精度,往往需要花费大量的人力和物力去标注内河船舶样本来训练重识别模型。因此,如何解决内河船舶标注样本不足,从而进一步提高内河船舶重识别方法的精度,成为本领域技术人员亟待解决的技术问题之一。需要说明的是,公开于该专利技术
技术介绍
部分的信息仅仅旨在加深对本专利技术一般
技术介绍
的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
技术实现思路
本专利技术所要解决的技术问题为,现有技术中内河船舶重识别方法在同域场景下数据集有限,标注成本大以及识别精度不高的问题。本专利技术的其中一个目的是提供一种基于迁移学习的内河船舶重识别方法,另外一个目的是提供一种计算机设备和提供一种计算机存储介质。为了实现上述第一个目的,本专利技术通过以下技术方案予以实现:一种基于迁移学习的内河船舶重识别方法,包括如下步骤:S100:利用风格迁移后的行人重识别数据集,初始化一个CNN模型得到第一重识别模型,并利用所述第一重识别模型对无标签的内河船舶数据集进行特征提取;S200:利用无监督K-Means聚类算法,对所述第一重识别模型提取的特征进行聚类,得到具有伪标签的第一内河船舶数据集;S300:利用所述第一内河船舶数据集对所述第一重识别模型微调,得到内河船舶重识别模型;S400:利用所述内河船舶重识别模型,提取待识别内河船舶数据集中每一张待识别内河船舶图像的深度特征得到特征向量,计算所述特征向量之间的欧式距离,得到每一张待识别内河船舶图像的候选图像列表;其中,所述风格迁移包括将所述行人重识别数据集中的图像风格迁移为所述无标签的内河船舶数据集中的图像风格。可选地,在步骤S100之前,还包括以下预处理步骤,分别对所述行人重识别数据集和所述无标签的内河船舶数据集中的每一张图片进行归一化处理,得到大小统一的图片;利用SPGAN模型,将所述行人重识别数据集中的图像风格迁移为所述无标签的内河船舶数据集中的图像风格,得到所述风格迁移后的行人重识别数据集。可选地,步骤S100中所述利用风格迁移后的行人重识别数据集,初始化一个CNN模型得到第一重识别模型,并利用所述第一重识别模型对无标签的内河船舶数据集进行特征提取,包括以下方法,S110:加载一个在ImageNet上预训练的ResNet-50残差网络作为预训练模型;S120:将所述风格迁移后的行人重识别数据集作为训练数据集,输入所述预训练模型对其进行训练,得到具有特征提取能力的所述第一重识别模型;S130:利用训练好的所述第一重识别模型对所述无标签的内河船舶数据集进行特征提取。可选地,步骤S200中,所述利用无监督K-Means聚类算法,对所述第一重识别模型提取的特征进行聚类,得到具有伪标签的第一内河船舶数据集,包括以下骤,S210:设定所述无监督K-means聚类算法的聚类可靠性阈值λ;S220:根据所述无标签的内河船舶数据集的数据规模,设定所述无标签的内河船舶数据集的聚类中心K;S230:加载所述第一重识别模型以及利用所述第一重识别模型对无标签的内河船舶数据集提取的特征;S240:利用所述无监督K-means聚类算法对所述提取的特征聚类;S250:计算所述无标签的内河船舶数据集中的每一个内河船舶图像与所述聚类中心K之间的距离,将可靠性大于所述聚类可靠性阈值λ的所述内河船舶图像划分为同一类,得到具有伪标签的第一内河船舶数据集。可选地,所述聚类可靠性阈值λ取值范围包括0.6至0.95。可选地,步骤S300中所述利用所述第一内河船舶数据集对所述第一重识别模型微调,得到内河船舶重识别模型,包括以下方法,S310:将所述第一重识别模型作为第N版本重识别模型,将所述第一内河船舶数据集作为第N版本的训练数据集,N=1;S320:将第N版本的训练数据集作为输入训练数据集,输入第N版本重识别模型对其进行训练,得到具有特征提取能力的第N+1版本重识别模型;S330:使用第N+1版本重识别模型,对第N版本的训练数据集进行特征提取并使用无监督K-Means聚类算法对其聚类,得到第N+1版本的训练数据集;S340:判断所述第N+1版本重识别模型是否满足预设条件,若满足,执行步骤S350;否则,N=N+1,执行步骤S320;S350:将所述第N+1版本重识别模型作为所述内河船舶重识别模型。可选地,步骤S340中所述判断所述第N+1版本重识别模型是否满足预设条件中,所述预设条件包括,所述第N+1版本的训练数据集的可靠样本数量与所述第N版本的训练数据集的可靠样本数量相同。可选地,步骤S400中利用所述内河船舶重识别模型,提取待识别内河船舶数据集中每一张待识别内河船舶图像的深度特征得到特征向量,计算所述特征向量的之间的欧式距离,得到每一张待识别内河船舶图像的候选图像列表,包括以下方法,S410:将所述待识别内河船舶数据集输入到所述内河船舶重识别模型进行前向推理,把所述内河船舶重识别模型的最后一个池化层的输出转换为一维特征向量,得到所述特征向量,并对每一个所述待识别内河船舶图像分类预测;S420:计算每一张内河船舶图像的所述特征向量之间的欧式距离,得到所述内河船舶图像间的相似度,从而得到每个所述待识别内河船舶图像的候选图像列表;S430:对所述候选图像列表按照相似本文档来自技高网
...

【技术保护点】
1.一种基于迁移学习的内河船舶重识别方法,其特征在于,包括如下步骤:/nS100:利用风格迁移后的行人重识别数据集,初始化一个CNN模型得到第一重识别模型,并利用所述第一重识别模型对无标签的内河船舶数据集进行特征提取;/nS200:利用无监督K-Means聚类算法,对所述第一重识别模型提取的特征进行聚类,得到具有伪标签的第一内河船舶数据集;/nS300:利用所述第一内河船舶数据集对所述第一重识别模型微调,得到内河船舶重识别模型;/nS400:利用所述内河船舶重识别模型,提取待识别内河船舶数据集中每一张待识别内河船舶图像的深度特征得到特征向量,计算所述特征向量之间的欧式距离,得到每一张待识别内河船舶图像的候选图像列表;/n其中,所述风格迁移包括将所述行人重识别数据集中的图像风格迁移为所述无标签的内河船舶数据集中的图像风格。/n

【技术特征摘要】
1.一种基于迁移学习的内河船舶重识别方法,其特征在于,包括如下步骤:
S100:利用风格迁移后的行人重识别数据集,初始化一个CNN模型得到第一重识别模型,并利用所述第一重识别模型对无标签的内河船舶数据集进行特征提取;
S200:利用无监督K-Means聚类算法,对所述第一重识别模型提取的特征进行聚类,得到具有伪标签的第一内河船舶数据集;
S300:利用所述第一内河船舶数据集对所述第一重识别模型微调,得到内河船舶重识别模型;
S400:利用所述内河船舶重识别模型,提取待识别内河船舶数据集中每一张待识别内河船舶图像的深度特征得到特征向量,计算所述特征向量之间的欧式距离,得到每一张待识别内河船舶图像的候选图像列表;
其中,所述风格迁移包括将所述行人重识别数据集中的图像风格迁移为所述无标签的内河船舶数据集中的图像风格。


2.根据权利要求1所述的基于迁移学习的内河船舶重识别方法,其特征在于,在步骤S100之前,还包括以下预处理步骤,
分别对所述行人重识别数据集和所述无标签的内河船舶数据集中的每一张图片进行归一化处理,得到大小统一的图片;
利用SPGAN模型,将所述行人重识别数据集中的图像风格迁移为所述无标签的内河船舶数据集中的图像风格,得到所述风格迁移后的行人重识别数据集。


3.根据权利要求1所述的基于迁移学习的内河船舶重识别方法,其特征在于,步骤S100中所述利用风格迁移后的行人重识别数据集,初始化一个CNN模型得到第一重识别模型,并利用所述第一重识别模型对无标签的内河船舶数据集进行特征提取,包括以下方法,
S110:加载一个在ImageNet上预训练的ResNet-50残差网络作为预训练模型;
S120:将所述风格迁移后的行人重识别数据集作为训练数据集,输入所述预训练模型对其行训练,得到具有特征提取能力的所述第一重识别模型;
S130:利用训练好的所述第一重识别模型对所述无标签的内河船舶数据集进行特征提取。


4.根据权利要求1所述的基于迁移学习的内河船舶重识别方法,其特征在于,步骤S200中,所述利用无监督K-Means聚类算法,对所述第一重识别模型提取的特征进行聚类,得到具有伪标签的第一内河船舶数据集,包括以下骤,
S210:设定所述无监督K-means聚类算法的聚类可靠性阈值λ;
S220:根据所述无标签的内河船舶数据集的数据规模,设定所述无标签的内河船舶数据集的聚类中心K;
S230:加载所述第一重识别模型以及利用所述第一重识别模型对无标签的内河船舶数据集提取的特征;
S240:利用所述无监督K-means聚类算法对所述提取的特征聚类;
S250:计算所述无标签的内河船舶数据集中的每一个内河船舶图像与所述聚类中心K之间的距离,将可靠性大于所述聚类可靠性阈值λ的所述内河船舶图像划分为同...

【专利技术属性】
技术研发人员:付宇卓刘婷向孙程
申请(专利权)人:上海交通大学四川九洲电器集团有限责任公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1