一种基于多分类器的零样本深海生物图片分类方法技术

技术编号：23162198 阅读：66 留言：0更新日期：2020-01-21 22:04

本发明专利技术公开了一种基于多分类器的零样本深海生物图片分类方法，包括以下步骤：(1)图像特征数据导入，数据集由可见类别和不可见类别的视觉特征、语义及标签信息组成，以有标签的常见海洋生物种类为可见类别，以数据匮乏的深海生物种类为不可见类别；(2)类别具体分类器训练，利用可见类别数据训练，在保留流形结构的基础上，为不同类别建立不同的视觉语义映射，以提高可见类别的分类准确率；(3)不可见类别推断，通过将可见类别与不可见类别语义之间的权重进行迁移，使用可见类别的映射矩阵合成不可见类别的映射矩阵，根据距离得出不可见类别的标签。本发明专利技术在一定程度上降低了映射域漂移的影响，准确易行。

A method of zero sample deep sea biological image classification based on multiple classifiers

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多分类器的零样本深海生物图片分类方法
本专利技术涉及零样本图像分类领域，具体涉及一种基于多分类器的零样本深海生物图片分类方法。
技术介绍
深海生物是海洋系统的重要组成部分，从生物多样性与生态系统的角度来看，深海生物种类繁多，具有极高的研究价值，在工业、医药、环保等领域也有广泛的应用价值。这些生物生活的深海地区，常年黑暗，不见阳光，而且温度低，压力大，海水含盐量高。人类对深海生物的了解通常来自于遥控潜艇拍摄的数据。多数已知物种的出现频率不够高，数据匮乏，不足以收集和标记一组具有代表性的示例图像。而且随着人类对深海的不断探索，新物种不断出现，获取足够的用于训练可靠分类器的标签信息变得越来越有挑战性。为了解决上述问题，零样本图像分类方法使用带标签的可见类别图像训练可见类别分类器，以语义为桥梁，将可见类别和不可见类别联系起来，以完成没有标签信息的不可见类别的分类。语义可以是视觉属性或者词向量等，视觉属性由人工标注而来，词向量可以通过网络爬虫等手段获得。人类在对某些常见类别有了一定认知之后，可以通过描述，辨别出从未见过的类别，零样本方法模拟的正是这种能力。本专利技术通过使用零样本分类方法，以有标签的常见海洋生物种类为可见类，训练分类器，利用对深海生物的描述，完成对数据匮乏的深海生物的分类问题。在零样本问题中，对于复杂的图片信息，提取到的特征具有高维特性，存在冗余信息。如何高效利用这些信息，为可见类别学习一个性能优良的分类器，以及如何将标签空间和语义空间进行有效对齐，使得对可见类别训练的分类器能够成功应用...

【技术保护点】
1.一种基于多分类器的零样本深海生物图片分类方法，其特征在于，所述的零样本深海生物图片分类方法包括如下步骤：/n利用已知公开数据集或者使用GoogleNet网络提取图片特征形成数据集，通过数据集导入每张图片的图像视觉特征数据、标签及语义描述，其中，所述的数据集由相互不重叠的可见类别数据和不可见类别数据组成，可见类别包含数据丰富的常见海洋生物种类，为模型需要学习的类别，不可见类别包含数据匮乏的深海海洋生物种类，为模型需要辨别的类别，所述的标签即图像的类别信息；/n类别具体分类器训练，利用可见类别数据训练，在保留流形结构的基础上，为不同类别建立不同的视觉特征空间到语义空间的映射；/n不可见类类别推断，通过将可见类别与不可见类别语义之间的权重进行迁移，使用可见类别的映射矩阵合成不可见类别的映射矩阵，根据距离得出不可见类别的标签，以达到分类目的。/n

【技术特征摘要】
1.一种基于多分类器的零样本深海生物图片分类方法，其特征在于，所述的零样本深海生物图片分类方法包括如下步骤：
利用已知公开数据集或者使用GoogleNet网络提取图片特征形成数据集，通过数据集导入每张图片的图像视觉特征数据、标签及语义描述，其中，所述的数据集由相互不重叠的可见类别数据和不可见类别数据组成，可见类别包含数据丰富的常见海洋生物种类，为模型需要学习的类别，不可见类别包含数据匮乏的深海海洋生物种类，为模型需要辨别的类别，所述的标签即图像的类别信息；
类别具体分类器训练，利用可见类别数据训练，在保留流形结构的基础上，为不同类别建立不同的视觉特征空间到语义空间的映射；
不可见类类别推断，通过将可见类别与不可见类别语义之间的权重进行迁移，使用可见类别的映射矩阵合成不可见类别的映射矩阵，根据距离得出不可见类别的标签，以达到分类目的。

2.根据权利要求1所述的一种基于多分类器的零样本深海生物图片分类方法，其特征在于，所述的通过数据集导入每张图片的图像特征数据之后，还包括：对图像特征数据进行归一化处理，归一化为[-1,1]之间。

3.根据权利要求1所述的一种基于多分类器的零样本深海生物图片分类方法，其特征在于，所述的可见类别共CS个，视觉特征数据其中d为视觉特征维度，nS为可见类别样本数，语义其中a为语义维度，每行为一个样本对应的语义向量下标S代表可见类别；
所述的不可见类别共CU个，可见类别和不可见类别无交集，视觉特征数据其中nU为不可见类别样本数，语义每行为一个样本对应的语义向量其中a为语义维度，下标U代表不可见类别。

4.根据权利要求3所述的一种基于多分类器的零样本深海生物图片分类方法，其特征在于，所述的类别具体分类器训练过程如下：
为每个不可见类别学习一个特定于类别C的映射矩阵d为视觉特征维度，a为语义维度，类别具体分类器模型如下：

【专利技术属性】
技术研发人员：周智恒，牛畅，尚俊媛，黄俊楚，张鹏宇，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人