一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法技术

技术编号：41261775 阅读：5 留言：0更新日期：2024-05-11 09:19

一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，属于多媒体信息处理中的动物聚类处理领域。该方法首先对动物图像数据集提取样本特征进行归一化处理来构建多视角公共子空间学习网络，从而为每个视角构建k近邻图和高维流形分布矩阵，并设置可学习的锚点。然后将样本特征和k近邻图输入到子空间学习网络中，重构原始特征并计算损失函数。同时，施加流形正则化约束来约束网络学习表示，得到流形正则化的公共子空间自表示损失函数。通过小批量随机梯度下降算法训练网络，直至收敛。最后利用学习到的公共子空间进行谱聚类，得到聚类结果。与其他方法相比，本发明专利技术的精确度更高，性能更加稳健。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于动物形态学和多媒体信息处理中的动物图像数据处理领域，具体涉及一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法。

技术介绍

1、在动物形态学和多媒体信息处理领域，动物数据是一种广泛可获取的数据，对动物数据进行聚类分析，可以挖掘出其中有关动物分类、进化演变等潜在类别信息。对动物数据进行多个渠道采集得到的数据称为多视角动物数据，其能够更全面地对动物进行描述。然而，由于数据采集过程中受到技术限制、环境变化等因素影响所造成的部分数据丢失或无法收集所导致的多视角动物数据非完备问题。现有基于子空间学习的多视角聚类方法仅能处理完备视角的数据聚类问题，而无法应用于视角信息非完备的数据处理，这也给非完备多视角动物数据类别划分问题带来巨大挑战，因此需要有效且新颖技术方法解决非完备多视角动物数据的聚类问题。

技术实现思路

1、为了解决上述问题，本专利技术提供了一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，所述方法包括步骤：

2、从非完备动物图像数据集中提取存在样本特征，并对所有特征向量的每个分量进行归一化。

3、通过构建多视角公共子空间学习网络，并随机初始化网络权重。

4、对每一视角，分别构建k近邻图矩阵和高维流形分布矩阵和可学锚点。

5、将所有视角的存在样本特征和相应的k近邻图矩阵输入所述子空间学习网络后构建各视角原始特征，并对网络所学表示施加流形正则化约束，得到总体损失函数。

6、对总体损

7、根据所得聚类结果，计算所述非完备多视角大规模动物图像数据集的聚类准确率。

8、进一步地，所述特征向量的每个分量归一化表达公式为：

9、

10、i＝1,2,...,n；v＝1,2,...,m

11、其中，i表示任一存在样本，v表示任一视角，n是样本数，m是视角数；表示样本i的特征向量，和分别表示的最小值和最大值。

12、进一步地，所述两个图卷积模块的表达公式为：

13、

14、

15、其中，relu是非线性激活函数层，batchnorm是批量归一化层，conv是图卷积层；是存在样本特征矩阵，是第一个图卷积模块的输出，hv是第二个图卷积模块的输出，av是k近邻图矩阵。视角专属图卷积编码层的最终输出为视角专属低维表示hv。

16、所述特征融合层将所有视角专属低维表示hv,v＝1,2,...,m进行加权融合，得到网络所学表示h的表达公式为：

17、

18、其中，m:,v表示缺失指示矩阵的第v列。

19、所述公共子空间输出层的表达公式为：

20、z＝softmax(linear(h))

21、其中，linear是带有权重和偏置的全连接层，softmax是将子空间矩阵的每行之和归一化为1的激活函数层；是网络输出的公共子空间矩阵，是网络所学表示；d是所学表示的特征维度，na是锚点数量。

22、进一步地，所述视角v的k近邻图矩阵av的表达公式为：

23、

24、其中，是k近邻图矩阵的第i行第j列的元素，i和j分别表示k近邻图上的两个结点；是结点i的k-邻域，由距离结点i最近的k个结点组成；若结点i和结点j之间存在一条边，则否则

25、所述视角v的高维流形分布矩阵的表达公式为：

26、

27、

28、其中，分别是存在样本i、j、l、k的特征向量；是样本i的高斯核宽度，由困惑度参数ppl决定。表示表示在高维空间中样本i为样本j邻居的概率；是流形分布矩阵pv第i行第j列的元素，表示样本i和样本j在高维空间中一方为另一方邻居的概率；||·||f表示矩阵的f范数。矩阵描述了在高维空间中样本的流形分布情况，所以称为高维流形分布矩阵。

29、所述对每一视角ν，分别构建na个可学锚点，其初始值为该视角随机采样得到的na个样本，表达公式为：

30、

31、v＝1,2,...,m

32、其中，矩阵v＝1,2,...,m表示各个视角的可学锚点，分别初始化为从该视角随机采样得到的na个样本，na表示锚点数；random-sample(x,c)表示以均匀采样从特征矩阵x中抽取c个样本。

33、进一步地，所述对网络所学表示施加的流形正则化约束表达公式为：

34、

35、其中，qv是视角v的低维流形分布矩阵。

36、所述流形正则化的公共子空间自表示总体损失函数，表达公式为：

37、

38、其中，lsubspace是公共子空间自表示损失函数，m:,v表示缺失指示矩阵的第v列，z是网络输出的公共子空间矩阵，是视角v的存在特征，cv是视角v的可学锚点；||·||f表示矩阵的f范数。

39、所述网络流行正则化约束项的表达公式为：

40、

41、其中，qv是视角v的低维流形分布矩阵，所述低维流形分布矩阵的表达公式为：

42、

43、其中，分别是网络所学表示h对应视角v存在样本i、j、l、k的表示向量；是矩阵qv第i行第j列的元素，代表样本i和样本j在低维空间中一方为另一方邻居的概率。qv描述了在低维空间中样本的流形分布情况，所以称为低维流形分布矩阵。

44、所述流形正则化的公共子空间自表示总体损失函数由公共子空间自表示损失函数lsubspace和流形正则化约束项lreg组成，表达公式为：

45、l＝lsubspace+λ·lreg

46、其中，λ＞0是权衡参数，l是流形正则化的公共子空间自表示总体损失函数。

47、进一步地，所述网络权重和各视角可学锚点的更新规则表达公式为：

48、

49、

50、v＝1,2,...,m

51、其中，θ是网络权重，α是学习率，是在小批量数据上估计的总体损失函数值，是关于网络权重θ的偏导数；cv是可学锚点，是关于可学锚点cv的偏导数。反复应用上述更新规则，直到的值收敛。

52、进一步地，根据所述聚类结果，计算出非完备多视角大规模动物图像数据集上的聚类准确率。

53、本专利技术提供了一种基于关键点子空间学习的非完备多视角大规模动物图像数据聚类方法，具有以下优势：

54、(1)所述方法利用了多视角公共子空间学习的目标函数，所学的公共子空间能同时表征各视角原始特征，充分挖掘了多视角公共子空间结构。

55、(2)所述方法采用了深度神经网络学习多视角特征到公共子空间矩阵的映射关系，更好的捕获二者之间的非线性关系，并且网络能重复用于同分布数据，节省网络训练的开销。

56、(3)所述方法采用了在线训练和预测算法，模本文档来自技高网...

【技术保护点】

1.一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，所述方法包括步骤：

2.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，从一个非完备多视角大规模动物图像数据集中提取存在样本特征，并将所有特征向量的每个分量归一化到[0,1]区间。提取的存在样本特征记作其中，表示所有视角的存在样本特征集合，是视角v的存在特征矩阵；M∈{0,1}n×m表示视角缺失指示矩阵，若样本i的第j个视角存在，则Mij＝1，否则Mij＝0；nv是存在样本数，dv是特征维度，m是视角数。

3.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，构建一个由多个视角专属图卷积编码层、一个特征融合层、一个公共子空间输出层组成的多视角公共子空间学习网络。

4.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，对存在样本的每一视角分别构建k近邻图矩阵和高维流形分布矩阵。对每一视角，分别构建na个可学锚点，并初始化为该视角随机采样得到的na个样本。

5.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，将所有视角的存在样本特征和相应的k近邻图矩阵输入所述子空间学习网络，以网络输出的公共子空间矩阵逐一乘以各视角的可学锚点，以重构各视角原始特征，对应的损失函数为公共子空间自表示损失函数。同时，对网络所学表示施加流形正则化约束，得到流形正则化的公共子空间自表示总体损失函数，定义如下：

6.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，使用小批量随机梯度下降算法最小化所述流形正则化的公共子空间自表示总体损失函数L，将所述公共子空间学习网络训练至收敛。网络权重和各视角可学锚点的更新规则定义如下：

7.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，根据所得聚类结果，计算所述非完备多视角大规模动物图像数据集上的聚类准确率。

...

【技术特征摘要】

1.一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，所述方法包括步骤：

2.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，从一个非完备多视角大规模动物图像数据集中提取存在样本特征，并将所有特征向量的每个分量归一化到[0,1]区间。提取的存在样本特征记作其中，表示所有视角的存在样本特征集合，是视角v的存在特征矩阵；m∈{0,1}n×m表示视角缺失指示矩阵，若样本i的第j个视角存在，则mij＝1，否则mij＝0；nv是存在样本数，dv是特征维度，m是视角数。

4.根据权利要求1所述的基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法，其特征在于，对存在样本的每一视角分别构建k近邻图矩阵和高维流形分布矩...

【专利技术属性】
技术研发人员：李骜，叶海天，许浩越，冯聪，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人