System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于模块化网络建模视角间关系的多视角聚类方法技术_技高网

一种基于模块化网络建模视角间关系的多视角聚类方法技术

技术编号:40419641 阅读:6 留言:0更新日期:2024-02-20 22:38
本发明专利技术公开了一种基于模块化网络建模视角间关系的多视角聚类方法,该方法包括以下步骤:通过提取数据不同视角的特征,构建多视角数据库;构建基于模块化的编码器‑解码器神经网络提取并训练得到多视角数据的统一表达;将统一表达进行转换并构造辅助优化目标函数;基于上述目标函数对模块化的编码器‑解码器中的编码器进行再优化获得优化的多视角数据统一表达;对多视角数据统一表达进行聚类得到多视角聚类结果。本发明专利技术利用模块化的编码器‑解码器神经网络进行多视角数据的统一表达获取,可以灵活且有效地建模多视角数据之间的关系,通过辅助优化目标函数进行编码器的优化,将进一步提升多视角聚类的性能。

【技术实现步骤摘要】

本专利技术涉及模式识别,具体涉及一种基于模块化网络建模视角间关系的多视角聚类方法


技术介绍

1、现实世界的数据往往呈现出多视角的特性,例如对事件的描述可以通过文本以及图像进行刻画,图像数据往往可以通过不同的视觉描述算子如sift、gist进行表示,文本可以通过各种词袋特征如bow、tf-idf进行表示。对多视角数据分析往往可以利用多视角数据表现出来的互补与一致特性提升性能,因此多视角数据分析受到研究者的广泛关注。多视角聚类,作为一种典型的无监督学习任务,通过将不同数据聚集到不同类别中,在现实世界巨大的无标注数据处理中具有重要的作用。为进行有效的多视角聚类,一般需要对多视角数据之间的互补与一致特性进行建模,但是现有的方法往往基于特定假设进行多视角统一表达的学习,难以应对各种数据表现特性的多视角聚类任务,不能有效地实现多视角数据间关系灵活的建模,需要提出更有效且灵活的多视角关系建模算法。


技术实现思路

1、专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于模块化网络建模视角间关系的多视角聚类方法。该方法利用模块化的编码器-解码器神经网络进行多视角数据的统一表达获取,可以灵活且有效地建模多视角数据之间的关系,通过辅助优化目标函数进行编码器的优化,将进一步提升多视角聚类的性能。

2、为实现上述目的,本专利技术采用的技术方案为:一种基于模块化网络建模视角间关系的多视角聚类方法,包括以下步骤:

3、步骤s1,对于给定的数据样本,根据样本的类型提取数据的多个视角的特征,构成多视角数据集;

4、步骤s2,构建基于模块化的编码器-解码器神经网络进行多视角数据的统一表达建模,通过最小化多个视角的编解码误差训练得到多视角数据的统一表达;

5、步骤s3,根据所述步骤s2中的多视角统一表达进行辅助优化目标函数的构建;

6、步骤s4,基于所述步骤s3中的辅助优化目标函数通过最小化该目标函数优化多视角的编码器,进而获得优化的多视角数据统一表达;

7、步骤s5,对所述多视角数据统一表达进行聚类获得多视角数据的聚类结果。

8、作为本专利技术的一种优选实施方式:所述样本的类型包括图像数据、文本数据和图像文本数据;

9、对于图像数据,采用提取图像的不同视觉描述子构成多视角数据;

10、对于文本数据,采用提取文本的不同词袋模型特征构成多视角数据;

11、对于图像文本数据,则分别提取图像的视角描述子与文本的词袋模型特征构成多视角数据。

12、作为本专利技术的一种优选实施方式:所述步骤s2中的模块化的编码器-解码器神经网络包括多视角编码器模块与多视角解码器模块,其中,多视角编码器模块由视角独立编码模块与模块化编码模块组成,多视角解码器模块与编码器模块对称设计,由视角独立解码模块与模块化解码模块组成。

13、作为本专利技术的一种优选实施方式:所述步骤s2具体包括以下步骤:

14、步骤s2.1,将多视角数据送入视角独立编码模块后得到模块化编码模块的输入,各视角独立编码后各个视角特征维度相同;

15、步骤s2.2,求各个视角经过模块化编码模块后的表达,其中模块化编码模块由层组成,每层包含个模块,第视角下第层第模块计算为:

16、

17、其中,为第视角下第层模块与第层模块之间的权重系数,为层模块的计算权重,所有视角共享, 为第视角下第层模块的输入,relu为激活函数。上述计算权重为待学习参数,权重系数计算方式为:

18、

19、

20、其中为层与层的权重矩阵,为层的计算权重,所有视角共享,为待学习参数,第层输出即为各个视角经过模块化编码模块后的表达:

21、

22、步骤s2.3多视角统一表达为各个视角表达加权平均:

23、

24、其中,为总的视角个数。

25、步骤s2.4 以与多视角编码器对称的方式构造多视角解码器,各个视角输入经过编码器-编解码神经网络获得解码输出,通过最小化目标函数获得,进而获得:

26、

27、作为本专利技术的一种优选实施方式:所述步骤s2中, 计算为:

28、

29、

30、其中为视角独立编码后的输出。

31、作为本专利技术的一种优选实施方式:所述步骤s3具体包括以下步骤:步骤s3.1 将多视角统一表达送k均值聚类算法获得个聚类中心以及每个样本属于各个聚类的概率,样本属于聚类的概率为:

32、

33、步骤s3.2 依据构造辅助变量:

34、

35、

36、步骤s3.3 构造辅助优化目标函数:

37、

38、作为本专利技术的一种优选实施方式:步骤s4中辅助优化目标函数最小化时仅优化编码器权重参数,优化完成计算获得多视角统一表达。

39、作为本专利技术的一种优选实施方式:所述步骤s5中的聚类为标准的谱聚类算法完成最终的聚类。

40、本专利技术相比现有技术,具有以下有益效果:

41、该方法利用模块化的编码器-解码器神经网络进行多视角数据的统一表达获取,可以灵活且有效地建模多视角数据之间的关系,通过辅助优化目标函数进行编码器的优化,将进一步提升多视角聚类的性能。

本文档来自技高网...

【技术保护点】

1.一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述样本的类型包括图像数据、文本数据和图像文本数据;

3.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述步骤S2中的模块化的编码器-解码器神经网络包括多视角编码器模块与多视角解码器模块,其中,多视角编码器模块由视角独立编码模块与模块化编码模块组成,多视角解码器模块与编码器模块对称设计,由视角独立解码模块与模块化解码模块组成。

4.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述步骤S2具体包括以下步骤:

5.根据权利要求4所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述步骤S2中, 计算为:

6.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述步骤S3具体包括以下步骤:步骤S3.1 将多视角统一表达送K均值聚类算法获得个聚类中心以及每个样本属于各个聚类的概率,样本属于聚类的概率为:;步骤S3.2 依据构造辅助变量:;;步骤S3.3 构造辅助优化目标函数:。

7.根据权利要求6所述的方法,其特征在于,步骤S4中辅助优化目标函数最小化时仅优化编码器权重参数,优化完成计算获得多视角统一表达。

8.根据权利要求1所述的方法,其特征在于,所述步骤S5中的聚类为标准的谱聚类算法完成最终的聚类。

...

【技术特征摘要】

1.一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述样本的类型包括图像数据、文本数据和图像文本数据;

3.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述步骤s2中的模块化的编码器-解码器神经网络包括多视角编码器模块与多视角解码器模块,其中,多视角编码器模块由视角独立编码模块与模块化编码模块组成,多视角解码器模块与编码器模块对称设计,由视角独立解码模块与模块化解码模块组成。

4.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法,其特征在于,所述步骤s2具体包括以下步骤:

...

【专利技术属性】
技术研发人员:刘如一孙玉宝
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1