【技术实现步骤摘要】
一种基于图结构学习的结构化深度聚类网络及方法
[0001]本专利技术涉及信息处理
,具体涉及一种基于图结构学习的机器学习技术。
技术介绍
[0002]在信息检索、模式识别、数据分析等领域,聚类是一种重要的无监督识别过程,既可以作为其他数据挖掘算法的预处理步骤,又可以单独用于挖掘数据中的有效信息。随着数据量的与日俱增,传统的聚类算法已经无法在海量高维数据上取得良好的效果。因此深度聚类成为了研究的重点。深度聚类的基本思想是将聚类的目标与深度学习的强大表示能力相结合,因此,数据特征的充分学习和表示是深度聚类的关键先决条件。
[0003]目前的深度聚类算法,如自编码器、聚类深度神经网络等通常只关注数据本身的特征,而很少考虑数据的结构特征。但实际上,数据样本之间的结构特征能够揭示样本之间潜在的相似性,从一个新的角度为学习数据的特征表示提供了监督信息。为了充分利用数据本身的特征和数据之间的结构化特征,一些基于图卷积网络(GCN)、图自编码器等的聚类算法被陆续提出,但这些算法的前提都是假设图结构是正确的,而对于图形可能存在噪 ...
【技术保护点】
【技术特征摘要】
1.一种基于图结构学习的结构化深度聚类网络,其特征在于,包括:节点特征学习模块,被配置为提取数据节点自身的特征;结构化数据特征学习模块,被配置为学习结构化数据特征;图结构学习模块,被配置为根据数据特征,包括节点特征和结构化数据特征,对图结构进行学习,并将学习到的图结构用于数据特征的进一步学习;自监督聚类模块,被配置为对各学习模块的聚类效果进行监督,从而对整个聚类网络的数据特征提取过程进行优化。2.如权利要求1所述的深度聚类网络,其特征在于,所述图结构学习模块被配置为捕获数据的结构信息,将节点之间的边的权值表示为这两个节点之间的距离度量,通过度量函数的学习实现图结构的学习。3.如权利要求1所述的深度聚类网络,其特征在于,所述图结构学习模块的损失函数表示为:L
gra
=αΩ(A,X)+f(A)其中,α≥0;Ω(A,X)表示学习到的图的平滑性:其中,X为原始数据,一行为一条数据,列表示数据的维度,x
i
,x
j
分别表示X的第i、j行,tr代表矩阵的迹,即对角线元素之和,L=D
‑
A是图的拉普拉斯矩阵,D代表了图中节点的度,n是数据集中数据样本的总数,A是学习到的图的邻接矩阵;f(A)表示学习到的图的连通性和稀疏性之间的对抗平衡:其中,β,γ≥0,此处的1代表元素均为1的列向量,A1代表了矩阵A和列向量1的乘积,‖A‖
...
【专利技术属性】
技术研发人员:袁汉宁,崔酉至,王树良,李琦,党迎旭,耿晶,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。