基于带权重联合非负矩阵分解的属性图聚类方法及系统技术方案

技术编号：14388420 阅读：174 留言：0更新日期：2017-01-10 15:57

本发明专利技术提供了一种基于带权重联合非负矩阵分解的属性图聚类方法及系统，该属性图聚类方法包括构建融合拓扑关系与节点属性等特征统一目标函数及矩阵聚类：构建目标函数：该算法将拓扑关系和节点属性特征融合在统一目标函数中，并对每个属性特征进行加权；目标函数求解：通过对目标函数的求解，分解出包含拓扑关系和节点属性特征等信息的矩阵；矩阵聚类：对包含拓扑关系和节点属性特征等信息的矩阵进行聚类，然后把聚类后的结果返回给系统用户。本发明专利技术的有益效果是本发明专利技术的基于带权重联合非负矩阵分解的属性图聚类方法及系统，有效地融合了拓扑关系和节点属性等特征，并产生了更高的聚类性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及基于社交网络的数据处理方法及系统，尤其涉及基于带权重联合非负矩阵分解的属性图聚类方法及系统。
技术介绍
随着互联网技术的不断发展以及人们对社交需求的日益增长，微博、人人和QQ等网络社交媒体应用已经普遍流行于人们日常生活中，从而形成了大规模的网络社区。图挖掘是从海量社会网络数据获取有用信息的一个重要手段，而如何为用户返回对用户有实用价值的结果，是图挖掘发展和吸引用户的一个重要决定因素。图挖掘的目的是把具有较强联系的节点划分到同一个簇中，而把联系较弱的节点划分到不同的簇中。在现实社会网络中，节点间除了具有拓扑关系，大部分情况下节点自身也带有属性特征。针对该类社会网络的挖掘，通常称为属性图聚类，因此可以将社会网络挖掘问题转化为属性图聚类问题。属性图聚类是一种机器学习任务：图的节点之间的拓扑关系与节点自身属性作为输入，生成一个同时考虑这两部分特征的聚类结果作为输出。属性图聚类的提出在广告投放、社区探测和个性化推荐等领域都引起研究工作者的兴趣与深入研究。研究人员在研究社会网络中发掘各种新问题新技术并在历届的数据挖掘相关会议上发表探讨，近些年来，属性图聚类成为一个热门的研究问题。但是，目前技术在属性图聚类中缺乏基于非负矩阵分解的相关聚类方法。
技术实现思路
为了解决现有技术中的问题，本专利技术提供了一种带权重联合非负矩阵分解的属性图聚类方法及系统。本专利技术提供了一种带权重联合非负矩阵分解的属性图聚类方法，包括如下步骤：构建目标函数：给定一个属性图，根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数，使用对称非负矩阵去逼近拓扑关系的邻接矩阵，对节点属...
基于带权重联合非负矩阵分解的属性图聚类方法及系统

【技术保护点】
一种基于带权重联合非负矩阵分解的属性图聚类方法，其特征在于，包括如下步骤：构建目标函数：给定一个属性图，根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数，使用对称非负矩阵去逼近拓扑关系的邻接矩阵，对节点属性矩阵进行加权，并使用传统非负矩阵分解去逼近加权后的节点属性矩阵，然后将这两部分融合在统一的目标函数中；目标函数求解：根据构建的目标函数，对函数进行迭代求解，直至收敛，其中能够分解出一个包含拓扑关系与节点属性等信息的矩阵；矩阵聚类：根据目标函数求解得到的包含拓扑关系与节点属性等信息的矩阵，对其进行聚类，把聚类结果提供给系统用户。

【技术特征摘要】
1.一种基于带权重联合非负矩阵分解的属性图聚类方法，其特征在于，包括如下步骤：构建目标函数：给定一个属性图，根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数，使用对称非负矩阵去逼近拓扑关系的邻接矩阵，对节点属性矩阵进行加权，并使用传统非负矩阵分解去逼近加权后的节点属性矩阵，然后将这两部分融合在统一的目标函数中；目标函数求解：根据构建的目标函数，对函数进行迭代求解，直至收敛，其中能够分解出一个包含拓扑关系与节点属性等信息的矩阵；矩阵聚类：根据目标函数求解得到的包含拓扑关系与节点属性等信息的矩阵，对其进行聚类，把聚类结果提供给系统用户。2.根据权利要求1所述的属性图聚类方法，其特征在于：在所述构建目标函数步骤中，首先给定一个具有n个节点与m个属性特征的单属性图G＝(V,E,A)，假设这n个节点之间拓扑关系的邻接矩阵为它们的m个不同的属性特征组成的属性矩阵为其中表示非负实数集；然后给定两个矩阵分解因子其中k表示聚类簇的数目；与此同时，为了对这m个不同的属性赋予不同的权重，这里提供一个对角矩阵来对不同的属性进行加权；接着就可以得到两个近似函数，S≈VVT和AΛ≈VUT，其中第一个近似函数表示对邻接矩阵进行逼近，第二个近似函数表示对加权的属性矩阵进行逼近；最后提供一个平衡因子来对这两个特征维度进行融合，就得到了一个新的目标函数:minU,V,Λ≥012(||S-VVT||F2+λ·||AΛ-VUT||F2).]]>3.根据权利要求1所述的属性图聚类方法，其特征在于：在所述目标函数求解步骤中，首先将目标函数表示成矩阵迹函数的形式：J=12Tr[(S-VVT)(S-VVT)T]+λ2·Tr[(AΛ-VUT)(AΛ-VUT)T]=12[Tr(SST)+Tr(VVTVVT)-2·Tr(SVVT)]+λ2·[Tr(AΛ2AT)+Tr(VUTUVT)-2·Tr(AΛUVT)]]]>其中Tr(·)表示矩阵的迹函数，为了上述的目标函数进行优化，这里采用拉格朗日乘子法对它进行优化，首先引入三个拉格朗日乘子矩阵：α、β和γ，它们分别对应矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的非负约束，然后就可以构造形式如下的拉格朗日函数：L＝J+Tr(αV)+Tr(βU)+Tr(γΛ)对上述拉格朗日函数分别求对矩阵分解因子V、矩阵分解因子U以及权重对角阵Λ的导数，推导出这几个矩阵的迭代公式，根据迭代公式，对目标函数进行迭代，直至收敛，其中矩阵分解因子V包含了拓扑关系与节点属性特征等信息。4.根据权利要求1所述的属性图聚类方法，其特征在于：在所述矩阵聚类步骤中，针对通过联合矩阵分解而得到的包含拓扑关系与节点属性特征信息的矩阵V进行聚类，并将聚类后的结果返回给系统用户。5.一种基于带权重联合非负矩阵分解的属性图聚类系统，其特征在于，包括：构建目标函数模块：用于给定一个属性图，根据属性图的拓扑关系与节点属性特征设计一个统一的目标函数，使用对称非负矩阵去逼近拓扑关...

【专利技术属性】
技术研发人员：叶允明，王国瑞，徐晓飞，王岢，
申请(专利权)人：哈尔滨工业大学深圳研究生院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人