基于动态多视图学习模型的社交网络用户多标签分类方法技术

技术编号：22167045 阅读：48 留言：0更新日期：2019-09-21 10:38

本发明专利技术提供了基于动态多视图学习模型的社交网络用户多标签分类方法，包括如下步骤：针对特定社交网络数据集，构建用户的多视图表征；基于用户表征，构建多视图数据间深度融合表征模型；采用动态路由模型，更新参数并优化多视图特征；引入共享表征模型，对步骤三中的特征，构建目标函数。通过模型优化，并得到最优共享表征矩阵，最终利用共享矩阵实现任意用户的多标签分类。本方法实现了网络用户的多标签高效分类，解决了数据缺失导致模型学习性能下降、视图融合数量受限和模型无法满足多分类任务需求等问题，可以广泛应用于网络中用户精准分析、异常用户检测、用户关系挖掘、未知用户识别等场景。

Multi-label classification method for social network users based on dynamic multi-view learning model

全部详细技术资料下载

【技术实现步骤摘要】
基于动态多视图学习模型的社交网络用户多标签分类方法
本专利技术基于动态多视图学习模型的社交网络用户多标签分类方法，属于信息技术服务领域。
技术介绍
目前互联网已成为了人们生活必不可少的部分，用户在不同社交网络(如微博、twitter、微信)中产生了大量的文本、图像、用户关系等数据，称为多视图数据。这些多视图数据隐含了丰富的信息，而且更新速度极快，因此，多视图数据的融合也成为了数据挖掘领域的一个关键技术问题，其研究成果可应用于不同的领域。网络用户分析作为一个重要的应用场景，用户可能同时具有多个类别标签，近年来，不同网络上同一用户的多标签分类受到了研究团队的广泛关注。据调研，受网络用户数据多源、多模特点的制约，现有多标签分类方法依然存在以下不足：(1)多标签预测性能过度依赖于用户数据，在部分视图数据缺失的情况下，模型的学习性能会明显下降；(2)受模型的限制，大多数方法只实现了两视图的融合学习；(3)部分新的方法可实现多视图的融合，并取得了较好的性能，但完成的是聚类任务，难以实现最优的多标签分类模型。为了解决以上问题，本专利技术基于多视图子空间算法，构建了动态多视图学习模型实现了用户的多标签分类任务。
技术实现思路
本专利技术克服了现有技术存在的不足，提供了基于动态多视图学习模型的社交网络用户多标签分类方法，尤其是基于动态多视图学习模型的社交网络用户多标签分类方法，该方法能够充分融合用户的多视图数据，优化视图表征，实现网络用户的多标签分类，也可应用其他领域中的多视图数据分析。本专利技术是通过以下技术方案实现的，基于动态多视图学习模型的社交网络用户多标签分类方法，包括...

【技术保护点】
1.基于动态多视图学习模型的社交网络用户多标签分类方法，其特征在于，包括如下步骤：步骤一，针对特定社交网络数据集，构建用户的多视图表征矩阵：社交网络数据包括用户个人信息和用户与用户关系两种模态的数据，构成了用户的多视图表示，其中，用户个人信息称为节点属性，关系称为节点间的边；所述的用户多视图表示过程包括以下步骤：首先，学习社交网络数据集中节点属性的表征，得到节点的特征向量，构成了该节点第一个视图；然后，学习社交网络数据集中节点间边的表征，即节点的结构表征向量，构成了该节点第二个视图；最终，节点和节点间边的表征共同构成了所述用户的全部视图表征矩阵；步骤二，构建用户多视图数据的深度学习模型：采用多层感知器模型分别对步骤一得到的全部视图的表征矩阵进行深度学习，深度学习过程中的参数权重w不断优化，最后得到全部视图的深度表征，并分别对各个视图的深度表征进行平均中心化，实现每个视图的非线性映射表征，并将得到的平均中心化表征作为第三步多视图学习模型的输入特征；步骤三，多视图学习模型采用动态路由模型，更新参数并优化多视图表征矩阵；步骤二的输出作为步骤三的输入，将其多视图表征矩阵的更新优化作为一个独立的...

【技术特征摘要】
1.基于动态多视图学习模型的社交网络用户多标签分类方法，其特征在于，包括如下步骤：步骤一，针对特定社交网络数据集，构建用户的多视图表征矩阵：社交网络数据包括用户个人信息和用户与用户关系两种模态的数据，构成了用户的多视图表示，其中，用户个人信息称为节点属性，关系称为节点间的边；所述的用户多视图表示过程包括以下步骤：首先，学习社交网络数据集中节点属性的表征，得到节点的特征向量，构成了该节点第一个视图；然后，学习社交网络数据集中节点间边的表征，即节点的结构表征向量，构成了该节点第二个视图；最终，节点和节点间边的表征共同构成了所述用户的全部视图表征矩阵；步骤二，构建用户多视图数据的深度学习模型：采用多层感知器模型分别对步骤一得到的全部视图的表征矩阵进行深度学习，深度学习过程中的参数权重w不断优化，最后得到全部视图的深度表征，并分别对各个视图的深度表征进行平均中心化，实现每个视图的非线性映射表征，并将得到的平均中心化表征作为第三步多视图学习模型的输入特征；步骤三，多视图学习模型采用动态路由模型，更新参数并优化多视图表征矩阵；步骤二的输出作为步骤三的输入，将其多视图表征矩阵的更新优化作为一个独立的任务，每个任务采用动态路由模型来学习对应特征中的活跃向量，并将所述活跃向量作为对应特征的最优向量表征；步骤四，利用共享表征模型，构建目标函数：通过步骤三得到每个视图的最优向量表征作为共享表征模型的输入，然后，利用共享表征模型的目标函数，计算得到全部视图的共享表征；步骤五，通过模型优化，更新步骤二中的参数权重w，得到最优共享表征矩阵，利用最优共享表征矩阵来实现任意用户的多标签分类。2.根据权利要求1所述的基于动态多视图学习模型的社交网络用户多标签分类方法，其特征在于，所述社交网络的多个用户多视图表征通过下述过程实现：所述社交网络的某一用户多视图表征为矩阵形式：(1,2,….,n；1,2,….,m)式中，(1,2…,n)为该用户的第一个视图，(1,2…,m)为该用户的第二个视图，则该用户的表征向量为n+m维向量。3.根据权利要求1所述的基于动态多视图学习模型的社交网络用户多标签分类方法，其特征在于，步骤二中所述多层感知器模型为：假定多层感知器模型是一个具有Kj层的网络，每层网络包括cj个神经单元，则第K层的输出为其中，函数s(w,b)为非线性激活函数，表示第k层输出，表示第k-1层输出，表示第K层的权值矩阵，为偏置参数；该模型最后一层的输出表示为：fj(Xj)，平均中心化...

【专利技术属性】
技术研发人员：王莉，郑婷一，孟燕霞，
申请(专利权)人：太原理工大学，
类型：发明
国别省市：山西,14

全部详细技术资料下载我是这个专利的主人