一种基于多源信息的用户划分方法及系统技术方案

技术编号:30436124 阅读:18 留言:0更新日期:2021-10-24 17:36
本发明专利技术提供一种基于多源信息的用户划分方法及系统,该方法通过获取图像数据和文本数据,分别对图像数据和文本数据进行特征提取。将自表示学习和图学习相结合的方式去分别计算相似度矩阵,并引入秩约束使得相似度矩阵具有理想的性质同时获取其对应的划分矩阵。采用自加权融合技术对所有划分矩阵进行融合形成统一的划分矩阵,并基于统一的划分矩阵的基础上引入旋转矩阵来对用户进行划分,以提高用户划分的准确度。划分的准确度。划分的准确度。

【技术实现步骤摘要】
一种基于多源信息的用户划分方法及系统


[0001]本专利技术涉及多视图学习、子空间聚类和图学习等
,更具体地,涉及一种基于多源信息的用户划分方法及系统。

技术介绍

[0002]随着计算机技术和互联网技术的快速发展,推动着智能手机的快速普及,同时使人类进入大数据时代。在数据成指数式增长的时代,人们获得数据途经的多样化,采集数据设备类型的多样化,数据特征提取器的多样化,这几个多样化使得描述同一个物体对象的数据丰富多彩。在真实的世界中,数据通常具有多种表现形式或模态。例如,文本可以被多种不同国家语言描述,网页可以被文本、视频和超链接等多种模态进行描述。图像可以被颜色直方图和纹理描述符进行描述。这些数据被统称为多视图数据,这些不同的视图数据通常是高维且异构的。多视图数据既包含每个的视图特有信息,同时也包含视图之间的互补信息,所以多视图数据比单视图数据拥有更丰富的物体描述信息。用户的划分(普通用户,中等用户,高等用户,超级用户和其他)可以根据图像数据进行划分,也可以根据文本数据进行划分,同时也可以结合两者的信息。通过考虑多方面的信息去对用户进行更准本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多源信息的用户划分方法,其特征在于,包括以下步骤:S1:采集图像数据和文本数据;S2:分别提取图像数据和文本数据的内在特征;S3:通过自表示学习和图学习相结合的方法去计算图像特征的相似度矩阵和文本特征的相似度矩阵;S4:引入秩约束使得相似度矩阵具有理想的性质并获取相似度矩阵对应的划分矩阵;S5:采用自加权融合技术对划分矩阵进行融合形成统一的划分矩阵;S6:在统一的划分矩阵的基础上引入旋转矩阵来对用户进行划分。2.根据权利要求1所述的基于多源信息的用户划分方法,其特征在于,所述步骤S1的过程是:通过人工现场对用户拍摄图像数据和人工现场对用户专门撰写相关文本数据;通过相关APP直接从后台服务器获取用户注册APP时上传的图像数据和填报的文本数据;通过相关APP直接从后台服务器获取用户数据自动生成相应的图像数据和文本数据。3.根据权利要求2所述的基于多源信息的用户划分方法,其特征在于,步骤S2中,提取的图像数据的内在特征包括:色彩纹理矩,局部二值模式,尺度不变特征变换,方向梯度直方图,全局特征信息以及通过深度学习模型提取图像特征获得深度特征;提取的文本数据的内在特征包括:通过深度学习模型提取文本数据的内在特征;将从图像数据提取的特征以及从文本数据提取的特征,统称为多视图特征X={X1,...,X
V
},其中代表第v个视图的特征,n表示用户数量,d
v
表示第v个视图的特征维度。4.根据权利要求3所述的基于多源信息的用户划分方法,其特征在于,步骤S3中,通过自表示学习和图学习相结合的方法去计算图像特征的相似度矩阵和文本特征的相似度矩阵,其数学公式定义为:其中表示第v个视图的原始特征,S
v
是第v个视图的相似度矩阵,表示第v个视图中的第i个用户的特征,是S
v
的第i列第j行的元素,1是所有元素全为1的列向量,(
·
)
T
表示矩阵的转置,diag(
·
)表示矩阵的对角元素,表示矩阵的Frobenius范数的平方,表示向量的L2范数的平方,λ1、λ2是一个平衡参数。5.根据权利要求4所述的基于多源信息的用户划分方法,其特征在于,步骤S4具体为:在获取图像数据的相似度矩阵和文本数据相似度矩阵的时候,通过引入秩约束使得步骤S3获的相似度矩阵具有理想的性质并获取相似度矩阵对应的划分矩阵:其中,是S
v
的拉普拉斯矩阵,D
v
是S
v
的度矩阵,其中第i个对角
元素为c是聚类簇的个数(用户类别个数),rank(
·
)表示矩阵的秩;由于引入秩约束会使得上述公式变得难以求解,根据Ky Fans定理,得到其中是的第i小的特征值,的前c小的特征值均为0,即使得rank(L
S
)=n

c成立,因此,问题转化为如下形式:其中表示第v个视图的划分矩阵,的单...

【专利技术属性】
技术研发人员:段意强袁浩亮符政鑫许斯滨吕应龙
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1