基于注意力图神经网络的隐藏社群属性获取方法与系统技术方案

技术编号:31488009 阅读:26 留言:0更新日期:2021-12-18 12:23
本发明专利技术公开了一种基于注意力图神经网络的隐藏社群属性获取方法:将用户社交媒体数据词汇库中的所有词汇通过词向量模型Word2vec网络学习得到所有词的嵌入表征向量;通过对用户社交媒体数据词汇的嵌入表征向量归一化加权,基于前向全连接网络的目标嵌入层得到目标用户的嵌入表征;基于用户社交网络和社交活动信息生成目标用户的邻居用户的嵌入表征,根据邻居用户的嵌入表征计算权重社交矩阵;根据权重社交矩阵训练社交热度加权的注意力图神经网络,并利用注意力图神经网络和目标用户的嵌入表征生成目标用户的隐藏社群属性分类结果。本发明专利技术还提供了相应的基于注意力图神经网络的隐藏社群属性获取系统。的隐藏社群属性获取系统。的隐藏社群属性获取系统。

【技术实现步骤摘要】
基于注意力图神经网络的隐藏社群属性获取方法与系统


[0001]本专利技术属于属性挖掘
,更具体地,涉及一种基于注意力图神经网络的隐藏社群属性获取方法与系统。

技术介绍

[0002]网络空间中的用户研究是当前互联网个性化推荐领域的重要任务之一,随着社交网络规模的不断扩张,网络空间中的用户属性信息具有稀疏性、碎片性和异构性等特点,这导致对于目标用户的某些隐藏社群属性信息的获取十分困难,从而难以进行下一步的分析与推荐工作。如何通过有效的技术手段来挖掘社交网络平台中的用户潜在或隐藏社群属性信息,对分析目标用户关于待推荐内容展示出的潜在偏好至关重要。
[0003]对于用户属性认知分析,现有研究采用的属性特征大多是轻量级的特征,所蕴含的信息不够丰富,对于目标用户的属性嵌入表征探索不足,往往仍然存在大量的信息可供挖掘。其次,现有研究产生的目标用户属性分类仍然过于简单,针对的往往是目标用户的性别、教育背景等较为简单的分类目标,对多种媒体内容信息融合方面的探索仍然十分缺乏,对目标用户的内容行为表征方法仍然存在着较大的可探索空间。
专利技术内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力图神经网络的隐藏社群属性获取方法,其特征在于,包括:步骤S1:将用户社交媒体数据词汇库中的所有词汇通过词向量模型Word2vec网络学习得到所有词的嵌入表征向量;步骤S2:通过对用户社交媒体数据词汇的嵌入表征向量归一化加权,基于前向全连接网络的目标嵌入层得到目标用户的嵌入表征;步骤S3:基于用户社交网络和社交活动信息生成目标用户的邻居用户的嵌入表征,根据邻居用户的嵌入表征计算权重社交矩阵;步骤S4:根据权重社交矩阵训练社交热度加权的注意力图神经网络,并利用注意力图神经网络和目标用户的嵌入表征生成目标用户的隐藏社群属性分类结果。2.如权利要求1所述的基于注意力图神经网络的隐藏社群属性获取方法,其特征在于,所述步骤S1包括:已知包含所有用户的社交媒体数据集合形成的用户社交媒体数据词汇库为其中c
i
∈R
f
代表词汇库中第i个词的one

hot编码,变量f=|C|表示词汇库中不同词汇的个数,对于C中词汇,通过Word2vec网络学习嵌入表征向量根据文本内容集合来向量化词汇库中的词,其中每个w
i
表示第i个词的词汇嵌入表征,k是经过网络学习后每个词的向量维度。3.如权利要求1或2所述的基于注意力图神经网络的隐藏社群属性获取方法,其特征在于,所述步骤S2包括:得到所有词的嵌入表征向量E
w
之后,由于进行隐藏社群属性分析的基本对象是用户,需要将词汇嵌入表征转换为目标用户嵌入表征,才能让后续注意力图神经网络能够以目标用户为对象进行分析,为此基于前向全连接网络的目标嵌入层将所有词的词汇嵌入表征E
w
通过全连接的形式转为目标用户的嵌入表征通过全连接的形式转为目标用户的嵌入表征其中n表示目标用户个数,u
i

∈R
k
代表第i个目标用户的嵌入表征。4.如权利要求3所述的基于注意力图神经网络的隐藏社群属性获取方法,其特征在于,所述步骤S2具体为:对于目标用户u
*
,与目标用户u
*
在同一条社交媒体内容中共现过的所有词汇形成该用户的表征词汇集合,记为{u
*
}={w1′ w2′
ꢀ…ꢀ
w
f

},其中每一个w
i

属于E
w
,对于一个目标用户u
*
而言,其对应的表征词汇集合的元素个数f

不会超过E
w
的大小,记录这些词汇的位置和距目标用户的文本距离,按照{u
*
}中所有词汇与目标用户在文本数据中的距离,归一化后赋予不同的权重{p1,

p
f

},形成u
*

=p1w1′
+p2w2′
+

p
f

w
f

作为一个目标用户的嵌入表征。5.如权利要求1或2所述的基于注意力图神经网络的隐藏社群属性获取方法,其特征在于,所述步骤S3包括:对目标用户u
*
的各种社交关系转化为权重参数;度量目标用户u
*
和其邻居用户之间的社交热度,社交热度系数m
i,p
由目标用户u
*
和其邻居用户之间的社交次数、社交行为类别计算得出;对每个用户重复上述过程,得到任意两个用户之间的邻接权重,不存在社交关系的用户之间h
i,p
m
i,p
=0;
将所有n个用户之间的邻接权重记录为权重社交矩阵A∈R
n
×
n
,其中h
r,j
m
r,j
∈A表示用户r和用户j之间的社交权重参数。6.如权利要求5所述的基于注意力图神经网络的隐藏社群属性获取方法,其特征在于,所述对目标用户u
*
的各种社交关系转化为权重参数,具体为:记录目标用户u
*
产生社交关系的邻居用户,这些用户存在关注、点赞、转发、评论等社交行为,记目标用户u
*
的邻居用户集合为[u
*
],对[u
*
]中每一个邻居用户u
i1...

【专利技术属性】
技术研发人员:张毅曹万华刘俊涛饶子昀王元斌王军伟周莹王振杰
申请(专利权)人:中国船舶重工集团公司第七零九研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1