一种结合社交网络的圈层用户影响力评估方法技术

技术编号:26259464 阅读:30 留言:0更新日期:2020-11-06 17:54
本发明专利技术公开了一种结合社交网络的圈层用户影响力评估方法,所述的圈层用户影响力评估方法包括:用户身份信息映射、用户间接影响力评估、用户直接影响力评估。本发明专利技术通过对数据库中社交网络用户属性信息与圈层重点事件信息进行影响力的度量分析,减少复杂关系网络中,对用户影响力评估的复杂度,得到用户直接影响力评估值和间接影响力评估值,使得用户影响力的评估直观易懂。

【技术实现步骤摘要】
一种结合社交网络的圈层用户影响力评估方法
本专利技术涉及网络影响力评估领域,尤其涉及一种结合社交网络的圈层用户影响力评估方法。
技术介绍
借助于大数据和移动社交技术的迅速发展,如今的社交网络呈现出显著的移动化、本地化特征。目前用户影响力的大多研究方法都是在多元信息量的基础上进行的,只关注个人用户的直接行为与自定义的基本信息,而未深度融合所属圈层、级联转发结构、时间量化因子等重要因素,忽略了信息传播过程中用户间的行为变化以及真实的社交网络存在着信息不可靠或缺失等问题。用户真实的影响力虽然无法从技术方面直接衡量,但是可以通过真实的行为数据去评估,比如转发、回复、参与的讨论圈等,然后根据异常检测,评估故意伪造的可能性,从而更精准地反映用户在信息传播过程中的导向作用。社交网络的圈层作为一种用户的频繁活动范围,有利于分析用户在该话题领域的信用度等因素,更容易将之与其他用户相联系。所以,将社交网络的圈层纳入用户影响力评估中,基于行为数据挖掘它们的潜在关系,可以有效地彰显用户的意见领袖地位和凝聚力。其中,用户影响力的评估包括了基于对社交网络用户属性信息进行分本文档来自技高网...

【技术保护点】
1.一种结合社交网络的圈层用户影响力评估方法,其特征在于,所述的圈层用户影响力评估方法通过对数据库中社交网络用户属性信息与圈层重点事件信息进行影响力的度量分析,分别得到用户的直接影响力评估值和间接影响力评估值;其处理具体包括如下步骤:/n用户身份信息映射:将目标用户的在社交网路中的身份信息映射到数据库,并以RDF数据集的形式进行存储;/n用户间接影响力评估:选取社交网络参与帖子传播过程所有用户点集合U‘={u’

【技术特征摘要】
1.一种结合社交网络的圈层用户影响力评估方法,其特征在于,所述的圈层用户影响力评估方法通过对数据库中社交网络用户属性信息与圈层重点事件信息进行影响力的度量分析,分别得到用户的直接影响力评估值和间接影响力评估值;其处理具体包括如下步骤:
用户身份信息映射:将目标用户的在社交网路中的身份信息映射到数据库,并以RDF数据集的形式进行存储;
用户间接影响力评估:选取社交网络参与帖子传播过程所有用户点集合U‘={u’1,u‘2,...,u'n}中帖子社区标签构成Region'={r'1,r'2,...,r'u}及其评论内容S'={s'1,s'2,...,s'l},提取话题与社区特征得到用户分类集G‘={G1,G2,...,Gn},根据对用户分类集中每个圈层社交网络的用户属性指标权重调研结果,将属性值量化为同一个尺度空间构成属性子集P={pn,q∈P'}(q=1,2,...,h),遍历该社交网络圈层的全部用户计算间接影响力得分,对所有用户进行排序得到用户间接影响力排序集合;
用户直接影响力评估:遍历该社交网络圈层的全部用户,根据用户参加的圈层重点事件,获取该事件用户完整级转发路径user_1/user_2/.../user_n、对应的加入时间ti,n以及该事件演化所耗费的总时长ti,通过SDRank算法计算用户直接影响力得分,对所有用户进行排序,得到用户直接影响力排序集合。


2.根据权利要求1所述的一种结合社交网络的圈层用户影响力评估方法,其特征在于,所述的用户身份信息映射包括如下步骤:
S101:根据关系型数据库的逻辑表,将目标用户在社交网络中的身份信息生成为映射文件;
S102:解析生成的映射文件,获取其中包含的映射元素;
S103:分析获取的映射元素,获取其中子元素和逻辑表及其属性列的映射规则;
S104:从关系型数据库中获取逻辑表中的元组,按照映射规则将元组中对应属性列映射为RDF术语;
S105:将得到的RDF术语组合为RDF三元组,输出到RDF数据集。


3.根据权利要求1所述的一种结合社交网络的圈层用户影响力评估方法,其特征在于,所述的用户间接影响力评估包括如下子步骤:
S201:选取社交网络圈层用户集参与帖子传播过程的所有用户点集合U‘={u’1,u‘2,...,u'n}中任意两个用户点及其对应的帖子社区标签Region'={r'1,r'2,...,r'u}和评论内容S'={s'1,s'2,...,s'l};
S202:从获取的帖子社区标签Region'={r'1,r'2,...,r'u}和评论内容S'={s'1,s'2,...,s'l}提取两者的话题与社区特征;
S203:重复步骤S201和S202直至获取所有用户的特征,根据相似特征对用户进行分类,得到用户分类集G‘={G1,G2,...,Gn},该集合中的每个元素表示一类圈层社交网络;
S204:提取圈层社交网络的全部用户属性P'={p'n,1,p'n,2,...,p'n,j},其中,p′n,j为用户un的第j个属性,根据层次分析法和熵权法确定的指标权重调研结果,选取用户j个属性中的h个属性,并将相关的属性值量P={pn,q∈P'}(q=1,2,...,h)化为同一个尺度空间,从而构成了一个属性子集;
S205:根据步骤S204中获取的h个属性,遍历该社交网络圈层的全部用户,计算他们的间接影响力得分,对所有用户进行排序,得到用户间接影响力排序集合。


4.根据权利要求3所述的一种结合社交网络的圈层用户影响力评估方法,其特征在于,所述的对用户进行分类,得到用户分类集G‘={G1,G2,...,Gn}的过程包括如下步骤:
利用LDA模型获得用户的圈层特征:
S301:按照先验概率p(i'k|I)选择一条帖子及其评论内容s'l,包括Beta分布和Dirichlet分布;



(1)对于参数α>0,β>0,取值范围为[0,1]的随机变量x的Beta分布概率密度函数为:


(2)Dirichlet的概率密度函数为:


其中,Beta分布是二项式分布的共轭先验分布,而Dirichlet分布是多项式分布的共轭先验分布。
S302:从Dirichlet分布α中取样生成帖子内容s'l的主题分布θi;
S303:从主题的多项式分布θi中取样生成帖子内容第j个词的主题zi,j;LDA采用词袋模型,M个帖子会对应M个独立Dirichlet-Multinomial共轭结构,K个主题会对应K个独立的Dirichlet-Multinomial共轭结构,LDA的整个物理过程实际就是两个Dirichlet同轴分布;
S304:从Dirichlet分布β中取样生成主题zi,j对应的词语分布
S305:从词语的多项式分布中通过GibbsSampling最终生成话题标签ωi,j,所有话题标签构成的集合为Topic'={t'1,t'2,...,t'u};
S306:用户参与的所有圈层重点事件帖子对应的话题标签集合Topic'与社区标签集合Region'作为圈层标签集合,选择出现总次数前v个的圈层标签作为该用户n的圈层特征cn={c1,c2,...

【专利技术属性】
技术研发人员:王瑞锦张凤荔谭琪张志扬刘楠李志李艾玲汤启友郭上铜
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1