一种提高社交网络用户产生内容信息影响力准确性的方法技术

技术编号:10181496 阅读:185 留言:0更新日期:2014-07-03 11:18
本发明专利技术公开了一种提高社交网络用户产生内容信息影响力准确性的方法,所述用户产生内容UGC包括M个关键词,共有N个用户参与所述UGC,该方法包括:建立社交网络UGC成员参与机制,根据所述UGC的用户粉丝关系构建粉丝网络无权有向图并进行社群划分;根据所述UGC的用户回复关系构建兴趣网络有权无向图并进行社群划分;根据所述成员参与机制各影响因素间的相关程度计算用户X的社交影响力UX;根据计算用户X发布关键词K的社交影响力,m为关键词K在用户X上的传播次数,如果m=0,则SKX=0;根据公式计算关键词K在所述UGC中的综合社交影响力;计算所述M个关键词在所述UGC中的综合社交影响力之和,得到所述UGC的信息影响力INF。

【技术实现步骤摘要】
一种提高社交网络用户产生内容信息影响力准确性的方法
本专利技术涉及信息监测技术,特别是一种提高社交网络用户产生内容信息影响力准确性的方法。
技术介绍
互联网已经进入到web2.0时代,每个用户都可以自由发表言论,很多重要内容或者新闻都是通过用户产生内容(UGC,UserGenerateContent)首先产生出来,继而通过社交网络广泛传播,最终在某个特定的社交圈子内甚至整个社会产生巨大的影响力。因此,UGC影响力的研究对于信息采集、监测、预测等都具有非常重要的作用。但是由于UGC的数量过于庞大,增加的速度非常快,很难对所有UGC进行处理,必须要筛选出质量好而且影响力高的UGC来进行研究和利用。由此,对UGC的质量和信息影响力评估的研究越来越受到重视。目前关于信息影响力的研究主要应用影响力扩散模型(IDM,InfluenceDiffusionModel)及其改进模型(如影响力扩散概率模型IDPM,InfluenceDiffusionProbabilityModel等)进行分析。基于文本会话的影响力扩散模型IDM利用会话中的回复链结构,基于词频计算文本间的相似性来计算源的影响力扩散能力,每条回复扩散的影响力之和即为该文本的影响力扩散能力。该模型提出后,成为信息影响力研究的重要基石,后人对于信息影响力的研究大多是对该模型进行改进;影响力扩散概率模型IDPM通过在整个兴趣空间上定义单个关键词语传播概率影响力来解决IDM模型中的影响力传递结构断层问题和灌水导致的虚假影响力传播问题,通过考虑句子中的有效关键词语来解决IDM模型中的影响力传递内容断层问题。但是这些模型存在一些非常明显的缺陷,如每个评论或者回复的权值都相同、没有考虑用户之间的关系等。以BBS上的一个帖子作为UGC为例,如图1所示:用户1为信息发布者,用户2~用户5为用户1的回复者,A、B、C、D、E、F为该帖子包括的关键词,粗实线表示帖子在用户中的影响力传播关系,粗实线的方向为帖子的影响力传播方向,点划线表示用户间粉丝关系,虚线表示用户在兴趣网络中属于同一社群的关系,细实线表示用户在粉丝网络中属于同一社群的关系。图1中,用户2~用户5都回复了用户1的帖子,不过用户2是用户1的粉丝,用户3与用户1属于相同兴趣网络社群,用户4与用户1属于相同粉丝网络社群(但不是用户1的粉丝),用户5是新用户,之前可能几乎与用户1没有关系。由此可以看出,IDPM模型中没有对UGC的关键词进行分别加权处理会导致计算UGC的信息影响力存在偏差。
技术实现思路
有鉴于此,本专利技术提出了一种提高社交网络用户产生内容信息影响力准确性的方法,有效解决了现有技术中不对UGC的关键词进行分别加权处理导致计算UGC的信息影响力存在偏差的缺陷。本专利技术提出的技术方案是:一种提高社交网络用户产生内容信息影响力准确性的方法,该方法包括:A.建立社交网络UGC成员参与机制,确定所述成员参与机制各影响因素间的路径系数,所述路径系数为所述成员参与机制各影响因素间的相关程度;B.根据所述UGC的用户粉丝关系构建粉丝网络无权有向图,对所述粉丝网络无权有向图进行社群划分;根据所述UGC的用户回复关系构建兴趣网络有权无向图,对所述兴趣网络有权无向图进行社群划分;C.根据所述成员参与机制各影响因素间的相关程度计算用户X的社交影响力UX;D.根据计算用户X发布关键词K的社交影响力,m为关键词K在用户X上的传播次数,如果m=0,则SKX=0;E.根据公式计算关键词K在所述UGC中的综合社交影响力;F.计算所述M个关键词在所述UGC中的综合社交影响力之和,得到所述UGC的信息影响力INF。上述方案中,所述成员参与机制包括信息质量、群体认同感、价值感知和参与四个影响因素,信息质量和群体认同感的路径系数为a1,信息质量和价值感知的路径系数为a2,价值感知和群体认同感的路径系数为a3,参与和群体认同感的路径系数为a4。上述方案中,所述步骤C进一步包括:根据公式计算所述UGC中用户X的社交影响力,其中,b为用户X在所述UGC中被直接回复的次数,如果用户不存在直接回复者,则UX=0;如果用户X与其直接回复者属于相同兴趣网络社群,C1=a1,否则,C1=1;如果用户X与其直接回复者属于相同粉丝网络社群,C2=a2×a3,否则,C2=1;如果用户X是所述UGC信息发布者的粉丝,f=a2,否则f=1。上述方案中,所述步骤F进一步包括:根据公式所述UGC的信息影响力INF。上述方案中,信息质量和群体认同感的路径系数a1=0.333,信息质量和价值感知的路径系数a2=0.824,价值感知和群体认同感的路径系数a3=0.624,参与和群体认同感的路径系数a4=0.437。综上所述,本专利技术提出了一种提高社交网络用户产生内容信息影响力准确性的方法,应用社交性拓展影响力扩散概率模型(S-IDPM,Sociability-basedInfluenceDiffusionProbabilityModel)计算UGC信息影响力,主要利用用户社交网络(包括粉丝网络和兴趣网络)和回复链结构来对不同用户的回复进行加权,从而对UGC的关键词分别进行加权处理,提高了社交网络用户产生内容信息影响力计算的准确性。附图说明图1为用户间及所发帖子间关系图。图2为粉丝网络图。图3为兴趣网络图。图4为用户成员参与机制。图5为方法实施例一的UGC结构图。图6为方法实施例一的流程图。图7为方法实施例二的人工标注精品帖累积含有率对比图。图8为方法实施例二的类-特征值对照图。图9为方法实施例二的机器标注精品帖累积含有率对比图。具体实施方式为使本专利技术的目的、技术方案和优点表达的更加清楚明白,下面结合附图及具体实施例对本专利技术再作进一步详细的说明。本专利技术一个实施例的技术方案是:A.建立社交网络UGC成员参与机制,确定所述成员参与机制各影响因素间的路径系数,所述路径系数为所述成员参与机制各影响因素间的相关程度;B.根据所述UGC的用户粉丝关系构建粉丝网络无权有向图,对所述粉丝网络无权有向图进行社群划分;根据所述UGC的用户回复关系构建兴趣网络有权无向图,对所述兴趣网络有权无向图进行社群划分;C.根据所述成员参与机制各影响因素间的相关程度计算用户X的社交影响力UX;D.根据计算用户X发布关键词K的社交影响力,m为关键词K在用户X上的传播次数,如果m=0,则SKX=0;E.根据公式计算关键词K在所述UGC中的综合社交影响力;F.计算所述M个关键词在所述UGC中的综合社交影响力之和,得到所述UGC的信息影响力INF。本专利技术技术方案将用户因素添加到用户产生内容信息影响力计算中,将BBS、微博、人人网等社交网络的所有用户划分为信息发布者与信息回复者。根据参与UGC的用户粉丝关系构建粉丝网络无权有向图,如图2所示,用户1是用户2的粉丝,则用户1与用户2之间有一条从用户1指向用户2的边;根据参与UGC的用户回复关系构建兴趣网络有权无向图,如图3所示,用户1与用户2共同参与了7个信息发布者发布的信息讨论,则用户1和用户2之间存在一条权值为7的无向边。根据现有技术将上述粉丝网络与兴趣网络进行社群划分,并对划分的社群进行编号,属于同社群用户的社群编号相同,相同社群编号(相同粉丝网络社群编号或相同兴趣网络社群本文档来自技高网
...
一种提高社交网络用户产生内容信息影响力准确性的方法

【技术保护点】
一种提高社交网络用户产生内容信息影响力准确性的方法,应用于社交网络用户产生内容UGC,所述UGC包括M个关键词,共有N个用户参与所述UGC,其特征在于,该方法包括:A.建立社交网络UGC成员参与机制,确定所述成员参与机制各影响因素间的路径系数,所述路径系数为所述成员参与机制各影响因素间的相关程度;B.根据所述UGC的用户粉丝关系构建粉丝网络无权有向图,对所述粉丝网络无权有向图进行社群划分;根据所述UGC的用户回复关系构建兴趣网络有权无向图,对所述兴趣网络有权无向图进行社群划分;C.根据所述成员参与机制各影响因素间的相关程度计算用户X的社交影响力UX;D.根据计算用户X发布关键词K的社交影响力,m为关键词K在用户X上的传播次数,如果m=0,则SKX=0;E.根据公式计算关键词K在所述UGC中的综合社交影响力;F.计算所述M个关键词在所述UGC中的综合社交影响力之和,得到所述UGC的信息影响力INF。

【技术特征摘要】
1.一种提高社交网络用户产生内容信息影响力准确性的方法,应用于社交网络用户产生内容UGC,所述UGC包括M个关键词,共有N个用户参与所述UGC,其特征在于,该方法包括:A.建立社交网络UGC成员参与机制,确定所述成员参与机制各影响因素间的路径系数,所述路径系数为所述成员参与机制各影响因素间的相关程度;B.根据所述UGC的用户粉丝关系构建粉丝网络无权有向图,对所述粉丝网络无权有向图进行社群划分;根据所述UGC的用户回复关系构建兴趣网络有权无向图,对所述兴趣网络有权无向图进行社群划分;C.根据所述成员参与机制各影响因素间的相关程度计算用户X的社交影响力UX;D.根据计算用户X发布关键词K的社交影响力,m为关键词K在用户X上的传播次数,如果m=0,则SKX=0;E.根据公式计算关键词K在所述UGC中的综合社交影响力;F.计算所述M个关键词在所述UGC中的综合社交影响力之和,得到所述UGC的信息影响力INF。2.根据权利要求1所述的方法,其特征在于,所述成员参与机制包括信息质量、群体认同感、价值感知和...

【专利技术属性】
技术研发人员:李蕾林鑫王博远
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1