The invention relates to a method for constructing a social network influence propagation model based on emotion analysis, belonging to the field of social network influence propagation. The following steps are taken: step one, grab the micro-blog data through micro-blog API, and clean the data for analysis. Step two, analyze the sentiment tendency of each micro-blog to improve the influence propagation model. Step three, select seed set as the disseminator of influence. Step 4, adding affective factors to the calculation formula of activation probability, the improved activation probability calculation method is used to determine whether the node is activated. In step 5, the active nodes are added to the seed set, and the influence is transmitted. Finally, all the active nodes are the result of influence propagation.
【技术实现步骤摘要】
一种基于情感分析的社交网络影响力传播模型构建方法
本专利技术属于社交网络影响力传播领域,特别是基于情感分析的社交网络影响力传播模型。
技术介绍
如今用户可以通过社交网络平台发表自己的各种观点,如对某一事件或者产品的看法。在用户发表的观点中包含主题和情感等因素,而这些因素会对影响用户观点的传播情况。不同的情感在传播过程中可能会产生不同的传播效果,比如:带有极性情感的观点的传播的范围要大于带有中性情感的观点。独立级联模型(Independentcascademodel)是影响力传播的一个基础模型。IC模型的基本过程如下,一个活跃(active)用户会在网络中扩散信息,它会试图去影响它的邻居用户并通过边的权重来判断邻居用户是否被影响。最早提出的独立级联模型中,种子节点激活其邻居节点的激活概率是一个随机值,但是在社交网络中影响节点激活的因素有很多,而随机值并不能反映这点。作为影响力传播的关键因素,节点的激活概率对影响力传播模型的有效与否起着决定性的作用。节点的激活概率在社交网络中的意义是指用户被一条信息或微博影响的概率。那么要研究节点的激活概率首先要了解社交网络中的用户容易被哪些因素影响,从而使得信息成功传播出去。通过对社交网络中会对影响力传播造成影响的因素进行分析,发现情感是一个比较重要的影响因素,所以针对原有模型的不足结合情感分析对独立级联模型的激活概率计算方法做了改进。本专利技术通过加入情感系数到独立级联模型的激活概率计算公式中来对独立级联模型进行改进,分析每条微博的情感倾向,然后利用情感倾向来计算情感系数,之后将情感系数加入到激活概率的计算公式中,之后将改 ...
【技术保护点】
1.一种基于情感分析的社交网络影响力传播模型构建方法,其特征在于,包括以下步骤:通过加入情感系数到独立级联模型的激活概率计算公式中来对独立级联模型进行改进,具体包括:分析每条微博的情感倾向,然后利用情感倾向来计算情感系数,之后将情感系数加入到激活概率的计算公式中,再将改进后的激活概率计算公式加入到独立级联模型中,最后使用影响力传播模型来对社交网络中的影响力传播情况进行分析。
【技术特征摘要】
1.一种基于情感分析的社交网络影响力传播模型构建方法,其特征在于,包括以下步骤:通过加入情感系数到独立级联模型的激活概率计算公式中来对独立级联模型进行改进,具体包括:分析每条微博的情感倾向,然后利用情感倾向来计算情感系数,之后将情感系数加入到激活概率的计算公式中,再将改进后的激活概率计算公式加入到独立级联模型中,最后使用影响力传播模型来对社交网络中的影响力传播情况进行分析。2.根据权利要求1所述的基于情感分析的社交网络影响力传播模型构建方法,其特征在于,所述分析每条微博的情感倾向,然后利用情感倾向来计算情感系数,具体包括:1)、抓取微博数据,对每条微博进行情感分析,分析得到每条微博的情感倾向,情感倾向包括七类:1.客观,2.高兴,3.愤怒,4.悲伤,5.恐惧,6.反感,7.惊讶;2)、利用步骤1)的情感分析结果计算情感系数sn。3.根据权利要求2所述的基于情感分析的社交网络影响力传播模型构建方法,其特征在于,所述步骤1)对每条微博进行情感分析,采用的是细粒度情感分析,如果在一条微博中没有情感词的出现则此条微博的情感倾向为‘客观’,如果微博中包含有情感词则此条微博的情感强度的计算公式如下:其中scorej表示j类情感词的情感强度;m表示一条微博中属于i类情感的情感词数量,scorej的值是通过互信息来进行计算的,使用语料库来统计词语出现的概率,计算公式如下:其中,df(word)表示在语料中含有词语word的文档数目,N代表为语料数据集中文档总的数目,该值越大表示两个词语的相关程度就越强,所以,一个未知情感倾向词语word的情感倾向强度值计算为:scorej=∑pword∈PwordsPMI(word,pword)-∑nword∈NwordsPMI(word,nword)其中Pwords是褒...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。