当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于深度学习的微博用户情感影响力分析方法技术

技术编号:20025747 阅读:34 留言:0更新日期:2019-01-06 04:36
本发明专利技术提供一种基于深度学习的微博用户情感影响力分析方法,涉及自然语言处理领域。包括:获取某一话题下的用户三元组和微博五元组,并计算用户Ui的自身情感影响力;计算用户Ui与用户Uj交互得到的交互情感影响力;计算用户Ui的情感影响力;计算用户Ui的整体情感强度;计算用户Uj的整体情感强度;计算用户Ui和Uj整体情感强度的相似度;计算用户Ui对其粉丝施加的影响力;计算用户Ui的全局情感影响力;得到用户的全局情感影响力排名。本方法可用于目前备受关注的心理健康问题,通过数据获取平台分析某一个心理健康话题,找到话题影响者,从而帮助心理研究人员对这些用户进行后续的评估与诊断,也可以用于帮助商品推广、引领舆论导向、帮助有关部门决策。

【技术实现步骤摘要】
一种基于深度学习的微博用户情感影响力分析方法
本专利技术涉及自然语言处理
,具体涉及一种基于深度学习的微博用户情感影响力分析方法。
技术介绍
随着互联网技术的不断进步,由用户主导而生成的内容互联网模式更加符合当代人们对自我表达的需求,人类社会已经全面进入Web2.0时代,其中,微博的诞生是中国网络用户交互模式的一次重大变革。由于微博亲民、便捷、自主等特点,各种行业的微博账号覆盖面积逐渐扩大,越来越多的用户在微博上发表自己的所见所闻所想,而且一般都带有主观情感,这些情感类微博包含了许多可用信息,所以本文使用新浪微博作为数据来源。微博情感影响力分析是目前的研究热门,情感影响力分析的基础是微博文本的情感倾向性分析。针对微博文本的情感倾向性分析,目前主流的情感分析分为粗粒度的和细粒度的。其中,粗粒度的有2分类、3分类等,细粒度的有6分类、23分类等。目前的中文文本极性二分类算法主要包括基于机器学习和基于词典的方法,但是这些方法由于无法综合考虑文本的上下文语境,准确率并不高。卷积神经网络(CNN)能够高效地提取句子特征,其卷积层能够保证一次性扫描多个单词,这在考虑文本上下文语境任务中具有一定的优势。极限学习机(ELM)是一种单隐层前馈神经网络,能够保证在不损失学习精度的情况下比传统分类器训练时间更短。传统的社交网络影响力定义是具有一定导向能力的用户,也被称为“意见领袖”。但目前的相关研究主要考虑社交网络的拓扑结构和交互信息,这种分析方式是不全面的,因为在类似微博的社交网络中,用户会发表具有某些情感的博文来获取他人的兴趣,从而与之产生互动,这说明微博文本信息也是衡量微博用户影响力的关键因素,然而目前的研究工作却忽略了这一因素。本申请研究微博用户情感影响力,并将其定义为微博用户通过发布带有情感倾向的微博,对其他用户产生情感变化或使其他用户与自己情感趋于一致的能力。这种能力可以通过微博的网络结构、微博用户的交互行为以及用户发表的微博内容来综合衡量。基于网络结构的方法包括度中心性、中介中心性、紧密中心性以及特征向量中心性等。基于微博用户的交互行为方法考虑用户间的点赞、评论、转发以及提及(“@”)等。基于文本内容的分析方法目前的研究较少,但是它是用户表达情感的载体,因此对于情感影响力分析有着重要作用。现有的情感排名方法EmotionRank是由北京邮电大学的朱江等人提出的一种用于寻找微博用户中情感影响者的模型,该算法的缺点是,在局部情感影响力分析中,衡量因素不全面的缺点,在全局情感影响力分析中,时间复杂度过高。
技术实现思路
针对现有技术存在的问题,本专利技术提供一种基于深度学习的微博用户情感影响力分析方法,侧重研究情感分析中粗粒度的2分类方式,根据卷积神经网络(CNN)和单隐层前馈神经网络极限学习机(ELM)的优势,提出CNN+ELM模型来解决文本情感极性二分类问题,将微博用户的情感影响力划分为局部影响力和全局影响力,提出了能够计算上述两种影响力的情感影响力排名方法EmoIntRank,在局部情感影响力分析中,该方法结合拓扑结构、交互行为和文本内容三个因素,在某一个话题下进行影响力计算,找到该话题下的影响者,在全局情感影响力分析中,该方法综合拓扑结构和文本内容分析两个因素,找到全局情感影响者。为了实现上述目的,一种基于深度学习的微博用户情感影响力分析方法,包括以下步骤:步骤1:获取某一话题下的用户三元组Su和微博五元组SD,并计算用户三元组Su中每个近15天发表过不少于10篇微博用户Ui的自身情感影响力EItopic-zs(Ui);所述情感影响力包括用户Ui的受欢迎度DoUP(Ui)和用户Ui所发微博的受欢迎度DoWP(Ui);所述用户Ui的受欢迎度DoUP(Ui)由用户Ui的粉丝数决定,粉丝数越多,用户Ui的受欢迎度越高;所述用户Ui所发微博的受欢迎度DoWP(Ui)由该微博的转发数和评论数决定,转发数和评论数越高,用户Ui所发微博的受欢迎度越高;步骤2:计算用户Ui与每一个与用户Ui互动过的近15天发表过不少于10篇微博的用户Uj交互得到的交互情感影响力EItopic-jh(Ui);步骤3:根据用户Ui的自身情感影响力和交互情感影响力计算用户Ui的情感影响力EItopic(Ui);步骤4:计算用户Ui的整体情感强度EmoDi-Int;所述情感强度为用户发布的带有情感倾向的微博或评论D所具有的强烈程度,由用户发布的带有情感倾向的微博或评论D的情感得分ScoreD-emo决定;所述情感得分ScoreD-emo是根据boson工具对用户发布的带有情感倾向的微博或评论D进行情感分析后得到的,其值在0到1之间;所述整体情感强度EmoDi-Int为用户Ui在时间Tg内发表微博的情感强度均值;步骤5:计算用户Uj的整体情感强度EmoDj-Int;步骤6:计算用户Ui和用户Uj整体情感强度的相似度distance(Uj,Ui);步骤7:根据用户Ui和用户Uj整体情感强度的相似度计算用户Ui对其粉丝施加的影响力FEI(Ui);步骤8:根据用户Ui的情感影响力EItopic(Ui)和用户Ui对其粉丝施加的影响力计算用户Ui的全局情感影响力EIglobal(Ui);所述用户Ui的全局情感影响力EIglobal(Ui)为用户Ui在跨话题状态下通过其自身的受欢迎度DoUP(Ui)以及与其互动用户Uj的整体情感强度的相似度distance(Uj,Ui)共同决定的影响力;步骤9:将每个用户Ui的全局情感影响力EIglobal进行降序排列,即得到用户的全局情感影响力排名。进一步地,所述步骤1中计算用户Ui的自身情感影响力的公式如下:EItopic-zs(Ui)=(1-d)+DoUP(Ui)+∑DoWP(Ui);其中,d为区间[0,1]内的常数,用户Ui受欢迎度DoUP(Ui)和用户Ui所发微博的受欢迎度DoWP(Ui)的计算公式如下:DoUP=lgNfans;DoWP=lg|Ncm+Nre|;其中,Nfans为用户信息三元组Su中的粉丝数,Ncm为微博的评论数,Nre为微博的转发数。进一步地,所述步骤2中计算用户Ui与用户Uj交互得到的交互情感影响力EItopic-jh(Ui)的公式如下:EItopic-jh(Ui)=∑(Emowj-Int+EIR(Uj));其中,Emowj-Int为微博中词语的情感强度,EIR(Ui)为用户Ui的EmoIntRank算法值。进一步地,所述步骤4和步骤5中计算用户Ui和Uj的整体情感强度EmoUi-Int和EmoUj-Int的公式如下:其中,和分别为用户Ui和Uj在时间Tg内发表的所有微博数,eDi和eDi分别为用户Ui所发微博Di和Uj所发微博Dj的情感极性,EmoDi-Int和EmoDj-Int分别为用户Ui所发微博Di和Uj所发微博Dj的情感强度。进一步地,所述步骤6中计算用户Ui和用户Uj整体情感强度的相似度的公式如下:distance(Uj,Ui)=1+|EmoUi-Int-EmoUj-Int|;其中,|EmoUi-Int-EmoUj-Int|为用户Ui和Uj之间的整体情感影响强度的差值。进一步地,所述步骤7中计算用户Ui对其粉丝施加的影响力FEI(Ui)的公式如下:其中,d为区间[0,1]内的本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的微博用户情感影响力分析方法,其特征在于,包括以下步骤:步骤1:获取某一话题下的用户三元组Su和微博五元组SD,并计算用户三元组Su中每个近15天发表过不少于10篇微博用户Ui的自身情感影响力EItopic‑zs(Ui);所述情感影响力包括用户Ui的受欢迎度DoUP(Ui)和用户Ui所发微博的受欢迎度DoWP(Ui);所述用户Ui的受欢迎度DoUP(Ui)由用户Ui的粉丝数决定,粉丝数越多,用户Ui的受欢迎度越高;所述用户Ui所发微博的受欢迎度DoWP(Ui)由该微博的转发数和评论数决定,转发数和评论数越高,用户Ui所发微博的受欢迎度越高;步骤2:计算用户Ui与每一个与用户Ui互动过的近15天发表过不少于10篇微博的用户Uj交互得到的交互情感影响力EItopic‑jh(Ui);步骤3:根据用户Ui的自身情感影响力和交互情感影响力计算用户Ui的情感影响力EItopic(Ui);步骤4:计算用户Ui的整体情感强度EmoDi‑Int;所述情感强度为用户发布的带有情感倾向的微博或评论D所具有的强烈程度,由用户发布的带有情感倾向的微博或评论D的情感得分ScoreD‑emo决定;所述情感得分ScoreD‑emo是根据boson工具对用户发布的带有情感倾向的微博或评论D进行情感分析后得到的,其值在0到1之间;所述整体情感强度EmoDi‑Int为用户Ui在时间Tg内发表微博的情感强度均值;步骤5:计算用户Uj的整体情感强度EmoDj‑Int;步骤6:计算用户Ui和用户Uj整体情感强度的相似度distance(Uj,Ui);步骤7:根据用户Ui和用户Uj整体情感强度的相似度计算用户Ui对其粉丝施加的影响力FEI(Ui);步骤8:根据用户Ui的情感影响力EItopic(Ui)和用户Ui对其粉丝施加的影响力计算用户Ui的全局情感影响力EIglobal(Ui);所述用户Ui的全局情感影响力EIglobal(Ui)为用户Ui在跨话题状态下通过其自身的受欢迎度DoUP(Ui)以及与其互动用户Uj的整体情感强度的相似度distance(Uj,Ui)共同决定的影响力;步骤9:将每个用户Ui的全局情感影响力EIglobal进行降序排列,即得到用户的全局情感影响力排名。...

【技术特征摘要】
1.一种基于深度学习的微博用户情感影响力分析方法,其特征在于,包括以下步骤:步骤1:获取某一话题下的用户三元组Su和微博五元组SD,并计算用户三元组Su中每个近15天发表过不少于10篇微博用户Ui的自身情感影响力EItopic-zs(Ui);所述情感影响力包括用户Ui的受欢迎度DoUP(Ui)和用户Ui所发微博的受欢迎度DoWP(Ui);所述用户Ui的受欢迎度DoUP(Ui)由用户Ui的粉丝数决定,粉丝数越多,用户Ui的受欢迎度越高;所述用户Ui所发微博的受欢迎度DoWP(Ui)由该微博的转发数和评论数决定,转发数和评论数越高,用户Ui所发微博的受欢迎度越高;步骤2:计算用户Ui与每一个与用户Ui互动过的近15天发表过不少于10篇微博的用户Uj交互得到的交互情感影响力EItopic-jh(Ui);步骤3:根据用户Ui的自身情感影响力和交互情感影响力计算用户Ui的情感影响力EItopic(Ui);步骤4:计算用户Ui的整体情感强度EmoDi-Int;所述情感强度为用户发布的带有情感倾向的微博或评论D所具有的强烈程度,由用户发布的带有情感倾向的微博或评论D的情感得分ScoreD-emo决定;所述情感得分ScoreD-emo是根据boson工具对用户发布的带有情感倾向的微博或评论D进行情感分析后得到的,其值在0到1之间;所述整体情感强度EmoDi-Int为用户Ui在时间Tg内发表微博的情感强度均值;步骤5:计算用户Uj的整体情感强度EmoDj-Int;步骤6:计算用户Ui和用户Uj整体情感强度的相似度distance(Uj,Ui);步骤7:根据用户Ui和用户Uj整体情感强度的相似度计算用户Ui对其粉丝施加的影响力FEI(Ui);步骤8:根据用户Ui的情感影响力EItopic(Ui)和用户Ui对其粉丝施加的影响力计算用户Ui的全局情感影响力EIglobal(Ui);所述用户Ui的全局情感影响力EIglobal(Ui)为用户Ui在跨话题状态下通过其自身的受欢迎度DoUP(Ui)以及与其互动用户Uj的整体情感强度的相似度distance(Uj,Ui)共同决定的影响力;步骤9:将每个用户Ui的全局情感影响力EIglobal进行降序排列,即得到用户的全局情感影响力排名。2.根据权利要求1所述的基于深度学习的微博用户情感影响力分析方法,...

【专利技术属性】
技术研发人员:韩东红位付林林海原白霖吴刚刘莹
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1