当前位置: 首页 > 专利查询>西华大学专利>正文

一种针对社交网络领袖的影响力特征提取方法技术

技术编号:20004447 阅读:19 留言:0更新日期:2019-01-05 17:25
本发明专利技术公开了一种针对社交网络领袖的影响力特征提取方法,本发明专利技术通过对行为因子的量化,提取出七个维度特征的影响因子系数,包括回复动作因子,点赞动作因子,关注动作因子,转发行为因子,引用行为因子,发文行为因子和提及动作因子,充分避免了现有技术中影响因子提取不全面的问题,通过亲近系数、被关注度系数、传播系数和互动活跃度系数来计算超边属性,避免了指示计算传播信息与用户自身影响所带来的考虑因素不全面的问题,提供了更全面完整的用户影响力的衡量和评价方法,并以此对舆论领袖进行判别,具有较高网络领袖影响力特征提取的准确性。

An Influential Feature Extraction Method for Social Network Leaders

The invention discloses a method for extracting influential features of social network leaders. By quantifying the behavioral factors, the invention extracts the influential factor coefficients of seven dimensional features, including response action factors, praise action factors, attention to action factors, forwarding action factors, citing action factors, posting action factors and mentioning action factors, which fully avoids the existing ones. The problem of incomplete extraction of influencing factors in technology is solved by calculating Super-edge attributes through proximity coefficient, attention coefficient, communication coefficient and interaction activity coefficient, which avoids the problem of incomplete consideration factors caused by directive calculation of dissemination information and user's own influence, and provides a more comprehensive and complete method of measuring and evaluating user's influence, and carries on the public opinion leaders with this method. Discrimination has high accuracy of feature extraction of network Leaders'influence.

【技术实现步骤摘要】
一种针对社交网络领袖的影响力特征提取方法
本专利技术属于社交网络数据挖掘
,具体涉及一种针对社交网络领袖的影响力特征提取方法。
技术介绍
目前,随着网络技术的发展,类似于twitter的微博社交网络已经成为当前十分流行的一种社交网络交互系统,其用户已经遍布全球,随着其高速发展,网民高度参与内容产生的话题讨论,任何社会事件都有可能快速传播放大,网络成为反映社会舆情的主要载体之一,在舆情传播中起着重要作用。如果对网络舆情引导不善,负面的舆情将对社会的公共安全形成较大的威胁。舆论领袖是人际交往网络中的中心意见领袖人群,它能有效代表对舆情话题导向具有领导性作用,意见领袖在传播效果中起着重要作用,这意味着意见领袖传播的信息在源头上比其他阶段更有价值。因此,在进行舆情监控的时候,预先发现人群中的领袖,并对其进行有针对性的监控,将能提高舆情监控的准确的,提高其工作效率。目前国内外学者研究社交网络领袖影响力特征的方法有以下几种:(1)根据社交平台中话题发布者、回复者以及他们之间的回复关系,建立对应他们的在线推荐网络,采用改进的影响力扩散模型IDMS计算出基于文本内容挖掘、发帖者特性、回帖者特性以及相互回复关系的舆论领袖的影响力排名,最后使用科学有效的方法筛选出社交平台中的舆论领袖,从而建立识别社交平台中舆论领袖的模型。该方法只是以网民为节点,网民之间构成的回复关系为边构建社会网络,并未考虑外接信息如何对网民产生影响,网民发布言论的心理驱动力如何作用等问题,因此仅仅关注回复行为是不够的。(2)建立社交、环境、心理和观点四层网描述的网络舆论超网络模型,将现有的对网络舆论进行的单层社会网络分析扩展为超网络研究,在超网络的模型基础上,提出了一种新的超边排序算法,通过该算法对社交网中的各个舆论主体参与形成的超边进行排序,进而挖掘出网络舆论领袖。该方法中设计网只考虑网络舆论中参与讨论的舆论主体之间的回复关系进行讨论,讨论不够全面,缺少对点赞,提及等动作因子的讨论。环境网只考虑了信息传递中信息发布对社会舆论的影响,缺少对转发、引用等行为因子的讨论;超边属性计算时,只是考虑信息传播影响度,心理转化关联度以及观点相似程度来进计算。只是从信息传递与用户自身的影响因素出发,并没有对用户之间的关系进行考虑,如:一个用户的被关注度,互动活跃度以及用户之间的亲近系数等。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的针对社交网络领袖的影响力特征提取方法解决了现有的社交网络舆论影响力因子提取不全面、社交网络超边属性计算不具体的问题。为了达到上述专利技术目的,本专利技术采用的技术方案为:一种针对社交网络领袖的影响力特征提取方法,包括以下步骤:S1、在社交网络中,根据用户的行为动作,确定用户的操作序列;S2、根据操作序列,确定发出动作行为的用户时间惩罚因子;S3、统计用户的所有历史操作,根据确定的时间惩罚因子,累加历史操作的所有操作结果,确定累积影响系数;S4、根据用户时间惩罚因子和累积影响系数,量化并确定社交网络中的动作行为影响因子;S5、根据动作行为影响因子分别建立亲近系数网、被关注度系数网、传播系数网和互动活跃度网,并分别计算对应的亲近系数、被关注度系数、传播系数和互动活跃度系数;S6、根据亲近系数、被关注系数、传播系数和互动活跃度系数,建立影响力超网络模型;S7、根据影响力超网络模型,提取社交网络领袖的影响力特征。进一步地,所述步骤S1中,所述操作序列中的信息包括发出行为动作的用户、该用户操作具体的行为动作、该用户执行操作过程中被关联的对象用户和用户进行该操作的具体时间;所述步骤S4中,所述动作行为影响因子包括回复动作因子、转发行为因子、点赞动作因子、引用行为因子、提及动作因子、关注动作因子和发文行为因子。进一步地,所述步骤S2中,所述用户时间惩罚因子通过以下方式计算得到:其中,fp(T)表示在T时间差内的用户操作的时间惩罚因子;V表示不考虑时间惩罚的原始影响系数值;G表示重力因子。进一步地,所述步骤S3中,所述累积影响系数通过以下计算方式得到:其中,Sij表示在t-t0的时间差内,该操作下从用户i到j的累积影响力系数;Vtij表示某天内i对j同一操作的次数;Vt表示某天内用户i同意操作的次数。进一步地,所述步骤S5中,所述亲近系数网中:通过关注动作因子、提及动作因子和点赞动作因子构建亲近系数网;所述亲近系数为:式中,Jij表示关注动作因子;mij表示i对j的提及动作因子;mji表示j对i的提及动作因子;lij表示i对j的点赞动作因子;lji表示j对i的点赞动作因子;所述被关注度系数网中:通过所述关注动作因子、点赞动作因子、转发行为因子以及发文行为因子构建被关注度网;所述被关注度系数为:式中,Ji,j表示关注动作因子;pi表示发文行为因子;rtji表示j对i的转发行为因子;lij表示i对j的点赞动作因子;lji表示j对i的点赞动作因子;所述传播系数网中:通过所述回复动作因子、转发行为因子、发文行为因子和引用行为因子构建传播系数网;所述传播系数为:式中,rtji表示j为i的转发行为因子;rpji表示j对i的转发行为因子;qji表示j对i的回复动作因子;pi表示发文行为因子;所述互动活跃度网中:通过提及动作因子、点赞动作因子、回复动作因子、引用行为因子和发文行为因子构建互动活跃度网;所述互动活跃度系数为:式中,li,j表示i对j的点赞动作因子;mij表示i对j的提及动作因子;rpij表示i对j的回复动作因子;qij表示i对j的引用行为因子;pj表示发文行为因子。进一步地,所述步骤S6中,所述影响力超网络模型为:其中,HyperRank(ui)表示用户节点ui的超边影响力Rank值;Foci表示用户i的被关注度总值;N为影响力超网络中总的节点数;M(ui)是所有用户节点ui链接到的其他节点的集合;L(ui)表示用户节点ui的链接节点数;Foci表示用户i的被关注度系数;Clsij表示亲近系数;Spri,j表示传播系数;Actij表示i对j的活跃度系数;σ(x)为激活函数;uj表示用户节点uj。进一步地,所述步骤S7中,提取社交网络领袖的影响力特征的方法具体为:设置阈值threshold,当用户结点在影响力超网络中的超边影响力Rank值超过阈值threshold时,将该用户结点作为影响力超网络中的关键结点,并作为网络领袖的人群节点集合,完成社交网络领袖的影响力特征的提取。本专利技术的有益效果为:本专利技术通过对行为因子的量化,提取出七个维度特征的影响因子系数,包括回复动作因子,点赞动作因子,关注动作因子,转发行为因子,引用行为因子,发推文行为因子,提及动作因子,充分避免了现有技术中影响因子提取不全面的问题,通过亲近系数、被关注度系数、传播系数和互动活跃度系数来计算超边属性,避免了指示计算传播信息与用户自身影响所带来的考虑因素不全面的问题,提供了更全面完整的用户影响力的衡量和评价方法,并以此对舆论领袖进行判别,具有较高网络领袖影响力特征提取的准确性。附图说明图1为本专利技术提供的实施例中社交网络领袖的影响力特征提取方法实现流程图。图2为本专利技术提供的实施例中影响力超网络评价排名处理流程图。图3为本专利技术提供的实施例中亲近性、被关注度、传播度、活跃度下的4层影本文档来自技高网
...

【技术保护点】
1.一种针对社交网络领袖的影响力特征提取方法,其特征在于,包括以下步骤:S1、在社交网络中,根据用户的行为动作,确定用户的操作序列;S2、根据操作序列,确定发出动作行为的用户时间惩罚因子;S3、统计用户的所有历史操作,根据确定的时间惩罚因子,累加历史操作的所有操作结果,确定累积影响系数;S4、根据用户时间惩罚因子和累积影响系数,量化并确定社交网络中的动作行为影响因子;S5、根据动作行为影响因子分别建立亲近系数网、被关注度系数网、传播系数网和互动活跃度网,并分别计算对应的亲近系数、被关注度系数、传播系数和互动活跃度系数;S6、根据亲近系数、被关注系数、传播系数和互动活跃度系数,建立影响力超网络模型;S7、根据影响力超网络模型,提取社交网络领袖的影响力特征。

【技术特征摘要】
1.一种针对社交网络领袖的影响力特征提取方法,其特征在于,包括以下步骤:S1、在社交网络中,根据用户的行为动作,确定用户的操作序列;S2、根据操作序列,确定发出动作行为的用户时间惩罚因子;S3、统计用户的所有历史操作,根据确定的时间惩罚因子,累加历史操作的所有操作结果,确定累积影响系数;S4、根据用户时间惩罚因子和累积影响系数,量化并确定社交网络中的动作行为影响因子;S5、根据动作行为影响因子分别建立亲近系数网、被关注度系数网、传播系数网和互动活跃度网,并分别计算对应的亲近系数、被关注度系数、传播系数和互动活跃度系数;S6、根据亲近系数、被关注系数、传播系数和互动活跃度系数,建立影响力超网络模型;S7、根据影响力超网络模型,提取社交网络领袖的影响力特征。2.根据权利要求1所述的针对社交网络领袖的影响力特征提取方法,其特征在于,所述步骤S1中,所述操作序列中的信息包括发出行为动作的用户、该用户操作具体的行为动作、该用户执行操作过程中被关联的对象用户和用户进行该操作的具体时间;所述步骤S4中,所述动作行为影响因子包括回复动作因子、转发行为因子、点赞动作因子、引用行为因子、提及动作因子、关注动作因子和发文行为因子。3.根据权利要求2所述的针对社交网络领袖的影响力特征提取方法,其特征在于,所述步骤S2中,所述用户时间惩罚因子通过以下方式计算得到:其中,fp(T)表示在T时间差内的用户操作的时间惩罚因子;V表示不考虑时间惩罚的原始影响系数值;G表示重力因子。4.根据权利要求3所述的针对社交网络领袖的影响力特征提取方法,其特征在于,所述步骤S3中,所述累积影响系数通过以下方式计算得到:其中,Sij表示在t-t0的时间差内,该操作下从用户i到j的累积影响力系数;Vtij表示某天内对j同一操作的次数;Vt表示某天内用户i同意操作的次数。5.根据权利要求2所述的针对社交网络领袖的影响力特征提取方法,其特征在于,所述步骤S5中,所述亲近系数网中:通过关注动作因子、提及动作因子和点赞动作因子构建亲近系数网;所述亲近系数为:式中,Ji,j表示关注动作因子;mij表...

【专利技术属性】
技术研发人员:郭奕郑天航洪小晶汤微杰肖舒予卿朝进张岷涛黄永茂
申请(专利权)人:西华大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1