一种针对政务微博传播影响力的计算方法技术

技术编号:19934308 阅读:23 留言:0更新日期:2018-12-29 04:35
本发明专利技术公开了一种针对政务微博传播影响力的计算方法,步骤(1)通过网络爬虫技术采集政务微博账号的数量及每个政务微博账号的属性信息和所发微博内容,从中提炼出待测政务微博账号,所述待测政务微博账号的平台上通过网络爬虫技术采集待测政务微博账号的待测属性信息和待测所发微博内容;步骤(2)根据步骤(1)分别得到计算得到待测政务微博账号的传播辐射度、活跃度和互动度;步骤(3)根据待测政务微博账号的传播辐射度、活跃度和互动度计算得到待测政务微博账号的综合传播影响力值。本发明专利技术其能够对目前我国各级政府开设的政务微博账号进行全面评估,对其传播效果进行数字化度量,及时掌控各个政务微博账号的实时运行情况。

【技术实现步骤摘要】
一种针对政务微博传播影响力的计算方法
本专利技术涉及及社交关系网络
,尤其涉及一种针对政务微博传播影响力的计算方法。
技术介绍
随着互联网的发展,微博应用越来越广泛。微博平台上用户与用户相互之间的关系构成了一个巨大的社交关系网络,其中,每个微博用户为所述社交关系网络中的节点,点赞关系、评论关系和转发关系为所述社交关系网络中的边。这里,评论关系和转发关系是微博用户使用率最高的微博功能;一方面,微博用户习惯于评论和转发自己关注的微博用户发布的相关微博;另一方面,微博用户会不断发现新的微博用户发布的微博并进行评论和转发。目前对微博传播影响力的计算方法,基本都是针对微博大V(是指在新浪、腾讯、网易等微博平台上获得个人认证,拥有众多粉丝的微博用户,由于经过认证的微博用户,在微博昵称后都会附有类似于大写的英语字母"V"的图标,因此,网民将这种经过个人认证并拥有众多粉丝的微博用户称为"大V")用户的传播影响力。目前对社交媒体用户影响力的研究主要围绕着网络拓扑结构、用户行为动作和交互信息等展开,其均是基于网络拓扑结构的影响力度量方法和基于社交网络上最短路径的方法。对于是基于网络拓扑结构的影响力度量方法主要包括基于节点度、基于最短路径、基于HITS算法和基于PageRank算法及扩展方法,而社交媒体中用户的粉丝数和微博的评论数都是衡量影响力的直观指标,其中基于节点度的度量指标主要有入度、出度和中心度,而入度可以衡量当前节点对邻居节点的影响力,出度可以衡量邻居节点对当前节点的影响力,度中心度(DegreeCentrality)则可以用来衡量当前节点对其邻居的平均影响力;基于社交网络上最短路径的方法主要紧密中心度(ClosenessCentrality)和介数中心度(BetweenCentrality)等,紧密中心度可用来度量当前节点对其他节点的间接影响力,该值越大,表示当前用户和其他用户之间的距离越短,该用户影响其他用户的速度越快,介数中心度衡量节点在网络结构中所处位置的重要性,该度量值越大,表示网络中信息流动时经过该节点的信息量越大,即该节点在信息传播过程中的影响力越大。因此,通过上述能够对大V用户的传播影响力进行计算,但是对于现在作为政务公开的创新方式,政务微博已越发受到重视,成为众多行业、众多地区政务建设的“标准配置”,政务微博作为“互联网+政务”的典范,应用新的社交媒体方式,推动了政务公开,而实际上政务微博和大V用户的传播效果的度量角度是不一样的,所以不能完全套用大V用户的传播影响力计算方法度量政务微博的传播影响力,因此有必要提供一种专门针对政务微博的传播影响力进行方法。
技术实现思路
针对现有技术中的缺陷,本专利技术提供了一种针对政务微博传播影响力的计算方法,其能够对目前我国各级政府开始的政务微博账号进行全面评估,对其传播效果进行数字化度量,及时掌控各个政务微博账号的实时运行情况,推进“互联网+政务”建设,推进阳光政府、服务型政府建设。为了实现上述目的,本专利技术所采取的技术方案是:一种针对政务微博传播影响力的计算方法,包括以下步骤:步骤(1)通过新浪微博爬虫技术采集政务微博账号的数量以及每个政务微博账号的属性信息和所发微博内容,所述属性信息包括实名认证标志、关注数、粉丝数和总微博数属性信息,所述微博内容包括其所发布的每篇微博的内容和发布时间、微博的转发数、评论数、点赞数,从中提炼出待测政务微博账号,所述待测政务微博账号的平台上通过网络爬虫技术采集待测政务微博账号的待测属性信息和待测所发微博内容,所述待测政务微博账号的待测属性信息包括待测实名认证标志、待测关注数、待测粉丝数和待测总微博数,所述待测政务微博账号的粉丝数R2,所述待测政务微博账号的微博内容包括其待测所发布的每篇微博的内容、待测发布时间、待测微博的转发数、待测评论数、待测点赞数、待测总活跃次数A21、待测政务微博账号在较长时间段内的活跃次数A22以及待测政务微博账号在较短时间段内的活跃次数A23;步骤(2)根据步骤(1)采集待测政务微博账号得的待测属性信息和待测所发微博内容计算得到待测政务微博账号的传播辐射度R:R=0.6×R1+0.4×R2其中,R1表示待测政务微博账号的微博被转发值;R2为待测政务微博账号粉丝数的归一化值,R2=待测政务微博账号的粉丝数/采集所有政务微博账号中粉丝数的最大值;步骤(3)是对于步骤(2)中所述待测政务微博账号的微博被转发值R1可通过以下方法计算得到:R1=0.6×R11+0.3×R12+0.1×R13其中,R11表示待测政务微博账号所发微博被转发总数的归一化值,R11=待测政务微博账号所发微博的被转发总数/采集所有政务微博账号中所发微博被转发总数的最大值,R12为待测政务微博账号所发微博的平均被转发数的归一化值:R12=待测政务微博账号所发微博的平均被转发数/采集所有政务微博账号中所发微博的平均被转发数的最大值;R13表示待测政务微博账号所发微博的最大被转发数的归一化值:R13=待测政务微博账号所发微博的最大转发数/采集所有政务微博账号中所发微博的最大转发数的最大值;步骤(4)根据步骤(1)采集待测政务微博账号的待测属性信息和待测所发微博内容计算得到待测政务微博账号的活跃度A:A=0.7×A1+0.3×A2其中,A1表示待测政务微博账号的发微博值,A2为待测政务微博账号的活跃值;步骤(5)是对于步骤(4)中所述待测政务微博账号的发微博值A1可通过以下方法计算:A1=0.5×A11+0.5×A12其中,A11表示待测政务微博账号所发微博总数的归一化值,A11=待测政务微博账号所发微博总数/采集所有政务微博账号中所发微博总数的最大值,A12为待测政务微博账号所发微博中原创微博数量的归一化值,A12=待测政务微博账号所发的原创微博数/采集所有政务微博账号中所发原创微博数的最大值;步骤(6)是对于步骤(4)中所述待测政务微博账号的活跃值A2可通过以下方法计算:A2=0.5×A21+0.3×A22+0.2×A23其中,A21表示待测政务微博账号的总活跃次数的归一化值,A21=待测政务微博账号的总活跃次数/采集所有政务微博账号中总活跃次数的最大值,A22为待测政务微博账号在较长时间段内的活跃次数的归一化值,A22=待测政务微博账号在较长时间段内的活跃次数/采集所有政务微博账号中在较长时间段内的活跃次数的最大值,A23为待测政务微博账号在较短时间段内的活跃次数归一化值,A23=待测政务微博账号在较短时间段内的活跃次数/采集所有政务微博账号中在较短时间段内的活跃次数的最大值;步骤(7)根据步骤(1)采集的待测政务微博账号的待测属性信息和待测所发微博内容计算得到待测政务微博账号的互动度I:I=0.6×I1+0.4×I2其中,I1表示待测政务微博账号的被评论值,I2表示待测政务微博账号的被点赞值;步骤(8)是对于步骤(7)中所述待测政务微博账号的被评论值I1可通过以下方法计算:I1=0.5×I11+0.3×I12+0.2×I13其中,I11表示待测政务微博账号所发微博被评论总数的归一化值,I11=待测政务微博账号所发微博的被评论总数/采集所有政务微博账号中所发微博被评论总数的最大值,I12为待测政务微博账号所发微博的平均被评论数的归本文档来自技高网
...

【技术保护点】
1.一种针对政务微博传播影响力的计算方法,其特征在于,包括以下步骤:步骤(1)通过新浪微博爬虫技术采集政务微博账号的数量以及每个政务微博账号的属性信息和所发微博内容,所述属性信息包括实名认证标志、关注数、粉丝数和总微博数属性信息,所述微博内容包括其所发布的每篇微博的内容和发布时间、微博的转发数、评论数、点赞数,从中提炼出待测政务微博账号,所述待测政务微博账号的平台上通过网络爬虫技术采集待测政务微博账号的待测属性信息和待测所发微博内容,所述待测政务微博账号的待测属性信息包括待测实名认证标志、待测关注数、待测粉丝数和待测总微博数,所述待测政务微博账号的粉丝数R2,所述待测政务微博账号的微博内容包括其待测所发布的每篇微博的内容、待测发布时间、待测微博的转发数、待测评论数、待测点赞数、待测总活跃次数A21、待测政务微博账号在较长时间段内的活跃次数A22以及待测政务微博账号在较短时间段内的活跃次数A23;步骤(2)根据步骤(1)采集待测政务微博账号得的待测属性信息和待测所发微博内容计算得到待测政务微博账号的传播辐射度R:R=0.6×R1+0.4×R2其中,R1表示待测政务微博账号的微博被转发值;R2为待测政务微博账号粉丝数的归一化值,R2=待测政务微博账号的粉丝数/采集所有政务微博账号中粉丝数的最大值;步骤(3)是对于步骤(2)中所述待测政务微博账号的微博被转发值R1可通过以下方法计算得到:R1=0.6×R11+0.3×R12+0.1×R13其中,R11表示待测政务微博账号所发微博被转发总数的归一化值,R11=待测政务微博账号所发微博的被转发总数/采集所有政务微博账号中所发微博被转发总数的最大值,R12为待测政务微博账号所发微博的平均被转发数的归一化值:R12=待测政务微博账号所发微博的平均被转发数/采集所有政务微博账号中所发微博的平均被转发数的最大值;R13表示待测政务微博账号所发微博的最大被转发数的归一化值:R13=待测政务微博账号所发微博的最大转发数/采集所有政务微博账号中所发微博的最大转发数的最大值;步骤(4)根据步骤(1)采集待测政务微博账号的待测属性信息和待测所发微博内容计算得到待测政务微博账号的活跃度A:A=0.7×A1+0.3×A2其中,A1表示待测政务微博账号的发微博值,A2为待测政务微博账号的活跃值;步骤(5)是对于步骤(4)中所述待测政务微博账号的发微博值A1可通过以下方法计算:A1=0.5×A11+0.5×A12其中,A11表示待测政务微博账号所发微博总数的归一化值,A11=待测政务微博账号所发微博总数/采集所有政务微博账号中所发微博总数的最大值,A12为待测政务微博账号所发微博中原创微博数量的归一化值,A12=待测政务微博账号所发的原创微博数/采集所有政务微博账号中所发原创微博数的最大值;步骤(6)是对于步骤(4)中所述待测政务微博账号的活跃值A2可通过以下方法计算:A2=0.5×A21+0.3×A22+0.2×A23其中,A21表示待测政务微博账号的总活跃次数的归一化值,A21=待测政务微博账号的总活跃次数/采集所有政务微博账号中总活跃次数的最大值,A22为待测政务微博账号在较长时间段内的活跃次数的归一化值,A22=待测政务微博账号在较长时间段内的活跃次数/采集所有政务微博账号中在较长时间段内的活跃次数的最大值,A23为待测政务微博账号在较短时间段内的活跃次数归一化值,A23=待测政务微博账号在较短时间段内的活跃次数/采集所有政务微博账号中在较短时间段内的活跃次数的最大值;步骤(7)根据步骤(1)采集的待测政务微博账号的待测属性信息和待测所发微博内容计算得到待测政务微博账号的互动度I:I=0.6×I1+0.4×I2其中,I1表示待测政务微博账号的被评论值,I2表示待测政务微博账号的被点赞值;步骤(8)是对于步骤(7)中所述待测政务微博账号的被评论值I1可通过以下方法计算:I1=0.5×I11+0.3×I12+0.2×I13其中,I11表示待测政务微博账号所发微博被评论总数的归一化值,I11=待测政务微博账号所发微博的被评论总数/采集所有政务微博账号中所发微博被评论总数的最大值,I12为待测政务微博账号所发微博的平均被评论数的归一化值,I12=待测政务微博账号所发微博的平均被评论数/采集所有政务微博账号中所发微博的平均被评论数的最大值,I13为待测政务微博账号所发微博的最多被评论数的归一化值,I13=待测政务微博账号所发微博的最多被评论数/采集所有政务微博账号中所发微博的最多被评论数的最大值;步骤(9)是对于步骤(7)中所述待测政务微博账号的被点赞值I2可通过以下方法计算:I2=0.5×I21+0.3×I22+0.2×I23其中,I21表示待测政务微博账号所发微博被点赞总数的归一化值,I21=待测政务微博账号所...

【技术特征摘要】
1.一种针对政务微博传播影响力的计算方法,其特征在于,包括以下步骤:步骤(1)通过新浪微博爬虫技术采集政务微博账号的数量以及每个政务微博账号的属性信息和所发微博内容,所述属性信息包括实名认证标志、关注数、粉丝数和总微博数属性信息,所述微博内容包括其所发布的每篇微博的内容和发布时间、微博的转发数、评论数、点赞数,从中提炼出待测政务微博账号,所述待测政务微博账号的平台上通过网络爬虫技术采集待测政务微博账号的待测属性信息和待测所发微博内容,所述待测政务微博账号的待测属性信息包括待测实名认证标志、待测关注数、待测粉丝数和待测总微博数,所述待测政务微博账号的粉丝数R2,所述待测政务微博账号的微博内容包括其待测所发布的每篇微博的内容、待测发布时间、待测微博的转发数、待测评论数、待测点赞数、待测总活跃次数A21、待测政务微博账号在较长时间段内的活跃次数A22以及待测政务微博账号在较短时间段内的活跃次数A23;步骤(2)根据步骤(1)采集待测政务微博账号得的待测属性信息和待测所发微博内容计算得到待测政务微博账号的传播辐射度R:R=0.6×R1+0.4×R2其中,R1表示待测政务微博账号的微博被转发值;R2为待测政务微博账号粉丝数的归一化值,R2=待测政务微博账号的粉丝数/采集所有政务微博账号中粉丝数的最大值;步骤(3)是对于步骤(2)中所述待测政务微博账号的微博被转发值R1可通过以下方法计算得到:R1=0.6×R11+0.3×R12+0.1×R13其中,R11表示待测政务微博账号所发微博被转发总数的归一化值,R11=待测政务微博账号所发微博的被转发总数/采集所有政务微博账号中所发微博被转发总数的最大值,R12为待测政务微博账号所发微博的平均被转发数的归一化值:R12=待测政务微博账号所发微博的平均被转发数/采集所有政务微博账号中所发微博的平均被转发数的最大值;R13表示待测政务微博账号所发微博的最大被转发数的归一化值:R13=待测政务微博账号所发微博的最大转发数/采集所有政务微博账号中所发微博的最大转发数的最大值;步骤(4)根据步骤(1)采集待测政务微博账号的待测属性信息和待测所发微博内容计算得到待测政务微博账号的活跃度A:A=0.7×A1+0.3×A2其中,A1表示待测政务微博账号的发微博值,A2为待测政务微博账号的活跃值;步骤(5)是对于步骤(4)中所述待测政务微博账号的发微博值A1可通过以下方法计算:A1=0.5×A11+0.5×A12其中,A11表示待测政务微博账号所发微博总数的归一化值,A11=待测政务微博账号所发微博总数/采集所有政务微博账号中所发微博总数的最大值,A12为待测政务微博账号所发微博中原创微博数量的归一化值,A12=待测政务微博账号所发的原创微博数/采集所有政务微博账号中所发原创微博数的最大值;步骤(6)是对于步骤(4)中所述待测政务微博账号的活跃值A2可通过以下方法计算:A2=0.5×A21+0.3×A22+0.2×A23其中,A21表示...

【专利技术属性】
技术研发人员:俞定国
申请(专利权)人:浙江传媒学院
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1