一种微博热度分析获取方法技术

技术编号:18426525 阅读:26 留言:0更新日期:2018-07-12 02:02
本发明专利技术涉及一种微博热度分析获取方法,首先基于微博消息所对应各个指定的原始数据信息,获得相对应的各个微博因子数据;接着获得各个微博因子数据分别所对应的系数;然后针对各个微博因子数据降维操作,获得相对应的各个微博信息维度,以及各个微博信息维度的权重,紧接着获得各个微博信息维度的数据;最后获得微博热度指数;如此设计,不仅从以往传播方面判断微博热度指数,还包括了微博本身内容的影响和博主特性的影响,更添加了“微博水军”过滤算法和微博积极参与用户数的影响,能更全面的体现微博的真实热度。

A method for obtaining the thermal analysis of micro-blog

The invention relates to a method for obtaining the thermal analysis of micro-blog. First, based on the corresponding original data information corresponding to the micro-blog message, each of the corresponding micro-blog factor data is obtained, and then the coefficients corresponding to each of the micro-blog factor data are obtained, and then the corresponding response to each of the micro-blog factor data reduction operations is obtained. Each of the micro-blog information dimension and the weight of each micro-blog information dimension, then obtain the data of each micro-blog information dimension, and finally obtain the micro-blog thermal index. This design not only determines the micro-blog heat index from the previous propagation, but also includes the influence of the content of micro-blog itself and the influence of the blogger's characteristics. Adding the \micro-blog water army\ filtering algorithm and micro-blog's active participation in the number of users can reflect the true heat of micro-blog more comprehensively.

【技术实现步骤摘要】
一种微博热度分析获取方法
本专利技术涉及一种微博热度分析获取方法,属于社交网络

技术介绍
当前微博已成为网络社交的重要媒介之一,在知识传播、信息分享、社会舆情等方面影响着人们的行为方式。微博即微型博客的简称,也即是博客的一种,是一种通过关注机制分享简短实时信息的广播式的社交网络平台。微博是一个基于用户关系信息分享、传播以及获取的平台。用户可以通过WEB、WAP等各种客户端组建个人社区,以140字(包括标点符号)的文字更新信息,并实现即时分享。微博的关注机制分为可单向、可双向两种。微博作为一种分享和交流平台,其更注重时效性和随意性。微博更能表达出每时每刻的思想和最新动态,而博客则更偏重于梳理自己在一段时间内的所见、所闻、所感。因此,微博是当前社交网络中的重要方式,而微博热度是评价的微博消息的一个指标,当前技术中,还没有个准确的方式实现微博热度的评价,因此现有技术对于微博的评价还不够准确。
技术实现思路
本专利技术所要解决的技术问题是提供一种能够针对微博消息实现准确评价的微博热度分析获取方法。本专利技术为了解决上述技术问题采用以下技术方案:本专利技术设计了一种微博热度分析获取方法,用于实现目标微博消息热度的获取,包括如下步骤:步骤A.获取目标微博消息所对应各个指定的原始数据信息,并针对各个原始数据信息进行处理,获得相对应的各个微博因子数据,然后进入步骤B;步骤B.针对各个微博因子数据,获得各个微博因子数据分别所对应的系数,然后进入步骤C;步骤C.针对各个微博因子数据,进行因子分析,并降维操作,获得相对应的各个微博信息维度,以及各个微博信息维度的权重,然后进入步骤D;步骤D.基于各个微博因子数据分别所对应的系数,根据各个微博信息维度与各个微博因子数据之间的对应关系,通过加权方法,获得各个微博信息维度的数据,然后进入步骤E;步骤E.根据各个微博信息维度的权重,以及各个微博信息维度的数据,按如下公式:获得微博热度指数F,其中,I表示微博信息维度的个数,αi表示第i个微博信息维度的权重,Fi表示第i个微博信息维度的数据。作为本专利技术的一种优选技术方案:所述步骤B中,针对各个微博因子数据,通过采用因子抽取与因子旋转方法,获得各个微博因子数据分别所对应的系数。作为本专利技术的一种优选技术方案:所述步骤C中,针对各个微博因子数据,进行主成分因子分析,并降维操作。作为本专利技术的一种优选技术方案:所述步骤A中,目标微博消息所对应各个指定的原始数据信息,包括阅读量、点赞数、评论数、转发数、博主粉丝数、活跃天数、微博文字数、图片数、传播时长。作为本专利技术的一种优选技术方案:所述步骤A中,针对各个原始数据信息按如下步骤进行处理,获得相对应的各个微博因子数据;步骤A1.根据带有有效文字转发内容的转发数,获得转发并评论数,并根据参与评论或转发的用户的发博量少于3条,且用户的粉丝数少于5个视为僵尸用户,获得僵尸用户数,以及将用户发博内容原创率为0视为水军用户,获得水军用户数,然后进入步骤A2;步骤A2.根据微博文字数/140,获得文字充实度;根据图片数/9,获得图片充实度;根据转发并评论数/阅读量,获得深度传播率;根据僵尸用户数、水军用户数之和与阅读量的比值,获得负面传播率,然后进入步骤A3;步骤A3.将博主粉丝数、活跃天数、文字充实度、图片充实度、传播时长、深度传播率、负面传播率作为各个微博因子数据。本专利技术所述一种微博热度分析获取方法采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术设计的微博热度分析获取方法,基于微博的网络数据,分析信息在微博中的传播特征,包括微博发博客户端分布、微博传播时间和微博传播参与度等传播特征,提炼影响微博传播的各种因素;并且基于微博的用户特征、内容特征和信息传播特征等指标,改进了的基于因子分析法的热度评价模型,通过对单条微博的各种数据特征进行测量和统计,并使用因子分析对数据进行整理分析,最终对其结果进行排序和对比,分析与原排序的差异产生原因,结果表明本模型具有较高准确性,并且本专利技术方法同时考虑到负面传播和深度传播这两种在微博中常见且不可忽视的现象,更能综合体现微博的热度。附图说明图1是本专利技术所设计微博热度分析获取方法的流程示意图;图2是本专利技术应用实施例中因子分析碎石图;图3是本专利技术应用实施例中旋转空间的成分图;图4是本专利技术应用实施例中数据删选整理后的分析图。具体实施方式下面结合说明书附图对本专利技术的具体实施方式作进一步详细的说明。如图1所示,本专利技术设计了一种微博热度分析获取方法,用于实现目标微博消息热度的获取,实际应用过程当中,具体包括如下步骤:步骤A.获取目标微博消息所对应各个指定的原始数据信息,并针对各个原始数据信息进行处理,获得相对应的各个微博因子数据,然后进入步骤B。实际应用中,针对目标微博消息所对应各个指定的原始数据信息,具体设计包括阅读量、点赞数、评论数、转发数、博主粉丝数、活跃天数、微博文字数、图片数、传播时长。基于上述九项原始数据信息,针对各个原始数据信息按如下步骤进行处理,获得相对应的各个微博因子数据;步骤A1.根据带有有效文字转发内容的转发数,获得转发并评论数,并根据参与评论或转发的用户的发博量少于3条,且用户的粉丝数少于5个视为僵尸用户,获得僵尸用户数,以及将用户发博内容原创率为0视为水军用户,获得水军用户数,然后进入步骤A2。步骤A2.根据微博文字数/140,获得文字充实度;根据图片数/9,获得图片充实度;根据转发并评论数/阅读量,获得深度传播率;根据僵尸用户数、水军用户数之和与阅读量的比值,获得负面传播率,然后进入步骤A3。步骤A3.将博主粉丝数、活跃天数、文字充实度、图片充实度、传播时长、深度传播率、负面传播率作为各个微博因子数据。步骤B.采用SPPS软件,针对各个微博因子数据,通过采用因子抽取与因子旋转方法,获得各个微博因子数据分别所对应的系数,然后进入步骤C。步骤C.针对各个微博因子数据,采用SPPS软件,进行主成分因子分析,并降维操作,获得相对应的各个微博信息维度,以及各个微博信息维度的权重,然后进入步骤D。步骤D.基于各个微博因子数据分别所对应的系数,根据各个微博信息维度与各个微博因子数据之间的对应关系,通过加权方法,获得各个微博信息维度的数据,然后进入步骤E。步骤E.根据各个微博信息维度的权重,以及各个微博信息维度的数据,按如下公式:获得微博热度指数F,其中,I表示微博信息维度的个数,αi表示第i个微博信息维度的权重,Fi表示第i个微博信息维度的数据。将上述所设计微博热度分析获取方法,应用到实际当中,从2017年4月18日新浪微博平台按顺序选取了其热门推送内的十条微博,将这十条微博的数据,根据本专利技术所设计的微博热度分析获取方法进行处理。具体包括如下步骤:步骤A.分别针对十条微博消息,获取微博消息所对应的阅读量、点赞数、评论数、转发数、博主粉丝数、活跃天数、微博文字数、图片数、传播时长,并针对此九个原始数据信息按如下步骤进行处理,获得相对应的各个微博因子数据,即博主粉丝数、活跃天数、文字充实度、图片充实度、传播时长、深度传播率、负面传播率,进而分别获得各条微博消息分别所对应的各个微博因子数据,如下表1所示,然后进入步骤B。步骤A1.根据带有有效文字转发内容的转发数,获得转本文档来自技高网...

【技术保护点】
1.一种微博热度分析获取方法,用于实现目标微博消息热度的获取,其特征在于,包括如下步骤:步骤A.获取目标微博消息所对应各个指定的原始数据信息,并针对各个原始数据信息进行处理,获得相对应的各个微博因子数据,然后进入步骤B;步骤B.针对各个微博因子数据,获得各个微博因子数据分别所对应的系数,然后进入步骤C;步骤C.针对各个微博因子数据,进行因子分析,并降维操作,获得相对应的各个微博信息维度,以及各个微博信息维度的权重,然后进入步骤D;步骤D.基于各个微博因子数据分别所对应的系数,根据各个微博信息维度与各个微博因子数据之间的对应关系,通过加权方法,获得各个微博信息维度的数据,然后进入步骤E;步骤E.根据各个微博信息维度的权重,以及各个微博信息维度的数据,按如下公式:

【技术特征摘要】
1.一种微博热度分析获取方法,用于实现目标微博消息热度的获取,其特征在于,包括如下步骤:步骤A.获取目标微博消息所对应各个指定的原始数据信息,并针对各个原始数据信息进行处理,获得相对应的各个微博因子数据,然后进入步骤B;步骤B.针对各个微博因子数据,获得各个微博因子数据分别所对应的系数,然后进入步骤C;步骤C.针对各个微博因子数据,进行因子分析,并降维操作,获得相对应的各个微博信息维度,以及各个微博信息维度的权重,然后进入步骤D;步骤D.基于各个微博因子数据分别所对应的系数,根据各个微博信息维度与各个微博因子数据之间的对应关系,通过加权方法,获得各个微博信息维度的数据,然后进入步骤E;步骤E.根据各个微博信息维度的权重,以及各个微博信息维度的数据,按如下公式:获得微博热度指数F,其中,I表示微博信息维度的个数,αi表示第i个微博信息维度的权重,Fi表示第i个微博信息维度的数据。2.根据权利要求1所述一种微博热度分析获取方法,其特征在于:所述步骤B中,针对各个微博因子数据,通过采用因子抽取与因子旋转方法,获得各个微博因子数据分别所对应的系数。3.根据权利要求1所述一种微博热度分...

【专利技术属性】
技术研发人员:宋玉蓉刘向阳孟繁荣
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1