一种微博舆情指标体系的计算方法及装置制造方法及图纸

技术编号:14399411 阅读:52 留言:0更新日期:2017-01-11 12:41
本发明专利技术公开了一种微博舆情指标体系的计算方法及装置。其中,该方法包括:构建微博舆情指标体系;其中,微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算微博主体的活跃度和影响力;计算微博信息的热度和影响力;计算微博话题的热度和影响力;基于计算结果得到微博舆情综合指数。本发明专利技术构建了微博舆情指标体系,并且基于微博舆情指标体系,可准确获取得到微博舆情综合指数。解决了相关技术中舆情分析指标体系过于庞大,针对性不强的问题。微博作为网络舆情的主要推动媒介,基于本发明专利技术研究的微博舆情指标体系,将能更加准确的评估社会舆情安全状态。

【技术实现步骤摘要】

本专利技术涉及网络信息挖掘领域,特别是涉及一种微博舆情指标体系的计算方法及装置
技术介绍
微博是一种基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。截至2014年底,微博用户已达2.49亿,日均发帖量超过2亿。微博已经成为社会影响力日益增强的信息媒介,成为民意表达的一个最为方便、快捷、集中、明显和自由的舆论场,成为映射社会舆情的实时晴雨表,成为洞察和引导社会各层面舆情态势的重要窗口。在微博中,网民对当前社会各种现象以及诸多热点问题发表立场和观点,话题涉及政治、经济、军事、娱乐、体育、卫生、科技、个人生活等各个领域,直接、快速的反映了各个层面的社会舆情状况于发展态势。所以,结合微博自身的特点,建立微博中的舆情监测指标体系,来衡量微博媒体中的舆情安全状况,能够直接反映社会舆情状态,及时捕捉到微博中敏感的舆情信息,为管理者实行舆情疏导提供决策支持,将负面的网络舆情影响控制在警戒线以下,具有重大的政治意义和社会文化意义。现有的舆情分析指标体系多针对互联网舆情,由于互联网中传播渠道和交流平台的多样化,如:新闻、评论、BBS以及网络社区、时事论坛、博客、维客、即时通信软件、Email及短信等,指标体系涵盖的面较广,造成了舆情指标体系过于庞大,针对性不强。针对相关技术中舆情分析指标体系过于庞大,针对性不强的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中舆情分析指标体系过于庞大,针对性不强的问题,本专利技术提供了一种微博舆情指标体系的计算方法及装置,用以解决上述技术问题。根据本专利技术的一个方面,本专利技术提供了一种微博舆情指标体系的计算方法,其中,该方法包括:构建微博舆情指标体系;其中,所述微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算所述微博主体的活跃度和影响力;计算所述微博信息的热度和影响力;计算所述微博话题的热度和影响力;基于计算结果得到微博舆情综合指数。优选地,基于以下要素计算所述微博主体的活跃度:博主发表微博的总数量、每天平均发表微博数量、原创微博数量、原创微博比例、转发其他人微博的次数、评论其他人微博的次数;基于微博主体的活跃度和改进的PageRank算法,计算所述微博主体的影响力。优选地,基于以下要素计算所述微博信息的热度:微博信息的重复次数、转发次数、评论次数、回复次数;根据所述微博主体的影响力计算所述微博信息的影响力。优选地,根据所述微博信息的热度计算所述微博话题的热度;根据所述微博主体的影响力计算所述微博话题的影响力。优选地,基于计算结果得到微博舆情综合指数,包括:根据所述微博话题的热度和影响力,计算得到微博舆情综合指数。优选地,计算所述微博主体的活跃度通过以下公式实现:AuthActive(authi)=a*log(TotalNummaxTotalNumi)+b*log(AveNummaxAveNumi)+c*log(OriNummaxOriNumi)+d*log(OriRatiomaxOriRatioi)+e*log(RetraNummaxRetraNumi)+f*log(CommentNummaxCommentNumi)]]>其中,AuthActive(authi)是所述微博主体的活跃度,TotalNummax是所有博主中发表微博数量的最大值,TotalNumi是博主authi发表微博的总数量,AveNummax是所有博主中每天平均发表微博数量的最大值,AveNumi是博主authi的每天平均发表微博数量,OriNummax是所有博主中原创微博数量的最大值,OriNumi是博主authi的原创微博数量,OriRatiomax是所有博主中原创微博比例的最大值,OriRatioi是博主authi的原创微博比例,RetraNummax是所有博主中转发其他人微博的次数的最大值,RetraNumi是博主authi转发其他人微博的次数,CommentNummax是所有博主中评论其他人微博的次数的最大值,CommentNumi是博主authi评论其他人微博的次数,a、b、c、d、e、f是调节参数。优选地,计算所述微博主体的影响力通过以下公式实现:AuthRank(authi)=1-qM+qΣujAuthRank(uj)*AuthActive(uj)L(uj)]]>其中,AuthRank(authi)是所述微博主体的影响力,M是总的博主数量,uj表示关注博主authi的博主,L(uj)是博主uj的关注博主数,q是阻尼系数。优选地,计算所述微博信息的热度通过以下公式实现:DocHot(doci)=a*log(RepeatNummaxRepeatNumi)+b*log(RetraNummaxRetraNumi)+c*log(CommentNummaxCommentNumi)+d*log(ReplyNummaxReplyNumi)]]>其中,DocHot(doci)是所述微博信息的热度,RepeatNummax是指定时间周期中微博信息的重复次数的最高值,RepeatNumi是微博信息doci的重复次数,RetraNummax是指定时间周期中微博信息的转发次数的最高值,RetraNumi是微博信息doci的转发次数,CommentNummax是指定时间周期中微博信息的评论次数的最高值,CommentNumi是微博信息doci的评论次数,ReplyNummax是指定时间周期中微博信息的回复次数的最高值,ReplyNumi是微博信息doci的回复次数,a、b、c、d是调节参数。优选地,计算所述微博信息的影响力通过以下公式实现:其中,DocInf(doci)是所述微博信息的影响力,集合A是发表或转发微博信息doci的博主集合。优选地,计算所述微博话题的热度通过以下公式实现:其中,集合M是构成微博话题topici的微博信息的集合。优选地,计算所述微博话题的影响力通过以下公式实现:其中,集合A是发表或转发微博话题topici的微博信息的博主集合。优选地,计算所述微博舆情综合指数通过以下公式实现:MicroBlog=Σi∈T[α*TopicHot(topici)+β*TopicInf(topici)]]]>其中,集合T是当前时刻的微博话题集合,α、β是调节参数。优选地,所述微博主体的活跃度和影响力按照指定周期更新;所述微博信息的热度和影响力、所述微博话题的热度和影响力、以及所述微博舆情综合指数的计算周期至少为天、周或月。根据本专利技术的另一方面,本专利技术还提供了一种微博舆情指标体系的计算装置,其中,该装置包括:体系构建模块,用于构建微博舆情指标体系;其中,所述微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算模块,用于计算所述微博主体的活跃度和影响力;计算所述微博信息的热度和影响力;计算所述微博话题的热度和影响力;指数计算模块,用于基于计算结果得到微博舆情综合指数。本专利技术有益效果如下:本专利技术构建了微博舆情指标体系,并且基于微博舆情指标体系,可准确获取得到微博舆情综合指数。微博作为网络舆情的主要推动媒介,基于本发本文档来自技高网...
一种微博舆情指标体系的计算方法及装置

【技术保护点】
一种微博舆情指标体系的计算方法,其特征在于,所述方法包括:构建微博舆情指标体系;其中,所述微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算所述微博主体的活跃度和影响力;计算所述微博信息的热度和影响力;计算所述微博话题的热度和影响力;基于计算结果得到微博舆情综合指数。

【技术特征摘要】
1.一种微博舆情指标体系的计算方法,其特征在于,所述方法包括:构建微博舆情指标体系;其中,所述微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算所述微博主体的活跃度和影响力;计算所述微博信息的热度和影响力;计算所述微博话题的热度和影响力;基于计算结果得到微博舆情综合指数。2.如权利要求1所述的方法,其特征在于,基于以下要素计算所述微博主体的活跃度:博主发表微博的总数量、每天平均发表微博数量、原创微博数量、原创微博比例、转发其他人微博的次数、评论其他人微博的次数;基于微博主体的活跃度和改进的PageRank算法,计算所述微博主体的影响力;其中,计算所述微博主体的活跃度通过以下公式实现:AuthActive(authi)=a*log(TotalNummaxTotalNumi)+b*log(AveNummaxAveNumi)+c*log(OriNummaxOriNumi)+d*log(OriRatiomaxOriRatioi)+e*log(RetraNummaxRetraNumi)+f*log(CommentNummaxCommentNumi)]]>其中,AuthActive(authi)是所述微博主体的活跃度,TotalNummax是所有博主中发表微博数量的最大值,TotalNumi是博主authi发表微博的总数量,AveNummax是所有博主中每天平均发表微博数量的最大值,AveNumi是博主authi的每天平均发表微博数量,OriNummax是所有博主中原创微博数量的最大值,OriNumi是博主authi的原创微博数量,OriRatiomax是所有博主中原创微博比例的最大值,OriRatioi是博主authi的原创微博比例,RetraNummax是所有博主中转发其他人微博的次数的最大值,RetraNumi是博主authi转发其他人微博的次数,CommentNummax是所有博主中评论其他人微博的次数的最大值,CommentNumi是博主authi评论其他人微博的次数,a、b、c、d、e、f是调节
\t参数;其中,计算所述微博主体的影响力通过以下公式实现:AuthRank(authi)=1-qM+qΣujAuthRank(uj)*AuthActive(uj)L(uj)]]>其中,AuthRank(authi)是所述微博主体的影响力,M是总的博主数量,uj表示关注博主authi的博主,L(uj)是博主uj的关注博主数,q是阻尼系数。3.如权利要求2所述的方法,其特征在于,基于以下要素计算所述微博信息的热度:微博信息的重复次数、转发次数、评论次数、回复次数;根据所述微博主体的影响力计算所述微博信息的影响力;其中,计算所述微博信息的热度通过...

【专利技术属性】
技术研发人员:贺敏王丽宏周勇林云晓春包秀国刘玮程学旗徐杰刘悦张丹刘克松
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1