【技术实现步骤摘要】
一种针对网络舆情热度的计算与预警系统及方法
[0001]本专利技术公开涉及网络安全
,尤其涉及一种针对网络舆情热度的计算与预警系统及方法。
技术介绍
[0002]网络舆情热度反映的是在某一时间段内,现实社会中所发生的事件在网络上所引起的媒体的报道以及网民关注与讨论程度,是进行网络舆情分析和舆情预警的重要指标之一。
[0003]目前关于网络舆情热度的计算一般有两种方法:
[0004]第一种是基于数据挖掘的分析方法,首先通过信息采集技术从社交媒体或者其它网络平台上采集海量的数据,然后经过数据预处理等技术得到计算机容易处理的形式,最后利用自然语言处理技术,通过文本相似度计算等方法对所得到的数据进行聚类,从而得到关注度最高、影响最大的话题事件,从而计算话题的热度;
[0005]第二种基于内容的舆情热度计算方法,这种计算方法又分为基于媒体、基于用户、以及用户和媒体联合分析的方法,基于媒体角度的舆情热度分析,它首先通过统计某个热点事件在一段时间内在一些媒体平台上的报道数量、报道速度、报道天数、报道频率,然后给这些值分配不同的权重,以此来计算它们的加权和,从而计算该热点事件的热度;基于用户角度的舆情热度分析,首先计算关于某话题所采集的贴子数、每个帖子的浏览数、转发数、评论数、回复数,然后利用这些数据计算某个话题的热度。
[0006]现有网络舆情热度的计算方法存在几个方面的缺点:
[0007](1)目前没有针对的网络舆情热度的计算方法,这导致网络舆情热度的计算准确性较低,用于舆情预警的参 ...
【技术保护点】
【技术特征摘要】
1.一种针对网络舆情热度的计算与预警系统,其特征在于,该针对网络舆情热度的计算与预警系统包括:新闻媒体热度模块,由报道热度单元、报道覆盖度单元和报道权威度单元构成,用于反映网络舆情热度;社交平台热度模块,由发帖热度单元、互动热度单元、账户活跃度单元和发布者影响度单元构成,用于反映网络舆情热度。2.根据权利要求1所述的针对网络舆情热度的计算与预警系统,其特征在于,所述报道热度单元,用于统计一段时间内新闻媒体的所发表的报道数量、新闻媒体发表报道的速率、新闻报道持续的天数、新闻报道的互动热度数据;报道覆盖度单元,统计中央媒体的参与度决定数据;报道权威度单元,统计的重要媒体的参与程度决定数据。3.根据权利要求1所述的针对网络舆情热度的计算与预警系统,其特征在于,所述发帖热度单元,用于统计一段时间内用户所发帖子的数量;互动热度单元,统计用户对帖子的转发、点赞、评论行为产生的影响程度;账户活跃度单元,对当地比较活跃的网络用户的参与度进行统计;发布者影响度单元,统计采集信息中的重点人物的参与度。4.一种实现如权利要求1
‑
3任意一项所述针对网络舆情热度的计算与预警系统的方法,其特征在于,应用于信息数据处理终端,该针对网络舆情热度的计算与预警方法包括以下步骤:步骤一、选取具有一定影响力和传播度的新闻媒体平台以及在当地使用比较广泛的社交网络平台;步骤二、对从网络社交平台获得的数据进行帖子信息统计和用户信息统计,然后利用这些数据来计算网络社交平台的发帖热度、互动热度、账户活跃度、发布者影响度;步骤三、用户的统计信息用来计算账户活跃度和人物影响度;步骤四、社交平台的网络舆情热度等于发帖热度、互动热度、账户活跃度、发布者影响度归一化后的加权和;步骤五、基于新闻媒体统计信息和新闻媒体平台所发报道的统计信息计算新闻媒体平台的网络舆情热度;步骤六、通过社交平台网络舆情热度与新闻媒体网络舆情热度的算数和计算当天的网络舆情热度。5.根据权利要求4所述的针对网络舆情热度的计算与预警方法,其特征在于,在步骤一中,在确定重点新闻媒体平台名单时,依据业务领域范围、现有权威机构排名筛选出前100的新闻媒体平台确定为重要新闻媒体,并不断更新;确定社交平台重点用户名单时,先将业务领域内已知的大V、高影响力用户、权威用户纳入重点名单,后续依据事件得到每次事件发展的高影响力用户、桥梁用户,动态更新进社交平台重要用户名单库;通过采集重要用户名单库的发帖数据和个人数据来建立社交平台重要用户数据库。6.根据权利要求4所述的针对网络舆情热度的计算与预警方法,其特征在于,在步骤二中,互动热度需要通过计算点赞热度、转发热度、评论热度的加权和来得到,具体的计算流程如下:
(1)发帖热度等于统计得到的当天的发帖总量与近期最大的发帖数量的比值,具体公式如下:其中post_heat代表当天的发帖热度,post_num
today
表示当天所发的帖子数量,max(post_num
recent
)表示近期最大的发帖数量;(2)点赞热度、转发热度、评论热度又由统计得到的帖子信息计算,具体计算公式如下:interact_heat=x*(like_heat)+y*(forward_heat)+z*(comment_heat)其中interact_heat表示当天的互动热度,like_heat表示当天的点赞热度,forward_heat表示当天的转发热度,comment_heat表示当天的评论热度,x、y、z是由熵权法得到的权重;重;重;其中(∑
每条帖子
forward_num)
today
表示当天所有帖子的转发累加和,max(∑
每条帖子
like_num)
recent
表示近期所计算得到的帖子的点赞累加和的最大值;(∑
每条帖子
forward_num)
today
表示当天所有帖子的转发累加和,max(∑
每条帖子
forward_num)
recent
表示近期所计算得到的帖子的转发累加和的最大值;(∑
每条帖子
comment_num)
today
表示当天所有帖子的评论累加和,max(∑
每条帖子
comment_num)
recent
表示近期所计算得到的帖子的评论累加和的最大值。7.根据权利要求4所述的针对网络舆情热度的计算与预警方法,其特征在于,在步骤三中,账户活跃度的具体计算公式如下:其中,users__heat表示当天的用户活跃度,(active_users)
today
表示当天参与讨论的活跃用户数,(active_user...
【专利技术属性】
技术研发人员:左媛,刘锟,石珺,李志鹏,廖勇,杨阳朝,
申请(专利权)人:深圳市网联安瑞网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。