一种针对网络舆情热度的计算与预警系统及方法技术方案

技术编号:30680076 阅读:13 留言:0更新日期:2021-11-06 09:10
本发明专利技术公开是关于一种针对网络舆情热度的计算与预警系统及方法,涉及网络安全技术领域。新闻媒体热度模块由报道热度单元、报道覆盖度单元和报道权威度单元构成,用于反映网络舆情热度;社交平台热度模块由发帖热度单元、互动热度单元、账户活跃度单元和发布者影响度单元构成,用于反映网络舆情热度。解决了传统网络舆情热度计算方法中从全网采集数据时所采集的数据过于宽泛,从而导致信息密度太低的问题。解决了传统网络舆情热度指标计算时,未考虑不同媒体和不同的用户之间的影响力和权威度存在差别的问题。解决传统网络舆情热度计算时,权重定义掺杂人为主观性且无法针对不同的话题进行更新的问题。的话题进行更新的问题。的话题进行更新的问题。

【技术实现步骤摘要】
一种针对网络舆情热度的计算与预警系统及方法


[0001]本专利技术公开涉及网络安全
,尤其涉及一种针对网络舆情热度的计算与预警系统及方法。

技术介绍

[0002]网络舆情热度反映的是在某一时间段内,现实社会中所发生的事件在网络上所引起的媒体的报道以及网民关注与讨论程度,是进行网络舆情分析和舆情预警的重要指标之一。
[0003]目前关于网络舆情热度的计算一般有两种方法:
[0004]第一种是基于数据挖掘的分析方法,首先通过信息采集技术从社交媒体或者其它网络平台上采集海量的数据,然后经过数据预处理等技术得到计算机容易处理的形式,最后利用自然语言处理技术,通过文本相似度计算等方法对所得到的数据进行聚类,从而得到关注度最高、影响最大的话题事件,从而计算话题的热度;
[0005]第二种基于内容的舆情热度计算方法,这种计算方法又分为基于媒体、基于用户、以及用户和媒体联合分析的方法,基于媒体角度的舆情热度分析,它首先通过统计某个热点事件在一段时间内在一些媒体平台上的报道数量、报道速度、报道天数、报道频率,然后给这些值分配不同的权重,以此来计算它们的加权和,从而计算该热点事件的热度;基于用户角度的舆情热度分析,首先计算关于某话题所采集的贴子数、每个帖子的浏览数、转发数、评论数、回复数,然后利用这些数据计算某个话题的热度。
[0006]现有网络舆情热度的计算方法存在几个方面的缺点:
[0007](1)目前没有针对的网络舆情热度的计算方法,这导致网络舆情热度的计算准确性较低,用于舆情预警的参考性较差。具体体现:每个地区具有影响力的媒体和社交平台是不同的,例如中江网主要提供江苏省内重大新闻资讯,在江苏省内具有重大舆情影响力,但是现有的舆情热度计算方法在分析时并没有考虑这一点。
[0008](2)现有基于内容的舆情热度计算方法中,从媒体角度计算时,并没有考虑不同媒体的影响力;从用户角度分析时,没有考虑活跃度较高和影响力较大的用户,这也会降低网络舆情热度计算和预警的准确率。具体体现:人民网会比地方性的媒体对舆情热度产生更大的影响,的活跃用户,也会对舆情产生更大的影响,而现有网络舆情热度计算方法中没有考虑这些。
[0009](3)网络舆情热度是动态变化的,现有的网络舆情热度计算方式确定每个影响因素的权重时,一般采用专家问卷形式或者针对特定话题特定分析的形式,无法保证舆情热度分析预警以及对有潜在危险的热点话题跟踪的时效性。
[0010](4)目前网络舆情热度计算方法在计算各个指标时,所采用的一般为绝对值,这会导致不同类型的网络舆情话题的舆情热度差距很大,无法应用于舆情预警中阈值的设定。

技术实现思路

[0011]为克服相关技术中存在的问题,本专利技术公开实施例提供了一种针对网络舆情热度的计算与预警系统及方法。所述技术方案如下:
[0012]该针对网络舆情热度的计算与预警系统包括:
[0013]新闻媒体热度模块,由报道热度单元,报道覆盖度单元和报道权威度单元构成,用于反映网络舆情热度;
[0014]社交平台热度模块,由发帖热度单元、互动热度单元、账户活跃度单元和发布者影响度单元构成,用于反映网络舆情热度。
[0015]在一个实施例中,所述报道热度单元,统计一段时间内新闻媒体的所发表的报道数量、新闻媒体发表报道的速率、新闻报道持续的天数、新闻报道的互动热度数据;
[0016]报道覆盖度单元,统计中央媒体的参与度决定数据;
[0017]报道权威度单元,统计的重要媒体的参与程度决定数据。
[0018]在一个实施例中,所述发帖热度单元,用于统计一段时间内用户所发帖子的数量;
[0019]互动热度单元,统计用户对帖子的转发、点赞、评论行为产生的影响程度;
[0020]账户活跃度单元,对当地比较活跃的网络用户的参与度进行统计;
[0021]发布者影响度单元,统计采集信息中的重点人物的参与度。
[0022]本专利技术的另一目的在于提供一种实现所述针对网络舆情热度的计算与预警系统的方法,应用于信息数据处理终端,该针对网络舆情热度的计算与预警方法包括以下步骤:
[0023]步骤一、选取具有一定影响力和传播度的新闻媒体平台以及在当地使用比较广泛的社交网络平台;
[0024]步骤二、对从网络社交平台获得的数据进行帖子信息统计和用户信息统计,然后利用这些数据来计算网络社交平台的发帖热度、互动热度、账户活跃度、发布者影响度;
[0025]步骤三、用户的统计信息主要用来计算账户活跃度和人物影响度;
[0026]步骤四、社交平台的网络舆情热度等于发帖热度、互动热度、账户活跃度、发布者影响度归一化后的加权和;
[0027]步骤五、基于新闻媒体统计信息和新闻媒体平台所发报道的统计信息计算新闻媒体平台的网络舆情热度;
[0028]步骤六、通过社交平台网络舆情热度与新闻媒体网络舆情热度的算数和计算当天的网络舆情热度。
[0029]在一个实施例中,在步骤一中,在确定重点新闻媒体平台名单时,依据业务领域范围、现有权威机构排名筛选出前100的新闻媒体平台确定为重要新闻媒体,并不断更新;确定社交平台重点用户名单时,先将业务领域内已知的大V、高影响力用户、权威用户纳入重点名单,后续依据事件得到每次事件发展的高影响力用户、桥梁用户,动态更新进社交平台重要用户名单库;通过采集重要用户名单库的发帖数据和个人数据来建立社交平台重要用户数据库。
[0030]在一个实施例中,在步骤二中,互动热度需要通过计算点赞热度、转发热度、评论热度的加权和来得到,具体的计算流程如下:
[0031](1)发帖热度等于统计得到的当天的发帖总量与近期最大的发帖数量的比值,具体公式如下:
[0032][0033]其中post_heat代表当天的发帖热度,post_num
today
表示当天所发的帖子数量,max(post_num
recent
)表示近期最大的发帖数量的比值;
[0034](2)点赞热度、转发热度、评论热度又由统计得到的帖子信息计算,具体计算公式如下:
[0035]interact_heat=x*(like_heat)+y*(forward_heat)+z*(comment_heat)
[0036]其中interact_heat表示当天的互动热度,like_heat表示当天的点赞热度,forward_heat表示当天的转发热度,comment_heat表示当天的评论热度,x、y、z是由熵权法得到的权重;
[0037][0038][0039][0040]其中(∑
每条帖子
forwar_dnum)
tod
表示当天所有帖子的转发累加和,max(∑
每条帖子
like_num)
recent
表示近期所计算得到的帖子的点赞累加和的最大值;(∑
每条帖子
forward本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对网络舆情热度的计算与预警系统,其特征在于,该针对网络舆情热度的计算与预警系统包括:新闻媒体热度模块,由报道热度单元、报道覆盖度单元和报道权威度单元构成,用于反映网络舆情热度;社交平台热度模块,由发帖热度单元、互动热度单元、账户活跃度单元和发布者影响度单元构成,用于反映网络舆情热度。2.根据权利要求1所述的针对网络舆情热度的计算与预警系统,其特征在于,所述报道热度单元,用于统计一段时间内新闻媒体的所发表的报道数量、新闻媒体发表报道的速率、新闻报道持续的天数、新闻报道的互动热度数据;报道覆盖度单元,统计中央媒体的参与度决定数据;报道权威度单元,统计的重要媒体的参与程度决定数据。3.根据权利要求1所述的针对网络舆情热度的计算与预警系统,其特征在于,所述发帖热度单元,用于统计一段时间内用户所发帖子的数量;互动热度单元,统计用户对帖子的转发、点赞、评论行为产生的影响程度;账户活跃度单元,对当地比较活跃的网络用户的参与度进行统计;发布者影响度单元,统计采集信息中的重点人物的参与度。4.一种实现如权利要求1

3任意一项所述针对网络舆情热度的计算与预警系统的方法,其特征在于,应用于信息数据处理终端,该针对网络舆情热度的计算与预警方法包括以下步骤:步骤一、选取具有一定影响力和传播度的新闻媒体平台以及在当地使用比较广泛的社交网络平台;步骤二、对从网络社交平台获得的数据进行帖子信息统计和用户信息统计,然后利用这些数据来计算网络社交平台的发帖热度、互动热度、账户活跃度、发布者影响度;步骤三、用户的统计信息用来计算账户活跃度和人物影响度;步骤四、社交平台的网络舆情热度等于发帖热度、互动热度、账户活跃度、发布者影响度归一化后的加权和;步骤五、基于新闻媒体统计信息和新闻媒体平台所发报道的统计信息计算新闻媒体平台的网络舆情热度;步骤六、通过社交平台网络舆情热度与新闻媒体网络舆情热度的算数和计算当天的网络舆情热度。5.根据权利要求4所述的针对网络舆情热度的计算与预警方法,其特征在于,在步骤一中,在确定重点新闻媒体平台名单时,依据业务领域范围、现有权威机构排名筛选出前100的新闻媒体平台确定为重要新闻媒体,并不断更新;确定社交平台重点用户名单时,先将业务领域内已知的大V、高影响力用户、权威用户纳入重点名单,后续依据事件得到每次事件发展的高影响力用户、桥梁用户,动态更新进社交平台重要用户名单库;通过采集重要用户名单库的发帖数据和个人数据来建立社交平台重要用户数据库。6.根据权利要求4所述的针对网络舆情热度的计算与预警方法,其特征在于,在步骤二中,互动热度需要通过计算点赞热度、转发热度、评论热度的加权和来得到,具体的计算流程如下:
(1)发帖热度等于统计得到的当天的发帖总量与近期最大的发帖数量的比值,具体公式如下:其中post_heat代表当天的发帖热度,post_num
today
表示当天所发的帖子数量,max(post_num
recent
)表示近期最大的发帖数量;(2)点赞热度、转发热度、评论热度又由统计得到的帖子信息计算,具体计算公式如下:interact_heat=x*(like_heat)+y*(forward_heat)+z*(comment_heat)其中interact_heat表示当天的互动热度,like_heat表示当天的点赞热度,forward_heat表示当天的转发热度,comment_heat表示当天的评论热度,x、y、z是由熵权法得到的权重;重;重;其中(∑
每条帖子
forward_num)
today
表示当天所有帖子的转发累加和,max(∑
每条帖子
like_num)
recent
表示近期所计算得到的帖子的点赞累加和的最大值;(∑
每条帖子
forward_num)
today
表示当天所有帖子的转发累加和,max(∑
每条帖子
forward_num)
recent
表示近期所计算得到的帖子的转发累加和的最大值;(∑
每条帖子
comment_num)
today
表示当天所有帖子的评论累加和,max(∑
每条帖子
comment_num)
recent
表示近期所计算得到的帖子的评论累加和的最大值。7.根据权利要求4所述的针对网络舆情热度的计算与预警方法,其特征在于,在步骤三中,账户活跃度的具体计算公式如下:其中,users__heat表示当天的用户活跃度,(active_users)
today
表示当天参与讨论的活跃用户数,(active_user...

【专利技术属性】
技术研发人员:左媛刘锟石珺李志鹏廖勇杨阳朝
申请(专利权)人:深圳市网联安瑞网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1