一种融入关联分析和风暴抑制机制的网络舆情预警方法技术

技术编号:37262815 阅读:14 留言:0更新日期:2023-04-20 23:36
本发明专利技术提供一种融入关联分析和风暴抑制机制的网络舆情预警方法,包括:网络舆情分级预警模块对网络舆情话题进行分级处理,并形成舆情监测库;再分析预警模块对舆情监测库中每个话题进行再分析,根据再分析结果判断每个话题是否产生正式预警,形成预警库;预警风暴抑制模块对舆情监测库中话题和预警库中话题进行重复性及相关性分析,并合并相关或者重复的话题;关联性分析预警模块分析预警原因与话题主题关键词间的关联性,并根据话题主题关键词K频繁项集对预警库中话题做处理;使用者反馈修正模块利用使用者的反馈信息,自动化更新算法模型。本发明专利技术能够解决现有舆情预警方法预警规则单一、准确率低、效率低,容易产生舆情预警风暴的问题。风暴的问题。风暴的问题。

【技术实现步骤摘要】
一种融入关联分析和风暴抑制机制的网络舆情预警方法


[0001]本专利技术涉及互联网中网络舆情预警
,具体而言,涉及一种融入关联分析和风暴抑制机制的网络舆情预警方法。

技术介绍

[0002][0003]现有的网络舆情预警技术所存在的问题:(1)现有的网络舆情预警方法大多根据网络舆情中话题的热度值、文本内容的敏感度、话题榜单变化情况设置单一阈值预警规则进行网络舆情预警,忽略了网络舆情实际传播情况的复杂性,导致网络舆情预警方法的准确率较低。
[0004](2)现有舆情预警方法缺乏对历史预警数据的相关性和重复性分析,容易对相同的或者相关联的事件在很短的时间内多次预警,产生舆情预警风暴,导致系统的使用者很难从大量的预警信息中获取重要网络舆情预警信息,导致网络舆情预警方法具有较低的计算效率。
[0005](3)现有舆情预警方法缺少对网络舆情预警和网络舆情主题词之间关联关系的挖掘。

技术实现思路

[0006]本专利技术旨在提供一种融入关联分析和风暴抑制机制的网络舆情预警方法,以解决上述现有的网络舆情预警技术所存在的问题。
[0007]本专利技术提供的一种融入关联分析和风暴抑制机制的网络舆情预警方法,包括如下步骤:S1,网络舆情分级预警模块对网络舆情预警系统采集的网络舆情话题进行分级处理,并根据分析处理结果形成舆情监测库;S2,再分析预警模块对舆情监测库中每个话题进行再分析,根据再分析结果判断每个话题是否产生正式预警,根据产生正式预警的话题形成预警库;S3,预警风暴抑制模块对舆情监测库中话题和预警库中话题进行重复性以及相关性分析,并合并相关或者重复的话题;S4,关联性分析预警模块分析预警原因与话题主题关键词之间的关联性,并根据话题主题关键词K频繁项集对预警库中话题做处理,进一步挖掘预警库中可能会产生真实预警的话题;S5,使用者反馈修正模块利用使用者的反馈信息,自动化更新算法模型的参数和设定的阈值。
[0008]进一步的,步骤S1包括如下子步骤:S11,基于敏感度的分级预警:首先判断每个网络舆情话题中包含的敏感关键词的次数是否大于预先设定的敏感关键词的次数阈值,如果话题中包含的敏感关键词的次数大
于所述次数阈值,说明该话题是需要重点关注的话题,直接产生一次预警;S12,基于网络舆情话题热度的分级预警:根据热度值大小将每个网络舆情话题划分为产生一次预警、持续监测和不预警三个等级:S121,对于不包含敏感关键词的网络舆情话题,根据贴子数、转发数和评论数计算话题热度值;S122,判断计算出的热度值是否大于设定的较大阈值y1,若大于,则说明该话题目前传播较为广泛、影响力较大,需要直接产生一次预警,并反馈预警原因为舆情已具有较大影响力;S123,对于计算出的热度值小于设定的较大阈值y1的话题,判断热度值是否小于较低阈值y2,将热度值大于较低阈值y2的话题加入舆情监测库进一步分析,对于热度值小于较低阈值y2的话题不进行预警;其中,y1和y2的大小根据实际的需求确定,不同的应用场景设定不同大小的阈值。
[0009]进一步的,步骤S121中,话题热度值计算公式为:进一步的,步骤S121中,话题热度值计算公式为:其中,指每个话题中第j个帖子的热度值,指第j个帖子的转发数,指第j个帖子的评论数,b为计算话题热度值时评论数的权重;指第i个话题的热度值,等于所有帖子热度值的算术和,n为每个话题中包含帖子数。
[0010]进一步的,步骤S2包括如下子步骤:S21,热度值的平均变化率计算、基于循环神经网络模型GRU算法的热度值预测:S211,计算话题热度值在一个时间窗口内的平均变化率:首先,利用滑动平均算法将话题在一段时间内的热度值进行平滑处理;然后,计算该话题的热度值在该时间窗口内的平均变化率,并利用循环神经网络模型GRU算法预测下一个时间窗口内各个时刻的预测热度值;S22,基于热度值的平均变化率和预测热度值的网络舆情再分析预警:判断某一个时间段内每个话题热度值的平均变化率是否大于设定阈值y3,如果某个话题热度值的平均变化率大于设定阈值y3,说明该话题在这段时间内具有较大的传播势能,需要产生一次预警,并反馈预警原因为话题正在急剧扩散;判断预测热度值是否大于较大阈值y1,若是,计算热度值大于较大阈值y1的时刻与当前时刻的时间差,当时间差小于设定阈值时,产生一次正式预警,并将产生正式预警的话题加入预警库,否则继续监测该话题,并移动时间窗口持续预测,直至预测热度值在整个时间窗口内都小于较低阈值y2时,停止监测。
[0011]进一步的,步骤S211中,滑动平均算法计算公式如下:其中,为利用滑动平均算法计算得到的n时刻该话题的热度值,表示
i时刻的权重,表示该话题在i时刻原本的热度值,t表示滑动时间窗口的大小。
[0012]进一步的,步骤S211中,热度值的平均变化率的计算公式为:其中,表示该话题热度值在n时刻到m时刻的平均变化率,表示经过滑动平均算法后n时刻的热度值,表示经过滑动平均算法后m时刻的热度值。
[0013]进一步的,步骤S3包括如下子步骤:S31,舆情监测库中话题的合并:利用每个话题的主题关键词,计算舆情监测库中话题之间的相似度,根据相似度的大小判断话题之间是否具有相关性,如果相似度较高,则将话题合并,并将它们的热度值相加,返回热度分级预警模块,重新进行预警等级划分;S32,舆情监测库与预警库中话题的合并:利用相似度算法计算舆情监测库中话题与t天内预警库中话题的相似度,如果两个话题之间具有较高的相似度,说明该话题已经产生过预警,不需要再次产生预警,将该话题移入预警库并和相应话题合并。
[0014]进一步的,步骤3中,两个话题的相似度计算公式为:其中,sim为两个话题之间的相似度,,分别表示话题a和话题b中主题关键词的映射向量,表示计算两个话题映射向量的余弦相似度。
[0015]进一步的,步骤S4包括如下子步骤:S41,预警原因与话题主题关键词之间的关联性分析:利用关联性分析Apriori算法,分析预警库中每个预警原因与话题主题关键词之间的关联性,得到满足用户置信度的关键词K频繁项集;其中,K频繁项集为每个预警原因对应的同时出现频率最高的K个关键词列表;S42,关联性分析预警:计算由预警库产生的K频繁项集在舆情监测库中每个话题上的映射向量,根据映射向量的有效长度判断是否预警;即,判断K频繁项集中每个关键词组合是否在该话题中出现,若第i个组合在第一个话题中出现,则该话题的映射向量的第i维为1,否则为0,如果向量的有效长度大于设定的阈值L,则说明该话题有很大的概率会按照已经预警信息的舆情话题的传播趋势扩展,产生一次基于该预警原因的预警,对于不满足条件的的监测预警话题,直接移出舆情监测库。
[0016]进一步的,所述关联性分析预警模块包括关联性分析抑制模块和舆情预警模块,步骤S5包括如下子步骤:S51,收集使用者反馈的错误预警信息和重复预警信息,对重复预警信息重新计算该话题与已预警话题之间的相似度,选择相似度最高的已预警话题与之合并,并根据使用者反馈的重复预警信息数量动态调整本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融入关联分析和风暴抑制机制的网络舆情预警方法,其特征在于,包括如下步骤:S1,网络舆情分级预警模块对网络舆情预警系统采集的网络舆情话题进行分级处理,并根据分析处理结果形成舆情监测库;S2,再分析预警模块对舆情监测库中每个话题进行再分析,根据再分析结果判断每个话题是否产生正式预警,根据产生正式预警的话题形成预警库;S3,预警风暴抑制模块对舆情监测库中话题和预警库中话题进行重复性以及相关性分析,并合并相关或者重复的话题;S4,关联性分析预警模块分析预警原因与话题主题关键词之间的关联性,并根据话题主题关键词K频繁项集对预警库中话题做处理,进一步挖掘预警库中可能会产生真实预警的话题;S5,使用者反馈修正模块利用使用者的反馈信息,自动化更新算法模型的参数和设定的阈值。2.根据权利要求1所述的融入关联分析和风暴抑制机制的网络舆情预警方法,其特征在于,步骤S1包括如下子步骤:S11,基于敏感度的分级预警:首先判断每个网络舆情话题中包含的敏感关键词的次数是否大于预先设定的敏感关键词的次数阈值,如果话题中包含的敏感关键词的次数大于所述次数阈值,说明该话题是需要重点关注的话题,直接产生一次预警;S12,基于网络舆情话题热度的分级预警:根据热度值大小将每个网络舆情话题划分为产生一次预警、持续监测和不预警三个等级:S121,对于不包含敏感关键词的网络舆情话题,根据贴子数、转发数和评论数计算话题热度值;S122,判断计算出的热度值是否大于设定的较大阈值y1,若大于,则说明该话题目前传播较为广泛、影响力较大,需要直接产生一次预警,并反馈预警原因为舆情已具有较大影响力;S123,对于计算出的热度值小于设定的较大阈值y1的话题,判断热度值是否小于较低阈值y2,将热度值大于较低阈值y2的话题加入舆情监测库进一步分析,对于热度值小于较低阈值y2的话题不进行预警;其中,y1和y2的大小根据实际的需求确定,不同的应用场景设定不同大小的阈值。3.根据权利要求2所述的融入关联分析和风暴抑制机制的网络舆情预警方法,其特征在于,步骤S121中,话题热度值计算公式为:在于,步骤S121中,话题热度值计算公式为:其中,指每个话题中第j个帖子的热度值,指第j个帖子的转发数,指第j个帖子的评论数,b为计算话题热度值时评论数的权重;指
第i个话题的热度值,等于所有帖子热度值的算术和,n为每个话题中包含帖子数。4.根据权利要求3所述的融入关联分析和风暴抑制机制的网络舆情预警方法,其特征在于,步骤S2包括如下子步骤:S21,热度值的平均变化率计算、基于循环神经网络模型GRU算法的热度值预测:S211,计算话题热度值在一个时间窗口内的平均变化率:首先,利用滑动平均算法将话题在一段时间内的热度值进行平滑处理;然后,计算该话题的热度值在该时间窗口内的平均变化率,并利用循环神经网络模型GRU算法预测下一个时间窗口内各个时刻的预测热度值;S22,基于热度值的平均变化率和预测热度值的网络舆情再分析预警:判断某一个时间段内每个话题热度值的平均变化率是否大于设定阈值y3,如果某个话题热度值的平均变化率大于设定阈值y3,说明该话题在这段时间内具有较大的传播势能,需要产生一次预警,并反馈预警原因为话题正在急剧扩散;判断预测热度值是否大于较大阈值y1,若是,计算热度值大于较大阈值y1的时刻与当前时刻的时间差,当时间差小于设定阈值时,产生一次正式预警,并将产生正式预警的话题加入预警库,否则继续监测该话题,并移动时间窗口持续预测,直至预测热度值在整个时间窗口内都小于较低...

【专利技术属性】
技术研发人员:曾曦刘锟王效武王海兮罗殊彦吴喆熹
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1