一种具有应急事件分析提取功能的舆情监测方法技术

技术编号:36503538 阅读:16 留言:0更新日期:2023-02-01 15:27
本发明专利技术公开了一种具有应急事件分析提取功能的舆情监测方法,涉及舆情监测技术领域,包括以下步骤:(1)、一次数据收集;(2)、关键词提取;(3)、关键字词关联;(4)、二次数据收集;(5)、关键字二次提取;(6)、舆情监测;(7)、舆情分析和(8)、舆情趋势评估。该具有应急事件分析提取功能的舆情监测方法,通过重复执行关键字词关联、二次数据收集、关键字二次提取的三个步骤,能够多次获取网民为所避免屏蔽所采用的相似字、同音字、拼音、中英文等替代词,从而能够将上述类型的替代词储存至关键词库中,进而扩充关键词库,有助于充分捕捉舆情信息,有效提高舆情数据的全面性以及准确性,最终实现应急事件的分析提取。急事件的分析提取。

【技术实现步骤摘要】
一种具有应急事件分析提取功能的舆情监测方法


[0001]本专利技术涉及舆情监测
,具体为一种具有应急事件分析提取功能的舆情监测方法。

技术介绍

[0002]舆情监测是对互联网上公众的言论和观点进行监视和预测的行为。这些言论主要为对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。
[0003]现有的舆情监测方法,在对应急事件进行分析提取时,易出现网民使用各类相似字、同音字、拼音、中英文等替代词逃避舆情捕捉的情况,进而影响舆情分析提取结果,导致舆情监测和分析结果出现偏差,不利于实现对于网民的舆情引导以及针对应急事件的舆情状况作出有效应对,为此,我们提出一种具有应急事件分析提取功能的舆情监测方法。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种具有应急事件分析提取功能的舆情监测方法,解决了上述
技术介绍
中提出的问题。
[0005]为实现以上目的,本专利技术通过以下技术方案予以实现,一种具有应急事件分析提取功能的舆情监测方法,包括以下具体步骤:
[0006](1)、一次数据收集
[0007]在基于大数据的基础上对网络数据进行爬取,然后筛选关于应急事件的舆情数据,再对筛选后的大数据进行数据采集;
[0008](2)、关键词提取
[0009]然后对采集的数据中文本信息进行分词处理,提取得到多个关键词,构建关键词库,将上述分词处理的关键词储存至关键词库中;
[0010](3)、关键字词关联
[0011]通过机器学习的方法获取关键词库中关键词对应大数据文本信息的字以及词组,再对字以及词组进行过滤筛选,去除无关数据,然后基于文本信息中包含的字以及词组,进行关键字词关联,然后对多个具有舆论主题代表性的关键字词进行聚合关联,得到词语合集;
[0012](4)、二次数据收集
[0013]然后在词语集合的基础上,确定包含目标关键词的词语集合,根据词语集合再次对网络数据进行数据采集,设包含有两个或两个以上的词语集合内容数据为数据采集目标;
[0014](5)、关键字二次提取
[0015]然后对二次采集的数据中文本信息进行分词处理,得到多个关键词或屏蔽处理后的替代词,将上述分词处理的关键词或屏蔽处理后的替代词储存至关键词库中,进而扩充关键词库。
[0016]进一步的,所述具有应急事件分析提取功能的舆情监测方法还包括以下具体步骤:
[0017](6)、舆情监测
[0018]根据所预设的执行时间,重复执行步骤(3)至步骤(5),充分扩充关键词库,同时根据关键词库,对含有关键词的网络数据进行舆情实时监测,从而实时对应急事件相关的网络数据进行识别监测。
[0019]进一步的,所述具有应急事件分析提取功能的舆情监测方法还包括以下具体步骤:
[0020](7)、舆情分析
[0021]在实时监测的基础上,对舆情情况进行分类进而将舆情分为正向、负向、中立或其他偏向类的多个倾向,然后进行舆情特征分析对各条网络数据作出倾向性判定,再将网络数据总体的倾向性情况以可视化图表的形式列出,进而根据上述舆情分析结果对网民舆情整体倾向性进行判断分析。
[0022]进一步的,所述具有应急事件分析提取功能的舆情监测方法还包括以下具体步骤:
[0023](8)、舆情趋势评估
[0024]根据舆情发展趋势,以不同舆情倾向性的比例为主,构建以时序关系为基础的舆情走向分析图,进而在舆情走向分析图的基础上,进行舆情趋势判断评估,判断后续的舆情走向,并将当前的舆情状况与历史相似舆情案例进行比对,进而在基于历史相似舆情案例的基础上,根据历史相似舆情案例的实际最佳处理结果进行舆情应急引导。
[0025]进一步的,所述步骤(4)、二次数据收集,所采集的数据为除去步骤(1)一次数据收集、历史循环过程中步骤(4)二次数据收集以外的其他数据,避免对已收集数据进行重复提取,造成算力浪费。
[0026]本专利技术提供了一种具有应急事件分析提取功能的舆情监测方法,具备以下有益效果:
[0027]该具有应急事件分析提取功能的舆情监测方法,首先通过(1)、一次数据收集和(2)、关键词提取的步骤能够初步提取应急事件的关键字,然后能够在此基础上对舆情状况进行初步引导控制,而后通过重复执行(3)关键字词关联、(4)二次数据收集、(5)关键字二次提取的三个步骤,能够多次获取网民为所避免屏蔽所采用的相似字、同音字、拼音、中英文等替代词,从而能够将上述类型的替代词储存至关键词库中,进而扩充关键词库,有助于充分捕捉舆情信息,有效提高舆情数据的全面性以及准确性,实现应急事件的分析提取;
[0028]该具有应急事件分析提取功能的舆情监测方法,通过(6)舆情监测和(7)舆情分析防步骤,能够实时对应急事件相关的网络数据进行识别监测,以及对各条网络数据作出倾向性判定分析,进而有利于根据舆情分析结果对网民舆情整体倾向性进行判断分析,步骤(8)舆情趋势评估还能够根据舆情发展趋势,判断后续的舆情走向,以便于对舆情状况进行分析处理,实时把握舆情导向,并且能够根据历史相似舆情案例的实际最佳处理结果进行舆情应急引导,第一时间对应急事件的负面舆情状况作出应对。
具体实施方式
[0029]下面将结合本专利技术的具体实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0030]一种具有应急事件分析提取功能的舆情监测方法,包括以下具体步骤:
[0031](1)、一次数据收集
[0032]在基于大数据的基础上对网络数据进行爬取,然后筛选关于应急事件的舆情数据,再对筛选后的大数据进行数据采集;
[0033](2)、关键词提取
[0034]然后对采集的数据中文本信息进行分词处理,提取得到多个关键词,构建关键词库,将上述分词处理的关键词储存至关键词库中;
[0035](3)、关键字词关联
[0036]通过机器学习的方法获取关键词库中关键词对应大数据文本信息的字以及词组,再对字以及词组进行过滤筛选,去除无关数据,然后基于文本信息中包含的字以及词组,进行关键字词关联,然后对多个具有舆论主题代表性的关键字词进行聚合关联,得到词语合集;
[0037](4)、二次数据收集
[0038]然后在词语集合的基础上,确定包含目标关键词的词语集合,根据词语集合再次对网络数据进行数据采集,设包含有两个或两个以上的词语集合内容数据为数据采集目标;
[0039](5)、关键字二次提取
[0040]然后对二次采集的数据中文本信息进行分词处理,得到多个关键词或屏蔽处理后的替代词,将上述分词处理的关键词或屏蔽处理后的替代词储存至关键词库中,进而扩充关键词库。
[0041]具有应急事件分析提取功能的舆情监测方法还包括以下具体步骤:
[0042](6)、舆情监测
[0043]根据所预设的执行时间,重本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种具有应急事件分析提取功能的舆情监测方法,其特征在于,包括以下具体步骤:(1)、一次数据收集在基于大数据的基础上对网络数据进行爬取,然后筛选关于应急事件的舆情数据,再对筛选后的大数据进行数据采集;(2)、关键词提取然后对采集的数据中文本信息进行分词处理,提取得到多个关键词,构建关键词库,将上述分词处理的关键词储存至关键词库中;(3)、关键字词关联通过机器学习的方法获取关键词库中关键词对应大数据文本信息的字以及词组,再对字以及词组进行过滤筛选,去除无关数据,然后基于文本信息中包含的字以及词组,进行关键字词关联,然后对多个具有舆论主题代表性的关键字词进行聚合关联,得到词语合集;(4)、二次数据收集然后在词语集合的基础上,确定包含目标关键词的词语集合,根据词语集合再次对网络数据进行数据采集,设包含有两个或两个以上的词语集合内容数据为数据采集目标;(5)、关键字二次提取然后对二次采集的数据中文本信息进行分词处理,得到多个关键词或屏蔽处理后的替代词,将上述分词处理的关键词或屏蔽处理后的替代词储存至关键词库中,进而扩充关键词库。2.根据权利要求1所述的一种具有应急事件分析提取功能的舆情监测方法,其特征在于,所述具有应急事件分析提取功能的舆情监测方法还包括以下具体步骤:(6)、舆情监测根据所预设的执行时间,重复执行步骤(3)至步骤(5),充分扩充关键词库,同时根据关键词库,对含有关键词的网络数据...

【专利技术属性】
技术研发人员:黄建
申请(专利权)人:苏州华必讯信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1