当前位置: 首页 > 专利查询>张燕专利>正文

一种基于人工智能的网络舆情实时监测系统及方法技术方案

技术编号:35858008 阅读:14 留言:0更新日期:2022-12-07 10:46
本发明专利技术公开了一种基于人工智能的网络舆情实时监测系统及方法,涉及舆情监测技术领域,包括交互前端、管理后台、数据收集模块、热度分析模块、情绪分析模块、争端分析模块;使用爬虫技术爬取网络平台内容,根据用于提出的关键词组,计算出当前网络舆情的热度;并使用深度学习技术实时监测网络舆情的热度、情绪正负面以及出现争端的激烈程度,解决了实时监测网络阈值热度、情绪以及出现争端问题。情绪以及出现争端问题。情绪以及出现争端问题。

【技术实现步骤摘要】
一种基于人工智能的网络舆情实时监测系统及方法


[0001]本专利技术属于舆情监测领域,涉及Web和深度学习技术,具体是一种基于人工智能的网络舆情实时监测系统及方法。

技术介绍

[0002]随着互联网时代的带来,网民的数量爆发式增长,由之带来的便是网民们可以在网络中自由发表自己的意见。针对某些新闻、舆论事件,社会舆情渐渐向着网络舆情转变。网络舆情规模也由此迅速扩大,由网络舆情带来的社会影响也变得日益不能小觑。而由于网民素质的参差不齐,对于网络舆情的实时监测也愈发重要。
[0003]现有的网络舆情实时监测技术往往存在以下问题:
[0004]1、未综合考虑各个平台的不同权威性,从而影响网络舆情的热度以及情绪分析的准确性;
[0005]2、仅通过分析网络舆情的正负面评论数量评估网络舆情,未考虑到正负面评论数相近可能是用户发生争端的情况,而争端甚至辱骂往往比负面舆论更严重;
[0006]为此,提出一种基于人工智能的网络舆情实时监测系统及方法。

技术实现思路

[0007]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种基于人工智能的网络舆情实时监测系统及方法,该一种基于人工智能的网络舆情实时监测系统及方法使用爬虫技术爬取网络平台内容,根据用于提出的关键词组,计算出当前网络舆情的热度;并使用深度学习技术实时监测网络舆情的热度、情绪正负面以及出现争端的激烈程度,解决了实时监测网络阈值热度、情绪以及出现争端问题。
[0008]为实现上述目的,根据本专利技术的第一方面的实施例提出一种基于人工智能的网络舆情实时监测系统,包括交互前端、管理后台、数据收集模块、热度分析模块、情绪分析模块、争端分析模块;其中,各个模块之间均可通信和/或电气连接;
[0009]所述交互前端主要用于为用户提供数据交互的功能;用户通过所述交互前端提供所需查询网络舆情的关键词组以及需要查询的网络平台名称集合;
[0010]所述交互前端将用户提供的关键词组以及网络平台集合发送至管理后台;所述管理后台将关键词组以及网络平台集合发送至数据收集模块;
[0011]所述数据收集模块主要用于收集实时网络数据;所述数据收集模块根据用于提供的网络平台集合,爬取各个网络集合中实时发布的内容,并根据关键词组获取爬取内容中符合网络舆情的内容;
[0012]将各个平台符合网络舆情的内容集合数量|Cns|及总内容数量|Cn|发送至热度分析模块;
[0013]将各个平台符合网络舆情的内容集合Cns发送至情绪分析模块、争端分析模块;
[0014]所述热度分析模块主要用于分析所需监测的关键词组在网络中的热度;所述分析
热度包括以下步骤:
[0015]步骤S1:计算网络平台n中,符合网络舆情的内容数量占总内容数量的比值Qn,计算公式为:
[0016]步骤S2:计算总的网络舆情数值Q,计算公式为Q=∑
n∈N
α
n
Qn,其中α
n
为预设的各个平台的比例系数,且∑
n∈N
α
n
=1;
[0017]步骤S3:根据预设的网络舆情热度数值阈值Q1、Q2、Q3,将Q<Q1时网络舆情标记为冷淡、将Q1≤Q<Q2时网络舆情热度标记为微热、将Q2≤Q<Q3时网络舆情热度标记为中热,将Q≥Q3时网络舆情热度标记为火热;并将网络舆情热度实时发送至管理后台;其中Q1<Q2<Q3;
[0018]所述情绪分析模块主要用于分析网络舆情的正负面;所述情绪分析模块接收来自数据收集模块发送的各个平台符合网络舆情的内容集合Cns;使用网页技术截取内容集合Cns中的内容集合Rn;
[0019]所述情绪分析模块分析内容正负面包括以下步骤:
[0020]步骤P1:收集网络平台中带有情绪标签的评论集合L;所述情绪标签包括正面、负面以及中性;
[0021]步骤P2:将所述评论集合中的每个评论使用分词工具分为若干词;
[0022]步骤P3:收集网络中常用的语料库,对语料库进行分词,并对分好的词库使用word

vec工具,将每个词转化为词向量;
[0023]步骤P4:对评论集合L中的评论使用分词工具进行分词,根据步骤S3所转化的词向量,将分词后的评论转化为词向量集合;
[0024]步骤P5:将步骤P4获得的词向量集合作为输入,情绪正负面作为输出,输入至神经网络中进行训练,获得神经网络模型;在具体的实施例中,所述神经网络可以为Rnn、LSTM;
[0025]步骤P6:将分析内容集合Rn中的每条内容进行分词以及使用word

vec转化为词向量集合,将转化后的词向量集合作为输入,输入步骤P5获得的神经网络中,获得每条内容的正负面预测值,并将正面预测数量标记为Pn,将负面预测数量标记为Fn;将中性预测数量标记为Zn;
[0026]步骤P7:计算网络舆情情绪值其中βn为预设的各个平台的比例系数,用以表达平台的权威性;且∑
n∈N
β
n
=1;
[0027]所述网络舆情情绪值E>0时,代表网络舆情情绪为正面;E值越大表示网络舆情越积极;所述网络舆情情绪值E<0时,代表网络舆情情绪为负面;E值越小表示网络舆情越消极;将网络舆情情绪值E发送至管理后台;
[0028]所述争端分析模块主要用于分析针对所监测舆情触发网络争端的激烈程度。
[0029]本专利技术的第二方面的实施例提出一种基于人工智能的网络舆情实时监测系统,交互前端用于为用户提供可视化界面,以及用户在可视化界面提供所需监测的关键词组和需监测的网络平台集合;并将用户提供的关键词组和网络平台集合发送至管理后台;
[0030]管理后台用于协调各个模块的工作;将交互前端发送的关键词组和网络平台集合发送至数据收集模块;
[0031]数据收集模块用于实时收集所述网络平台集合中各平台的新发布内容;在新发布内容中搜索关键词组,并将包含关键词组的内容作为符合舆情内容发送至情绪分析模块以及争端分析模块;将总数量及符合网络舆情的内容数量发送至热度分析模块;
[0032]热度分析模块用于分析各个平台的网络舆情热度以及总的网络舆情热度;并将热度数据发送至管理后台,用于实时为用户可视化展示网络舆情热度;
[0033]情绪分析模块用于使用深度学习技术分析各个网络平台中,关于需监测网络舆情的内容的情绪正负面;并将情绪正负面结果发送至管理后台,用于实时为用户可视化展示网络舆情正负面;
[0034]争端分析模块用于使用深度学习技术分析各个网络平台中,关于需监测网络舆情的内容是否出现争端的情况,并计算出现争端的激烈程度;并将激烈程度发送至管理后台,用于实时为用户可视化展示争端的激烈程度。
[0035]与现有技术相比,本专利技术的有益效果是:...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的网络舆情实时监测系统,其特征在于,包括:交互前端、管理后台、数据收集模块、热度分析模块、情绪分析模块以及争端分析模块;其中,各个模块之间均可通信和/或电气连接;所述交互前端用于为用户提供数据交互的功能;所述交互前端将用户提供的关键词组以及网络平台集合发送至管理后台;所述管理后台将关键词组以及网络平台集合发送至数据收集模块;所述数据收集模块用于收集实时网络数据;实时收集所述网络平台集合中各平台的新发布内容;在新发布内容中搜索关键词组,并将包含关键词组的内容作为符合舆情内容发送至情绪分析模块以及争端分析模块;将总数量及符合网络舆情的内容数量发送至热度分析模块;所述热度分析模块用于分析所需监测的关键词组在网络中的热度;计算网络舆情热度;所述情绪分析模块用于分析网络舆情的正负面;所述争端分析模块用于分析针对所监测舆情触发网络争端的强烈程度;所述争端分析模块接收来自数据收集模块发送的各个平台符合网络舆情的内容集合Rn。2.根据权利要求1所述的一种基于人工智能的网络舆情实时监测系统,其特征在于,所述数据收集模块收集网络数据包括以下步骤:步骤S1:所述数据收集模块接收到交互前端发送的关键词组以及网络平台集合;步骤S2:在所述网络平台集合中的网络平台中使用爬虫技术爬取若干分钟内发布的所有内容;将网络平台集合标记为N,集合中的网络平台标记为n;将从网络平台n爬取的内容集合标记为Cn;所述若干分钟具体时长由实际经验确定;步骤S3:在内容集合Cn中,将发布内容按时间排序,将每篇内容标记为Cni;使用关键词组在Cni中搜索,若搜索到的关键词数量占关键词组中关键词总量的比重超过一定比例,则将Cni标记为符合网络舆情;将符合网络舆情的内容集合标记为Cns;所述一定比例由实际经验确定;将各个平台符合网络舆情的内容集合数量|Cns|及总内容数量|Cn|发送至热度分析模块;将各个平台符合网络舆情的内容集合Cns发送至情绪分析模块、争端分析模块。3.根据权利要求2所述的一种基于人工智能的网络舆情实时监测系统,其特征在于,所述热度分析模块分析热度包括以下步骤:步骤S1:接收来自数据收集模块的各个平台符合网络舆情内容集合数量|Cns|及总内容数量|Cn|;步骤S2:计算网络平台n中,符合网络舆情的内容数量占总内容数量的比值Qn,计算公式为步骤S3:计算总的网络舆情数值Q,计算公式为Q=∑
n∈N
α
n
Qn,其中α
n
为预设的各个平台的比例系数,用以表达平台的权威性;且∑
n∈N
α
n
=1;步骤S4:根据预设的网络舆情热度数值阈值Q1、Q2、Q3,将Q<Q1时网络舆情标记为冷淡、将Q1≤Q<Q2时网络舆情热度标记为微热、将Q2≤Q<Q3时网络舆情热度标记为中热,将Q≥Q3
时网络舆情热度标记为火热;并将网络舆情热度实时发送至管理后台;其中Q1<Q2<Q3。4.根据权利要求2所述的一种基于人工智能的网络舆情实时监测系统,其特征在于,所述符合网络舆情的内容集合Cns中内容为新闻、文章类型;使用网页技术截取新闻及文章的正文作为分析内容集合;将分析内容集合标记为Wn;所述符合网络舆情的内容集合Cns中内容为用户讨论的帖子;使用网页技术截取用户发布的帖子以及其他用户的跟帖以及评论作为分析内容集合;将分析内容...

【专利技术属性】
技术研发人员:张燕李林白瑞芳
申请(专利权)人:张燕
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1