一种舆情数据评估分析系统及方法技术方案

技术编号:39509019 阅读:7 留言:0更新日期:2023-11-25 18:44
本发明专利技术公开了一种舆情数据评估分析系统及其方法,话题数据采集预处理

【技术实现步骤摘要】
一种舆情数据评估分析系统及方法


[0001]本专利技术涉及数据处理的
,尤其涉及一种舆情数据评估分析系统及方法


技术介绍

[0002]随着互联网发展的影响力日益增大,网络舆论热点已成为各方关注的焦点,网络舆论覆盖面和来源渠道往往十分广阔,涉及到各个领域和各个层面;网络舆论多样化

个性化

差异性和震撼性特点更加明显,更容易引起舆论热点的发酵,其舆情传播的速度更快,传播的方式更加多式多样,舆情变化更加快捷

复杂

[0003]但是随着舆情发酵,企业很难对舆情数据进行一个准确的评估分析,从而无法及时把握热点事件的发展过程,使得对网络突发的公共事件的应对效果较差


技术实现思路

[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例

在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分

说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围

[0005]鉴于上述现有技术中存在的问题,提出了本专利技术

[0006]为解决上述技术问题,本专利技术提供如下技术方案:一种舆情数据评估分析方法,该方法包括以下步骤:
S1:
针对网络热点词进行全网搜索,通过爬虫获取相关数据,获取的数据使用
jieba
进行分析得到分词列表,将处理后的分词列表按时间段进行聚类;
S2
:对聚类后的热门话题进行针对性分析,并按照影响力比较靠前的用户或媒体

按地域进行分类汇总

按话题微博内容进行情感分析,并可按照日期进行趋势分析;
S3
:对于聚类后的数据进行钻取分析,展示板块相关微博清单;
S4
:对于微博清单进行转发分析,可展示原创微博的多层转发路径关系图,统计转发量靠前的用户或者媒体,并可按转发层级进行统计;
S5
:按微博转发时间趋势,按时间展示最近三天微博涉及所有转发量,同时可分析出传播路径中的关键用户及关键路径,然后直观展示近三天微博热度走势,显示热度指数峰值及热度指数均值;
S6
:对于原创微博,和相关转发进行用户分析,可按地域观查看微博分布情况,按性别

年龄

发文设备

用户类别进行不同维度的聚类汇总

[0007]作为本专利技术所述一种舆情数据评估分析方法的一种优选方案,其中:该方法还包括:对话题数据的内容分析,基于相关微博内容形成热门词云图,对微博及转发微博中所有正向负向关键词对比进行情感分析,点击关键词,列出所有涉及关键词的原创微博及转发微博清单

[0008]作为本专利技术所述一种舆情数据评估分析方法的一种优选方案,其中:基于对话题数据的内容分析后,所列出的原创微博和所有转发微博,分析微博转发及热点情况,计算出
微博引爆点,对于引爆点可进行详细数据查看,包括引爆点的关键用户

转发内容

二次转发量

转发时间

转发用户排行信息

[0009]作为本专利技术所述一种舆情数据评估分析方法的一种优选方案,其中:所述引爆点数值的计算方法具体为:
a、
确定原创微博和转发微博的强调词在不同段落中出现的词频
Pf

b、
确定原创微博和转发微博的强调词在不同文章中出现的词频
Df

c、
根据公式确定引爆点权重数值
S,
其中计算公式为:
S=Pf
(当)
*Df
(当)
/Pf
(总);其中,
Pf
(当)为当日原创微博和转发微博强调词在不同段落中出现的词频,
Pf
(总)为调查周期内的原创微博和转发微博强调词在不同段落中出现的词频,这里的调查周期为3‑5天,
Df
(当)为当日原创微博和转发微博强调词在不同文章中出现的词频

[0010]作为本专利技术所述一种舆情数据评估分析方法的一种优选方案,其中:所述
S1
过程中采用聚类方法为
K

means
算法聚类,聚类结束后,保留十条最热门的话题内容,并展示话题相关数据总览

[0011]作为本专利技术所述一种舆情数据评估分析方法的一种优选方案,其中:所述
S3
过程中,展示板块的相关微博清单是基于单条微博的热度分析

热度走势及相关热门词云图所列举的

[0012]作为本专利技术所述一种舆情数据评估分析方法的一种优选方案,其中:所述
S5
过程中,对关键用户可进行详细查看,包括用户昵称

粉丝数量

转发话题微博的时间

转发数量

转发内容

[0013]一种舆情数据评估分析系统,该系统包括:话题数据采集预处理模块

话题数据分析模块

话题数据可视化展示模块

传播路径分析统计模块

话题数据热度分析模块

话题数据参与者分析模块;其中,话题数据采集预处理模块,用于针对网络热点词进行全网搜索,通过爬虫获取相关数据,获取的数据使用
jieba
进行分析得到分词列表,将处理后的分词列表按时间段进行聚类;话题数据分析模块用于对聚类后的热门话题进行针对性分析,并按照影响力比较靠前的用户或媒体

按地域进行分类汇总

按话题微博内容进行情感分析,并可按照日期进行趋势分析;话题数据可视化展示模块用于对于整体舆情预警概况数据进行钻取分析,展示板块相关微博清单;传播路径分析统计模块用于对于微博进行转发分析,可展示原创微博的多层转发路径关系图,统计转发量靠前的用户或者媒体,并可按转发层级进行统计;话题数据热度分析模块用于按微博转发时间趋势,按时间展示最近三天微博涉及所有转发量,同时可分析出传播路径中的关键用户及关键路径,然后直观展示近三天微博热度走势,显示热度指数峰值及热度指数均值;话题数据参与者分析模块用于对于原创微博,和相关转发进行用户分析,可按地域观查看微博分布情况,按性别

年龄

发文设备

用户类别进行不同维度的聚类汇总

[0014]作为本专利技术所述一种舆情数据评估分析系统的一种优选方案,其中:该系统还包
括:话题数据的内容分析模块,该模块基于相关微博内容形成热门词云图,对微博及转发微博中所有正向负向关键本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种舆情数据评估分析方法,其特征在于,该方法包括以下步骤:
S1
:针对网络热点词进行全网搜索,通过爬虫获取相关数据,获取的数据使用
jieba
进行分析得到分词列表,将处理后的分词列表按时间段进行聚类;
S2
:对聚类后的热门话题进行针对性分析,并按照影响力比较靠前的用户或媒体

按地域进行分类汇总

按话题微博内容进行情感分析,并可按照日期进行趋势分析;
S3
:对于聚类后的数据进行钻取分析,展示板块相关微博清单;
S4
:对于微博清单进行转发分析,可展示原创微博的多层转发路径关系图,统计转发量靠前的用户或者媒体,并可按转发层级进行统计;
S5
:按微博转发时间趋势,按时间展示最近三天微博涉及所有转发量,同时可分析出传播路径中的关键用户及关键路径,然后直观展示近三天微博热度走势,显示热度指数峰值及热度指数均值;
S6
:对于原创微博,和相关转发进行用户分析,可按地域观查看微博分布情况,按性别

年龄

发文设备

用户类别进行不同维度的聚类汇总
。2.
根据权利要求1所述的一种舆情数据评估分析方法,其特征在于:该方法还包括:对话题数据的内容分析,基于相关微博内容形成热门词云图,对微博及转发微博中所有正向负向关键词对比进行情感分析,点击关键词,列出所有涉及关键词的原创微博及转发微博清单
。3.
根据权利要求2所述的一种舆情数据评估分析方法,其特征在于:基于对话题数据的内容分析后,所列出的原创微博和所有转发微博,分析微博转发及热点情况,计算出微博引爆点,对于引爆点可进行详细数据查看,包括引爆点的关键用户

转发内容

二次转发量

转发时间

转发用户排行信息
。4.
根据权利要求3所述的一种舆情数据评估分析方法,其特征在于:所述引爆点数值的计算方法具体为:
a、
确定原创微博和转发微博的强调词在不同段落中出现的词频
Pf

b、
确定原创微博和转发微博的强调词在不同文章中出现的词频
Df

c、
根据公式确定引爆点权重数值
S
,其中计算公式为:
S

Pf
(

)

Df
(

)
/Pf
(

)
;其中,
Pf
(

)
为当日原创微博和转发微博强调词在不同段落中出现的词频,
Pf
(

)
为调查周期内的原创微博和转发微博强调词在不同段落中出现的词频,这里的调查周期为3-5天,
Df
(

)
为当日原创微博和转发微博强调词在不同文章中出现的词频
。5.
根据权利要求4所述的一种舆情数据评估分析方法,其特征在于:所述
S1
过程中采用聚类方法为
K

means
算法聚类,聚类结束后,保留十条最热门的话题内容,并展示话题相关数据总览
。6.
根据权利要求5所述的一种舆情数据评估分析方法,其特征在于:所述
S3
过程中,展示板块的相关微博清单是基于单条微博的热度分析

【专利技术属性】
技术研发人员:汪宏帅
申请(专利权)人:南京特尔顿信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1