一种多维度舆情危机预测方法、终端设备及存储介质技术

技术编号:23852233 阅读:36 留言:0更新日期:2020-04-18 09:14
本发明专利技术涉及一种多维度舆情危机预测方法、终端设备及存储介质,在该方法中包括:S1:采集一定时间内的舆情文本数据,并根据每个文本数据在不同维度的属性计算其负面情感热度总指数;S2:根据舆情危机知识库中存储的各类型舆情危机事件,通过聚类算法对文本数据进行分类,并计算每个文本数据与其聚类中心的相关度;S3:根据每个文本数据与其聚类中心的相关度和该文本数据的负面情感热度总指数计算每个文本数据的危机程度。本发明专利技术通过不同维度的属性计算负面情感热度总指数,并与历史的各类型舆情危机事件进行聚类,得到每个文本数据的危机程度,实现对重大负面舆情的预测,可以提高舆情预测的准确性和时效性。

A multi-dimensional public opinion crisis prediction method, terminal equipment and storage medium

【技术实现步骤摘要】
一种多维度舆情危机预测方法、终端设备及存储介质
本专利技术涉及舆情分析领域,尤其涉及一种多维度舆情危机预测方法、终端设备及存储介质。
技术介绍
网络舆情是通过互联网传播的公众对现实生活中某些问题所持有的较强影响力、倾向性的观点和言论,主要通过新闻评论、论坛贴文、博客、微博等媒体实现,集中反映了一个时间段内的网络舆论。在现有的情感分析算法中错误率还是较高的,较为常用的snowNLP算法也存在一定的误差,常见的方法有通过基于一组手动制定的规则执行情感分析计算,有通过依靠机器学习技术从数据中学习执行情感分析计算,但这些方法都存在一些弊端,由于缺乏背景知识,上下文联系,从而导致数据准确性不高,召回率低,情感分析指数在时间序列上无法直观体现。虽然在增加更多规则和样本库进行训练可以做一些改进以提高准确性和召回率,但往往还是无法两者兼顾。多维度舆情危机预测时效性敏感,随着时间的推移,舆情危机爆发的可能也随之增加,在时间维度上的特点往往也需要纳入情感分析范围,低维度的情感分析也导致多维度舆情危机预测难以成型,难以达到较理想的效果。...

【技术保护点】
1.一种多维度舆情危机预测方法,其特征在于:包括以下步骤:/nS1:采集一定时间内的舆情文本数据,并根据每个文本数据在不同维度的属性计算其负面情感热度总指数;/nS2:根据舆情危机知识库中存储的各类型舆情危机事件,通过聚类算法对文本数据进行分类,并计算每个文本数据与其聚类中心的相关度;/nS3:根据每个文本数据与其聚类中心的相关度和该文本数据的负面情感热度总指数计算每个文本数据的危机程度。/n

【技术特征摘要】
1.一种多维度舆情危机预测方法,其特征在于:包括以下步骤:
S1:采集一定时间内的舆情文本数据,并根据每个文本数据在不同维度的属性计算其负面情感热度总指数;
S2:根据舆情危机知识库中存储的各类型舆情危机事件,通过聚类算法对文本数据进行分类,并计算每个文本数据与其聚类中心的相关度;
S3:根据每个文本数据与其聚类中心的相关度和该文本数据的负面情感热度总指数计算每个文本数据的危机程度。


2.根据权利要求1所述的多维度舆情危机预测方法,其特征在于:每个文本数据的负面情感热度总指数的计算过程包括以下步骤:
S11:设定文本数据的多个情感属性、每个情感属性对应的情感系数、多个热度属性和每个热度属性对应的热度系数;
S12:根据下式计算该文本数据的负面情感值和热度值;
Ai=f(si,ri)
Bj=h(1-ej,qj)
其中,Ai表示第i个热度属性的热度值,f表示热度值计算函数,si表示第i个热度属性,ri表示第i个热度属性对应的热度系数,Bj表示第j个情感属性的负面情感值,h表示负面情感值计算函数,ej表示第j个情感属性,qj表示第j个情感属性对应的情感系数;
S13:根据下式计算该文本数据的负面情感热度指数W:
W=A+B






其中,n表示热度属性的总数,i表示热度属性的序号,m表示情感属性的总数,j表示情感属性的序号;
S14:根据该文本数据命中的情感属性和热度属性,计算该文本数据的属性权重P:



其中,p和k分别表示命中的情感属性和热度属性的序号,N和M分别表示命中的情感属性和热度属性的总数;...

【专利技术属性】
技术研发人员:陈佳锋栾江霞章正道王仁斌陈镇国江明臻
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1