【技术实现步骤摘要】
一种利用数据模型推演社会事件的分析方法
[0001]本专利技术涉及社会分析领域,尤其涉及一种利用数据模型推演社会事件的分析方法
。
技术介绍
[0002]网络舆论是社会舆论在互联网上的一种映射,可以反映当前社会中群众普遍关心的社会问题的程度,例如突发事件,司法问题,经济问题等,通过对网络舆论的分析可以更有效地指定解决社会问题的方案社交平台逐渐成为热点事件社会情绪的集散地,准确分析民众的社会情绪是热点事件舆情监管的重要环节,由于热点事件的突发型,导致不能第一时间准确的了解到时间的舆论导向,可能会得到与社会事件完全不相关的结果
。
[0003]因此,有必要提供一种利用数据模型推演社会事件的分析方法解决上述技术问题
。
技术实现思路
[0004]本专利技术提供一种利用数据模型推演社会事件的分析方法,解决了由于热点事件的突发型,导致不能第一时间准确的了解到时间的舆论导向,可能会得到与社会事件完全不相关的结果的问题
。
[0005]为解决上述技术问题,本专利技术提供的一种利用数据模型推演社会事件的分析方法,包括以下步骤:
[0006]步骤一
、
大数据获取,采集突发事件的信息,通过网络爬虫自动爬取在线评论数据;
[0007]步骤二
、
对在线评论数据进行预处理,将其存储到数据库中;
[0008]步骤三
、
采集信息特征并构建突发事件的关键时空特征模型;
[0009]步骤四
、< ...
【技术保护点】
【技术特征摘要】
1.
一种利用数据模型推演社会事件的分析方法,其特征在于,包括以下步骤:步骤一
、
大数据获取,采集突发事件的信息,通过网络爬虫自动爬取在线评论数据;步骤二
、
对在线评论数据进行预处理,将其存储到数据库中;步骤三
、
采集信息特征并构建突发事件的关键时空特征模型;步骤四
、
对突发事件进行社会情绪分类
。2.
根据权利要求1所述的一种利用数据模型推演社会事件的分析方法,其特征在于,步骤二中对在线评论数据进行预处理具体方式为:
A、
使用正则表达式过滤评论中以“http://”开头的短链接;
B、
本文采用的是
Java
开源的
jieba
中文分词工具,进行分词;
C、
将评论中语气词看成是停用词,将其删除
。3.
根据权利要求1所述的一种利用数据模型推演社会事件的分析方法,其特征在于,步骤三具体为:
a、
对数据库中处理后的评论数据进行词频统计和词性分析;
b、
通过算法对语义相近的语句识别情绪高频词汇,算法方式为:
Degree(D,C
j
)
=
∑belong(w
i
,Dic(C
j
))
×
tf
wi
belong(wi,Dic(Cj)
=
(1,if wi∈Di(Cj)D
经过分词和预处理后可以表示为
D
=
{w1,tfw1
;
w2,tfw2
;
…
wn,tfwn}
,其中
wi
是评论中包含的词,
tf...
【专利技术属性】
技术研发人员:范荣超,王明,李晓东,郭文辉,单梦娇,
申请(专利权)人:北京新方案科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。