【技术实现步骤摘要】
一种基于细粒度情感字典的网络情绪分析系统
[0001]本专利技术涉及文本字词情绪分析
,具体是一种基于细粒度情感字典的网络情绪分析系统。
技术介绍
[0002]随着社交网络和电子商务的快速发展,微博、微信、QQ和淘宝等社交网络和购物平台给人们的生活带来了很大的影响,越来越多的用户喜欢在社交媒体上发表自己的看法,而不只是浏览和接收信息,在国内,微博已经成为许多年轻人分享和获取信息的核心平台,在这些信息中包含着喜、怒、哀、乐等个人情绪,对这些信息中的情绪进行分析可以获得用户的内心活动、分析用户的性格特点,分析人们对于公众事件和社会现象的态度可以更好的检测和控制事件进展,因此,对微博等社交媒体中的文本进行情绪分析有重要的意义。
[0003]在目前网络情绪分析系统中,通过融合细粒度情感字典的方法来辅助对网络情绪的分析,该方法根据现有的情感字词构建出字典单元,通过字典中的字词与文本中拆分后的字词进行比对,以此来对情绪进行分析,提高情绪的分析效率,但是在情绪分析过程中,正向字词和反向字词在不同的整体文本中,所起到并不一定是 ...
【技术保护点】
【技术特征摘要】
1.一种基于细粒度情感字典的网络情绪分析系统,其特征在于,包括文本输入单元、情感分析单元、情感赋权单元、情绪划分单元和可视化单元;文本输入单元,其用于将所需进行情绪分析的文本训练集输入网络情绪分析系统中,并进行后续的文本训练集处理;情感分析单元,其对文本输入单元中的文本训练集字词进行情感分析,情感分析方式根据与情感字典单元中的多类情感词进行对比,并以此得出文本训练集的整体情感方向;情感赋权单元,其对文本训练集中拆分后的字词进行情感赋值,并得出整体文本训练集所指向的情感方向;情绪划分单元,其对情感赋权后的文本训练集情感方向进行细分,并以此得出文本训练集所要表示的情绪方向;可视化单元,其将文本训练集中的字词通过图表的方式进行生成,并将文本训练集中所体现情绪方向的重要性字词进行区分,之后通过图表的方式进行展示。2.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,还包括中央处理单元、情感字典单元、文本清洗单元和词频统计单元;中央处理单元,其用于对网络情绪分析系统中多个业务单元的属性信息进行管理,并根据多个业务单元的属性信息分别管理业务单元的属性信息相匹配的配置数据文件;情感字典单元,其用于存储正面情感字词、负向情感字词和中性情感字词,并将多组字词区分后进行分类储存;文本清洗单元,其对文本输入单元中进行情绪分析的文本训练集进行拆分,将无效字符去除,并将其文本训练集拆分成多组字词;词频统计单元,其将文本清洗单元中文本训练集拆分后的多组字词针对相同字词进行聚集,并统计相同字词的数量。3.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于:所述情感赋权单元中将正面情感词分值设1,负面情感词分值设为
‑
1,中性词则设为0,肯定词分值全设为1,否定词分值全设为
‑
1,程度副词不做改变,其中否定词和程度副词的不同位置会产生两种结果,一是“否定词+程度副词+情感词”,还有就是“程度副词+否定词+情感词”;其中对于“否定词+程度副词+情感词”的计算方式如下:P1=(x(K)+x(M)+x(O))
×
α,对于“程度副词+否定词+情感词”的计算方式如下:P2=(x(M)+x(K)+x(O))
×
β,其中P1和P2表示计算得到的情感词语的情感强度值,x表示字词的数量,K表示否定词的权值,O表示情感词的权值,M表示该情感词O前的程度副词的权值,α表示P1中的总权值系数,β表示P2中的总权值系数。4.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,所述情绪划分单元对文本训练集中拆分字词的情感进行情绪方向的细分,细分公式如下:其中Q(X
I
|B)表示情感方向下细分后B情绪的强度值,DB表示文本训练集中属于B情绪下的字词集合,表示文本训练集中属于B情绪中第I个属性取值为X
I
的集合。5.根据权利要求1所述的一种基于细粒度情感...
【专利技术属性】
技术研发人员:宋柯,黄以可,罗德军,石泽文,
申请(专利权)人:深圳占领信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。