当前位置: 首页 > 专利查询>九江学院专利>正文

一种用于弹幕情感分析且基于表情和语气的情感词典构建方法技术

技术编号:26792111 阅读:41 留言:0更新日期:2020-12-22 17:07
一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,首先构建传统情感词典TD,而后在传统情感词典TD上添加构建的表情词典E与语气词典T以获得新词典BSET,从而提高了弹幕情感分析的准确性,同时注重语气词的作用,有效增强弹幕情感分析的效果;同时为区分具有相同情感词的不同弹幕,构建程度词典DD和否定词典ND并添加至新词典BSET中,最后对基于程度词典DD和否定词典ND构建的所有情感词典进行修正,并将修正后的情感值用于弹幕情感分析,实验结果表明本发明专利技术比现有的方法在弹幕情感分析领域具有更好的性能。

【技术实现步骤摘要】
一种用于弹幕情感分析且基于表情和语气的情感词典构建方法
本专利技术涉及文本情感分析
,尤其涉及一种用于弹幕情感分析且基于表情和语气的情感词典构建方法。
技术介绍
近年来,随着网络视频行业的快速发展,网络视频用户规模的也在不断扩大,弹幕评论越来越受到欢迎。弹幕是一种新兴、实时更新的互动评论系统,它以滚动字幕的方式直接显示在视频界面上,有助于加深观众对视频内容的理解,也可促进观看相同类型视频的观众之间交流。随着弹幕功能在各大视频网站的流行,弹幕中的情感信息越来越具有普遍性和参考性,这些情感信息能准确地反应用户在观看视频时的情感和褒贬评价。目前,国内外在文本情感分析方面做出了一定的研究成果,但主要集中在社交媒体和商品评论两大领域,因弹幕是近几年新兴的一种互动评论方式,故对弹幕的研究很少,现有对弹幕的研究是将其视为与视频内容紧密相关的时间同步的文本标签,主要应用于视频内容摘要、视频内容标记及视频关键帧推荐。由于弹幕本身的特点,比如文本内容较短,口语化,网络用语较多,用语不规范等,所以对弹幕的情感分析仍然存在很大的挑战。现有本文档来自技高网...

【技术保护点】
1.一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,首先构建传统情感词典TD,而后在传统情感词典TD上添加构建的表情词典E与语气词典T以获得新词典BSET;同时为区分具有相同情感词的不同弹幕,构建程度词典DD和否定词典ND并添加至新词典BSET中,最后对基于程度词典DD和否定词典ND构建的所有情感词典进行修正,并将修正后的情感值用于弹幕情感分析。/n

【技术特征摘要】
1.一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,首先构建传统情感词典TD,而后在传统情感词典TD上添加构建的表情词典E与语气词典T以获得新词典BSET;同时为区分具有相同情感词的不同弹幕,构建程度词典DD和否定词典ND并添加至新词典BSET中,最后对基于程度词典DD和否定词典ND构建的所有情感词典进行修正,并将修正后的情感值用于弹幕情感分析。


2.根据权利要求1所述的一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,具体步骤如下:
(1)构建传统情感词典
首先构建传统情感词典TD,TD={基础情感词典,领域词典,字段词典,网络词典,程度词典,否定词典};
(2)构建表情词典
表情词典E由一组表情构成,E具有三个属性:符号、类别和情感值,令S为E中的符号集合,C为类别的集合,E.V为情感值的集合,s∈S,c∈C,v∈E.V,表情e=(e.s,e.c,e.v),同时,定义e.v∈[-3,3]∩e.v∈N;表情e的情感值计算如下:
首先,而后计算两个表情之间的相关程度,如公式(1)所示:



公式(1)中,ECD为表情相关度的缩写,B(e1,e2)表示两个表情e1和e2一起出现的弹幕数量,B(e1)和B(e2)表示两个表情单独出现的弹幕数量;
其次,设置一组正向表情PE和一组负向表情NE,且如公式(2)所示计算表情e的情感倾向EST:



最后,定义低阈值与高阈值且计算表情e的情感值e.v,如公式(3)所示:



(3)构建语气词典
语气词典T由一组语气词构成,T具有语气词和情感值两个属性,令W为T中的语气词集合,T.V为情感值的集合,w∈W,v∈T.V,语气词t=(t.w,t.v);同时,定义t.v∈[-3,3]∩t.v∈N;
在传统情感词典TD上添加构建表情词典E与语气词典T,得到新词典BSET;
(4)构建程度词典和否定词典
为区分具有相同情感词的不同弹幕,在新词典BSET中构建程度词典DD和否定词典ND;
(5)对所有情感词典进行修正
对基于步骤(4)构建的所有情感词典进行修正,用于弹幕情感分析。


3.根据权利要求2所述的一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,步骤(1)中,基础情感词典基于BosonNLP情感词典构建,领域词典基于SO-PMI算法构建,字段词典基于字段分类器构建,网络词典基于搜狗输入法词典构建。


4.根据权利要求2所述的一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,步骤(2)中,公式(1)的计算将得到三个结果:①当ECD(e1,e2)>>0时,e1与e2具有相关性,若e1和e2之间存在相关性,则B(e1,e2)>B(e1)与B(e2),同时,ECD(e1,e2)越大,相关性越强;②ECD(e1,e2)<<0时,e1与e2互斥,同时ECD(e1,e2)的较大值显示两个表情更加互斥;③当ECD(e1,e2)≈0时,e1与e2独立,即e1与e2不相关或互斥。


5.根据...

【专利技术属性】
技术研发人员:崔宗敏邱全磊肖彦王立华杨潇吕小蕾
申请(专利权)人:九江学院
类型:发明
国别省市:江西;36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1