一种基于模糊粗糙集的用户多标签细粒度情感分析方法技术

技术编号:35501273 阅读:22 留言:0更新日期:2022-11-09 14:10
本发明专利技术涉及一种基于模糊粗糙集的用户多标签细粒度情感分析方法,包括:步骤一:对在线文本样本数据进行预处理,人工预先进行情感评定等级标注;步骤二:首先通过对模糊关系方程进行求解来得到每个情感词的属性模糊情感强度;步骤三:采集实际文本语料数据,利用改进的模糊粗糙集方法来预测句子、段落和篇章的情感标签和强度。本发明专利技术具有较为快速准确分析用户文本情感属性及强度的功能,通过分析用户评价文本自动分析并给出用户情感分析的结果。文本自动分析并给出用户情感分析的结果。文本自动分析并给出用户情感分析的结果。

【技术实现步骤摘要】
一种基于模糊粗糙集的用户多标签细粒度情感分析方法


[0001]本专利技术属于机器学习和文本挖掘领域,具体涉及一种基于文本的用户情感 分析方法。

技术介绍

[0002]随着Web 2.0技术的发展,目前越来越多的人通过博客,微博和在线论坛 等社交媒体平台分享并表达自己的感受和情感。因此,探测和分析社交媒体中 用户所表达的情感已成为相关学术界和商业企业的热门研究课题。
[0003]对于情感分析,以前传统的研究一般都侧重于情感导向分类,即根据研究 者的主观判断将文本数据的情感分为双向的(正向或负向)或三向的(正向, 中性或负向)。然而,随着研究的深入,目前越来越多的研究考虑了多情绪类别 的因素,如高兴、厌恶、喜爱、悲伤、焦虑、惊讶、愤怒和期待。这种针对多 情绪类别的研究被称为多标签情感分析(也就是情绪分析)。与情感倾向分类相 比,多标签情感分析可以更全面和准确地探测和捕捉用户所表达的精确情感类 别(也就是情绪),这种特点使之更适合监测网络舆论热点事件。但是,目前的 大多数研究只考虑一种情绪或情感,即对一个文章,段落或句子的情绪或情感 用单一标本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于模糊粗糙集的用户多标签细粒度情感分析方法,其特征在于,包括:步骤一:对文本样本数据进行预处理,人工预先进行情感属性标签及强度等级的标注;步骤二:用训练集数据中的已经人工标注的情感词、句子情感强度来构建用于文本情感强度分析的模糊关系方程并训练,每次计算情感词的属性和范围,获取情感词强度矩阵;步骤三:采集实际文本语料数据,利用改进的模糊粗糙集方法来预测句子、段落和篇章的情感标签和强度。2.根据权利要求1所述的一种基于模糊粗糙集的用户多标签细粒度情感分析方法,其特征在于,将样本数据分为训练集和验证集,用训练集中每个句子的已知多标签情感强度来构建模糊情感矩阵方程,并训练文本情感强度分析的模糊关系方程,得到情感词强度矩阵VE模型,用验证集中的数据进行验证。3.权利要求2述的一种基于模糊粗糙集的用户多标签细粒度情感分析方法,其特征在于,所述训练集中的情感词为对原始在线文本样本数据中的句子进行分词、去停用词处理后获得的。4.权利要求2述的一种基于模糊粗糙集的用户多标签细粒度情感分析方法,其特征在于,所述情感词或其所在句子的情感属性标签包括8种情感:高兴、厌恶、喜爱、悲伤、焦虑、惊讶、愤怒和期望;所述情感强度等级可以分为从0到1一共11个等级。5.根据权利要求1所述的一种基于模糊粗糙集的用户多标签细粒度情感分析方法,其特征在于,所述步骤二中模糊关系方程的输入、输出包括:模型输入:训练集中的情感词矩阵VW、句子情感强度矩阵VS;模型输出:训练完的情感词强度矩阵VE。6.权利要求1述的一种基于模糊粗糙集的用户多标签细粒度情感分析方法,其特征在于,所述用训练集数据中的已经人工标注的情感词、句子情感强度来构建用于文本情感强度分析的模糊关系方程,具体包括:情感词矩阵VW该情感词在句子中的强度矩阵VE=句子情感强度矩阵VS;即,在上述方程中,最左侧的VW=[vw]
m
×
n
是情感词矩阵,这里假设训练集T具有j个情感词和i个句子,j=(0,n),i=(0,m);如果第j个情感词w
j
存在于第i个句子s
i
中,则vw
ij
=1;如果不存在则vw
ij
=0;右边的矩阵VS=[vs]
m
×8表示句子情感强度的模糊矩阵:对于第i个句子的情感标签vsi来说,vs
...

【专利技术属性】
技术研发人员:蔡颖凯王楚王忠锋曹世龙李力刚付瀚臣刘鑫王馨高曦莹夏靖怡
申请(专利权)人:中国科学院沈阳自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1