基于bilstm及attention的人机交互负面情感分析方法技术

技术编号:26479163 阅读:47 留言:0更新日期:2020-11-25 19:23
本发明专利技术公开了一种基于bilstm及attention的人机交互负面情感分析方法,包括以下步骤:A.采集数据并处理及构建负面情感词典、停用词典;B.对采集的数据进行分词及Word2vec词向量训练;C.构建双向长短时记忆网络bilstm,获取word2vec词向量并输入bilstm进行上下文特征提取;D.attention层权重调整;包括在bilstm网络加入注意力机制Attention,通过注意力机制的使用对句子中不同特征分配权重,并对于句子中倾向于用户情感的特征信息进行关注;E.情感分类结果输出。本发明专利技术的方法可对关键信息的权重进行调整,提高情感分析识别率,最终提高人机交互体验。

【技术实现步骤摘要】
基于bilstm及attention的人机交互负面情感分析方法
本专利技术涉及自然语言处理
,特别涉及一种基于bilstm及attention的人机交互负面情感分析方法。
技术介绍
情感分析技术是自然语言处理(NaturalLanguageProcessing,NLP)中一个重要方向,目前主要的文本情感分析研究主要是基于情感词典的方法、基于机器学习的方法和基于深度学习的方法的三类。它依靠情感词典和规则,通过计算情感值作为文本的情感倾向依据。这类方法其对情感词典的依赖成为其应用与发展的主要障碍。基于机器学习的方法,机器学习的方法通过对人工标定的数据进行训练而得到一个情感分析分类器。然而,传统机器学习方法通常仅在某一特定领域表现优秀,泛化能力较差、拟合精度不高。这两种方法都需要人工标记数据从而完成情感词典构建和特征工程,这些任务繁琐且复杂而深度学习算法能够很好地解决这一问题。近年来深度学习在自然语言处理方面取得巨大的成功,比如机器翻译,问答系统。注意力(Attention)机制是在信息处理时选择性地集中于某些重要的信息的一种机本文档来自技高网...

【技术保护点】
1.基于bilstm及attention的人机交互负面情感分析方法,其特征在于,包括以下步骤:/nA.采集数据并处理及构建负面情感词典、停用词典;/nB.对采集的数据进行分词及Word2vec词向量训练;/nC.构建双向长短时记忆网络bilstm,获取word2vec词向量并输入bilstm进行上下文特征提取;/nD.attention层权重调整;包括在bilstm网络加入注意力机制Attention,通过注意力机制的使用对句子中不同特征分配权重,并对于句子中倾向于用户情感的特征信息进行关注;/nE.情感分类结果输出。/n

【技术特征摘要】
1.基于bilstm及attention的人机交互负面情感分析方法,其特征在于,包括以下步骤:
A.采集数据并处理及构建负面情感词典、停用词典;
B.对采集的数据进行分词及Word2vec词向量训练;
C.构建双向长短时记忆网络bilstm,获取word2vec词向量并输入bilstm进行上下文特征提取;
D.attention层权重调整;包括在bilstm网络加入注意力机制Attention,通过注意力机制的使用对句子中不同特征分配权重,并对于句子中倾向于用户情感的特征信息进行关注;
E.情感分类结果输出。


2.根据权利要求1所述的基于bilstm及attention的人机交互负面情感分析方法,其特征在于,所述步骤A具体为:
A1.对终端采集到的数据进行初步处理;
A2.构造特定领域负面情感词典及根据用户数据结合汉语常用停用词字典构造特定领域的停用词字典;
A3.通过负面情感词典将采集到的数据分为负面情绪数据及非负面情绪数据;
A4.将负面情绪数据标注为a,将非负面情绪数据标注为b;
A5.将所述负面情绪数据及非负面情绪数据按x、y、z的比例划分为训练集、验证集和测试集,x+y+z=1。


3.根据权利要求2所述的基于bilstm及attention的人机交互负面情感分析方法,其特征在于,x=0.6,y=0.3,z=0.1。


4.根据权利要求2所述的基于bilstm及attention的人机交互负面情感分析方法,其特征在于,所述步骤A1的初步处理包括数据清洗。


5.根据权利要求2所述的基于bilstm及attention的人机交互负面情感分析方法,其特征在于,构造负面情感词典时是对终端采集到的数据通过统计词频、聚类及网上搜集的负面情感词,构造负面情感词典。


6.根据权利要求2所述的基于bilstm及attention的人机交互负面情感分析方法,其特征在于,所述步骤B具体为:
B1.通过分词系统结合本领域数据特点对训练集的数据进行分词;
B2.将分词后的数据通过Word2vec训练80-300维的词向量。


7.根据权利要求6所述的基于bilstm及att...

【专利技术属性】
技术研发人员:孙云云刘楚雄唐军
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1