当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于外部知识的视角级文本情感分类方法及系统技术方案

技术编号:24497974 阅读:29 留言:0更新日期:2020-06-13 03:48
本发明专利技术涉及一种基于外部知识的视角级文本情感分类方法及系统,包括步骤:对视角级文本进行特征化处理,并捕获文本的双向语义依赖关系;通过动态注意力机制将当前单词与外部知识同义词相结合,并引入哨兵向量避免外部知识对模型的误导;通过位置注意力机制来判断每个单词对视角词的贡献程度;通过计算每个记忆内容的注意力得分,利用门限循环单元将每层的注意力得分与上一层的输出结果非线性结合,并将最后一层作为文本的情感特征表示;利用分类函数得到最终的情感分类结果。本发明专利技术能够提高视角级文本情感分类的性能和降低资源的消耗。

A method and system of perspective level text emotion classification based on external knowledge

【技术实现步骤摘要】
一种基于外部知识的视角级文本情感分类方法及系统
本专利技术涉及文档情感分析和观点挖掘以及机器学习领域,特别是一种基于外部知识的视角级文本情感分类方法及系统。
技术介绍
视角级文本情感分析旨在研究评论文本关于给定视角词的情感极性,以便能提供比文档级或句子级的情感分析更全面、深入和细粒度的分析,可以广泛地应用于产品定价、竞争情报、股市预测等领域,为人们提供便捷自动化的工具,提升互联网信息的利用率。然而,用户情感表达在不同的视角情况下有不同的表现。如图1,文本中有两个视角词“size”和“space”,该文本对于视角词“size”而言表现出来的情感极性为积极的,而对于视角词“space”而言表现出来的情感极性为消极的。然而以句子为导向的文本情感分析分析安发发无法捕捉到针对视角词的中细粒度情感。为了解决这个问题,研究人员提出了各种视角级文本情感分析的方法。目前视角级文本情感分析研究主要分为基于词典的方法、基于传统机器学习的方法和基于神经网络的学习方法:基于情感词典的视角级文本情感分析方法需要一个人工构建的情感词典,然后使用句法分析树来判本文档来自技高网...

【技术保护点】
1.一种基于外部知识的视角级文本情感分类方法,其特征在于,包括以下步骤:/n对视角级文本进行特征化处理,捕获文本的双向语义依赖关系,得到具有双向语义依赖关系的单词的向量表示;/n通过动态注意力机制将具有双向语义依赖关系的当前单词向量表示与外部知识同义词的向量表示相结合,并引入哨兵向量避免外部知识对模型的误导,得到与外部知识结合的单词向量表示;/n通过位置注意力机制来判断每个单词对视角词的贡献程度,并将贡献程度和与外部知识结合的单词向量表示相乘生成记忆内容;/n通过计算每个记忆内容的注意力得分,利用门限循环单元将每层的注意力得分与上一层的输出结果非线性结合,并将最后一层作为文本的情感特征表示;/...

【技术特征摘要】
1.一种基于外部知识的视角级文本情感分类方法,其特征在于,包括以下步骤:
对视角级文本进行特征化处理,捕获文本的双向语义依赖关系,得到具有双向语义依赖关系的单词的向量表示;
通过动态注意力机制将具有双向语义依赖关系的当前单词向量表示与外部知识同义词的向量表示相结合,并引入哨兵向量避免外部知识对模型的误导,得到与外部知识结合的单词向量表示;
通过位置注意力机制来判断每个单词对视角词的贡献程度,并将贡献程度和与外部知识结合的单词向量表示相乘生成记忆内容;
通过计算每个记忆内容的注意力得分,利用门限循环单元将每层的注意力得分与上一层的输出结果非线性结合,并将最后一层作为文本的情感特征表示;
利用分类函数得到最终的情感分类结果。


2.根据权利要求1所述的一种基于外部知识的视角级文本情感分类方法,其特征在于,所述对视角级文本进行特征化处理具体包括以下步骤:
步骤S11:对视角级文本进行分词处理;
步骤S12:通过Glove来将文本数据从文本形式转换成向量形式;
步骤S13:采用前向长短时记忆网络Forward-LSTM和反向长短时记忆网络Backward-LSTM捕捉文本的双向的语义依赖,得到具有双向语义依赖关系的单词向量表示。


3.根据权利要求2所述的一种基于外部知识的视角级文本情感分类方法,其特征在于,步骤S13中,t时刻Forward-LSTM或者Backward-LSTM更新过程如下:


















式中,it、ft、ot、分别表示t时刻的输入门、遗忘门、输出门和记忆单元的激活向量,表示候选向量,表示模型第l层隐藏层的输出向量,Wi、Wf、Wo、Wc、Ui、Uf、Uo、Uc分别表示模型的输入门、遗忘门、输出门和记忆单元在l层关于输入向量和隐藏层向量的模型参数;
步骤S13采用两层的BiLSTM堆叠而成,每层BiLSTM均包括Forward-LSTM与Backward-LSTM,将两层的BiLSTM的隐藏层的输出向量作为得到的具有双向语义依赖关系的单词的向量表示:



式中,表示第i个单词vi所对应的向量表示,


4.根据权利要求1所述的一种基于外部知识的视角级文本情感分类方法,其特征在于,所述通过动态注意力机制将具有双向语义依赖关系的当前单词向量表示与外部知识同义词的向量表示相结合,并引入哨兵向量避免外部知识对模型的误导具体包括以下步骤:
步骤S21:通过下式计算哨兵向量st:



式中,σ表示logisticsigmoid函数,Wb、Ub分别表示要学习的权重参数矩阵,xt表示当前输入的文本内容,表示上一隐藏状态的输出;
步骤S22:通过下式计算同义词向量tk与哨兵向量st的注意权重:






其中,






式中,tkb、skb、bt、bs表示模型需要学习的权重参数向量,Wt、Ws、Wht、Whs表示模型需要学习的权重参数矩阵;
步骤S23:通过下式计算结合外部知识的单词向量表示







5.根据权利...

【专利技术属性】
技术研发人员:廖祥文邓立明陈甘霖梁少斌陈开志
申请(专利权)人:福州大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1