基于自注意力机制的情感分类方法技术

技术编号：22330183 阅读：44 留言：0更新日期：2019-10-19 12:17

本发明专利技术公开了一种基于自注意力机制的情感分类方法，以双向长短期记忆神经网络模型为基础，结合自注意力机制构建SA‑BiLSTM模型，SA‑BiLSTM模型共包含五层结构：第一层为输入层，将句子输入到模型中；第二层为词向量构造层，将每个词映射到低维向量；第三层为Bi‑LSTM网络层，使用Bi‑LSTM从词向量层获取高级特征；第四层为自注意力机制层，生成一个权重向量，通过与这个权重向量相乘，使每一次迭代中的词汇级的特征合并为句子级的特征；第五层为输出层，将句子级的特征向量用于情感分类任务。本发明专利技术解决了现有技术中传统情感分类算法大多存在耗时长、训练难、人工成本高的问题。

Emotion classification based on self attention mechanism

全部详细技术资料下载

【技术实现步骤摘要】
基于自注意力机制的情感分类方法
本专利技术属于自然语言处理、数据挖掘
，具体涉及一种基于自注意力机制的情感分类方法。
技术介绍
注意力机制源于对人类视觉的研究。在认知科学中，由于信息处理的瓶颈，人类往往根据需求忽略部分可见信息，只关注信息特定的一部分。为了合理利用有限的视觉信息处理资源，人类需要选择视觉区域中的特定部分，然后集中关注它，从而筛选出有价值的信息，视觉注意力机制极大的提高了人类处理视觉信息的效率。深度学习中的注意力机制借鉴了人类视觉注意力机制的思维方式，核心目标是从大量数据中快速筛选出高价值的信息。近年来，注意力模型在图像处理、语音识别、自然语言处理等领域被广泛使用。2017年谷歌提出的自注意力机制为人们提供了一种用注意力机制完全替代传统卷积神经网络和循环神经网络结构的新思路。之后自注意力机制开始成为神经网络注意力机制的研究热点。自注意力机制可以看作是注意力机制的一种特殊情况，能够把输入序列上不同位置的信息联系起来，然后计算出整条序列的表达。在文本情感分类任务中引入自注意力机制能够学习到句子内部的词依赖关系，捕获句子的内部结构。
技术实现思路
本专利技术的目的是提供一种基于自注意力机制的情感分类方法，解决了现有技术中传统情感分类算法大多基于浅层的机器学习，采用人工设计的特征选择方法进行特征提取，存在耗时长、训练难、人工成本高的问题。本专利技术所采用的技术方案是，基于自注意力机制的情感分类方法，具体按照以下步骤实施：以双向长短期记忆神经网络模型为基础，结合自注意力机制构建SA-BiLSTM模型，SA-BiLSTM模型共包含五层结构：第一层为输入...

【技术保护点】
1.基于自注意力机制的情感分类方法，其特征在于，具体按照以下步骤实施：以双向长短期记忆神经网络模型为基础，结合自注意力机制构建SA‑BiLSTM模型，SA‑BiLSTM模型共包含五层结构：第一层为输入层，将句子输入到模型中；第二层为词向量构造层，将每个词映射到低维向量；第三层为Bi‑LSTM网络层，使用Bi‑LSTM从词向量层获取高级特征；第四层为自注意力机制层，生成一个权重向量，通过与这个权重向量相乘，使每一次迭代中的词汇级的特征合并为句子级的特征；第五层为输出层，将句子级的特征向量用于情感分类任务。

【技术特征摘要】
1.基于自注意力机制的情感分类方法，其特征在于，具体按照以下步骤实施：以双向长短期记忆神经网络模型为基础，结合自注意力机制构建SA-BiLSTM模型，SA-BiLSTM模型共包含五层结构：第一层为输入层，将句子输入到模型中；第二层为词向量构造层，将每个词映射到低维向量；第三层为Bi-LSTM网络层，使用Bi-LSTM从词向量层获取高级特征；第四层为自注意力机制层，生成一个权重向量，通过与这个权重向量相乘，使每一次迭代中的词汇级的特征合并为句子级的特征；第五层为输出层，将句子级的特征向量用于情感分类任务。2.根据权利要求1所述的基于自注意力机制的情感分类方法，其特征在于，所述SA-BiLSTM模型的为词向量构造层具体功能如下：对于给定包含T个词的句子S：S＝X1,X2,...,XT，每个词Xi都转换为实数向量wi，对于S中的每个词，首先存在词向量矩阵：其中V为固定大小的词汇表，dw表示词向量维度，Wk表示通过训练学习得到的参数矩阵，使用词向量矩阵Wk将每个词转化为词向量表示如下：ci＝Wkvi其中，vi表示大小为|V|的one-hot向量，最终句子S将被转化为一个实数矩阵，并传递给模型的下一层。3.根据权利要求2所述的基于自注意力机制的情感分类方法，其特征在于，所述SA-BiLSTM模型的Bi-LSTM网络层具体功能如下：本模型使用的Bi-LSTM网络层包含三种门机制，分别如下：a.遗忘门ft，决定丢...

【专利技术属性】
技术研发人员：姚全珠，祝元博，费蓉，赵佳瑜，吕鹏，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人