一种基于动态记忆网络的实体级别情感分类系统及方法技术方案

技术编号：18165733 阅读：83 留言：0更新日期：2018-06-09 11:35

本发明专利技术请求保护一种基于动态记忆网络的实体级别情感分类系统及方法，属于自然语言处理领域。该方法包括以下步骤：1、引入动态记忆网络将实体级别情感分类任务建模为问答系统；2、动态记忆网络中的输入模块对输入文本进行编码；3、在输入模块中加入单词位置信息以及残差结构以增强输入表示；4、在问题模块中设计针对目标词的问题；4、记忆模块通过两个子模块对输入表示进行记忆提取；5、回答模块对记忆模块所提取的特征进行情感极性预测以及模型训练。6、在训练完模型后，所训练模型能够完成实体级别的情感分类，包括正向、中立以及负向情感极性。本发明专利技术不仅能够处理简单句子而且能够正确处理复杂句式中目标实体的情感分类问题。

An entity level sentiment classification system and method based on dynamic memory network

The invention requests to protect an entity level emotion classification system and method based on dynamic memory network, belonging to the field of Natural Language Processing. The method includes the following steps: 1. A dynamic memory network is introduced to model the entity level emotion classification task into a question answering system; (2) the input module in the dynamic memory network encodes the input text; 3, the word position information is added to the input module and the residual structure is expressed by the enhanced input; 4, in the problem module. The problem of target words is taken into account; 4, memory module carries out memory extraction through two sub modules; 5, the answer module carries out emotional polarity prediction and model training on the features extracted by memory module. 6, after training the model, the training model can complete the emotional classification at the entity level, including forward, neutral and negative polarity. The invention can not only handle simple sentences but also correctly handle the emotional classification of target entities in complex sentence patterns.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动态记忆网络的实体级别情感分类系统及方法
本专利技术属于自然语言处理领域，具体属于对句子中特定实体进行情感分类的方法。
技术介绍
随着推特(Twitter)、脸书(Facebook)、微博(Weibo)等社交平台和亚马逊(Amazon)、淘宝(Taobao)等电子商务平台的兴起，网络上评论性文本资源与日俱増。面对来自微博、论坛的大量非结构化的评论文本，迫切需要通过自然语言处理技术对文本中特定实体进行情感类别分析。实体级别情感极性分类重在从数据中识别用户对某种产品，服务或社会舆情的情感倾向。实践中，实体级别情感分析对于政府管理、舆情监督、消费品经销商等部门制定策略有着非常重要的作用。传统情感分析绝大多数都是采用传统NLP特征与机器学习相结合的方式来构建模型。但传统NLP特征的设计往往需要专家的领域知识，人工成本较高，系统的泛化性和迁移性差。近两年兴起的深度学习方法能较好地弥补上述方法的缺陷，深度学习能够自动学习出描述数据本质的特征表达，从而避免了人工设计特征的缺陷。针对实体级别情感分类任务，已有大量模型，包括基于人工特征与传统机器学习方法，基于神经网络方法和基于记忆网络方法。但此类方法存在诸多问题，例如传统人工特征的特区需要大量的特征工程工作以及语法知识；基于LSTM的方法结构较为单一，无法处理复杂句式中特定实体的情感极性。例如当句子为反问句，疑问句或者比较句时，此类方法性能严重下降。基于记忆网络等方法仅仅利用到了句子的低层特征，并未考虑到高层语义。因此提出更有效的模型是该任务的一项非常重要的工作。
技术实现思路
本专利技术旨在解决以上现有技术的问题。提...
一种基于动态记忆网络的实体级别情感分类系统及方法

【技术保护点】
一种基于动态记忆网络的实体级别情感分类系统，其特征在于，包括一个动态记忆网络，所述动态记忆网络主要包括输入模块、问题模块、记忆模块和回答模块；利用动态记忆网络将实体级别情感分类问题建模为问答模型；其中，输入模块用于对已指定实体目标的输入文本进行编码处理以得到文本向量表示；问题模块中设计针对实体目标词的问题，为记忆模块每次更新提供注意对齐的特征信息；记忆模块分别通过多跳注意力和记忆更新两个子模块对文本输入表示进行记忆提取与记忆更新，并将最终更新特征传输给回答模块；回答模块，用于对记忆模块所提取的特征进行情感极性预测以及模型训练；在训练完模型后，训练模型能够完成实体级别的情感分类，包括正向、中立以及负向情感极性。

【技术特征摘要】
1.一种基于动态记忆网络的实体级别情感分类系统，其特征在于，包括一个动态记忆网络，所述动态记忆网络主要包括输入模块、问题模块、记忆模块和回答模块；利用动态记忆网络将实体级别情感分类问题建模为问答模型；其中，输入模块用于对已指定实体目标的输入文本进行编码处理以得到文本向量表示；问题模块中设计针对实体目标词的问题，为记忆模块每次更新提供注意对齐的特征信息；记忆模块分别通过多跳注意力和记忆更新两个子模块对文本输入表示进行记忆提取与记忆更新，并将最终更新特征传输给回答模块；回答模块，用于对记忆模块所提取的特征进行情感极性预测以及模型训练；在训练完模型后，训练模型能够完成实体级别的情感分类，包括正向、中立以及负向情感极性。2.根据权利要求1所述的基于动态记忆网络的实体级别情感分类系统，其特征在于，所述输入模块中还加入单词位置信息以及残差结构以增强输入表示。3.根据权利要求2所述的基于动态记忆网络的实体级别情感分类系统，其特征在于，所述输入模块对输入文本进行编码处理得到文本向量表示具体包括；给定输入文本序列{w1,w2,...,wn}以及对应实体目标n表示文本中包含的单词个数，表示构成实体目标的第m个单词，首先利用预训练词向量将输入文本序列映射成词向量序列{e1,e2,...,en}，将词向量序列堆叠成词向量矩阵其中d代表词向量维度；采用单层双向GRU结构对融合后的向量进行编码处理，得到编码后向量表示编码如下所示：其中，GRUf表示前向GRU网络，GRUb表示后向GRU网络，表示双向GRU网络的输出隐向量。4.根据权利要求3所述的基于动态记忆网络的实体级别情感分类系统，其特征在于，所述输入模块中还加入单词位置信息以及残差结构以增强输入表示，具体包括：首先计算上下文中的词与实体词的相对距离，定义为pi，借鉴词向量训练方式，将相对位置映射为位置向量，定义为li，并将其视为网络可以自动学习参数。为了将位置向量与词向量融合，采用向量对应元素相加方法：si＝ei+li，最终得到融合向量序列{s1,s2,...,sn}；将该残差结构结构引入输入模块增强文本表示，输入模块最终输出的编码表示为：其中ei表示词向量。5.根据权利要求1所述的基于动态记忆网络的实体级别情感分类系统，其特征在于，所述问题模块中设计针对目标词的问题，具体包括通过设计目标词所对应的情感问题编码得到实体词特征表示，首先将所设计问题映射为问题词向量序列，接着利用单层双...

【专利技术属性】
技术研发人员：张祖凡，汪露，邹阳，甘臣权，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人