一种基于双向交互神经网络的文本情感分析方法技术

技术编号：20681243 阅读：31 留言：0更新日期：2019-03-27 18:59

本发明专利技术公开了一种基于双向交互神经网络的文本情感分析方法，包括以下步骤：搜集实体‑文本情感语料集，并将其分为训练集与测试集；对语料集中的实体和文本进行预处理；运用相对位置信息和全局词向量信息，构建词和句子表示；将训练语料集的实体和文本词向量输入到神经网络，训练出情感分类模型；将测试集实体和文本词向量输输入到神经网络模型中，从而计算出每个样本的预测概率；运用量子启发的多模态决策融合方法将文本预测概率和图像预测概率加权融合，最终得到更加准确且智能的多模态情感分类结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双向交互神经网络的文本情感分析方法
本专利技术涉及文本情感分类
，具体讲，涉及一种基于双向交互神经网络的文本情感分析方法。
技术介绍
随着互联网和社交网络的迅速发展，越来越多的用户喜欢在社交平台上(如微博、点评、Facebook等)发表评论和分享自己的观点，成为用户日常生活中获取信息的主要来源之一。不同于单纯的文本情感分析，现在的社交媒体上出现的文本一般不单叙述一个事物，通常会变现为对一个或多个事物的评价，所以我们对文本的情感分析要做到分析具体针对某个实体情况下的情感极性，这使得我们可以知道一段文本描述的每个事物的情感是怎样的。因此，文本情感分析不仅具有重要的理论意义，而且蕴含巨大的社会价值。本专利技术主要研究社交平台中最普遍的实体文本情感，即实体-文本情感分析技术。情感分析，也称为意见挖掘，是自然语言处理(NLP)中的一项重要任务。它根据文本的情感状态和主观信息将文本分为两类或更多类，受到业界和学术界的广泛关注。在本专利技术中，我们讨论了实体-文本情感分析技术，这是文本情感分析领域的细粒度任务。例如，一段文本是“菜单看起来很好，除了提供智利海鲈鱼，...

【技术保护点】
1.一种基于双向交互神经网络的文本情感分析方法，其特征在于：它包括如下步骤：(1)：构建一个实体‑文本情感语料集，该语料集的总样本数为N，其中每条样本包含一段文本和一个实体词；(2)：从(1)的实体‑文本情感语料集中，随机选取80％*N个样本作为训练集，10％*N个样本划分为验证集和剩余的10％*N个样本划分为测试集，并分别对训练集、验证集和测试集进行预处理；(3)：对预处理之后的文本和实体词，构建神经网络模型框架；根据实体词在文本中的位置构造文本中每个词的相对位置信息特征，并输入到一个双向交互的神经网络模型中；运用方法如下：3.1：根据实体词的位置构造文本中每个词的相对位置索引，假设一个实体...

【技术特征摘要】
1.一种基于双向交互神经网络的文本情感分析方法，其特征在于：它包括如下步骤：(1)：构建一个实体-文本情感语料集，该语料集的总样本数为N，其中每条样本包含一段文本和一个实体词；(2)：从(1)的实体-文本情感语料集中，随机选取80％*N个样本作为训练集，10％*N个样本划分为验证集和剩余的10％*N个样本划分为测试集，并分别对训练集、验证集和测试集进行预处理；(3)：对预处理之后的文本和实体词，构建神经网络模型框架；根据实体词在文本中的位置构造文本中每个词的相对位置信息特征，并输入到一个双向交互的神经网络模型中；运用方法如下：3.1：根据实体词的位置构造文本中每个词的相对位置索引，假设一个实体词出现在句子中，那么它的位置索引将被标记为“0”，而句子中的其他词的位置索引将被表示为与当前实体词的相对距离；其中js和je分别代表实体词在句子中的起始和结束位置索引，pi可以被看作是句子中第i个词关于实体词的相对位置索引；3.2：运用glove工具得到每个文本中单词的词向量wi，同时建立一个位置信息的矩阵，每一个相对位置索引对应一个向量pi；所述文本中的每个词的表示xi＝concat(wi,pi)，以及实体词的表示ei＝wi；3.3本的每个词的词向量连同它的相对位置信息向量按其在句子中的顺序输入到一个双向长短期记忆网络中，同时把实体词本身也输入到另一个双向长短期记忆网络网络中；其中，f代表遗忘门，i代表输入门，o代表输出门，σ代表sigmoid函数，W和b分别代表权重和偏置；其中，双向的LSTM网络分为for...

【专利技术属性】
技术研发人员：张立鹏，顾淑琴，张鹏，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人