结合情感原因发现的文本情感预测学习系统技术方案

技术编号：22076141 阅读：22 留言：0更新日期：2019-09-12 14:16

一种文本情感原因发现装置，该装置包括词‑子句层级结构，包含有四部分：词级别编码器、词级别注意力、子句级别编码器、子句级别注意力；其中，词级别编码器，将文本送入词级别编码器，用于捕获词与词之间的序列特征；词级别注意力，通过当前词语的隐状态表示和与之对应的情绪表达词之间的关系来获得词级别的注意力值，用来指示当前词在其所在的子句中所占的重要程度，然后通过权重和累加操作获得每个子句的表示；子句级别注意力，利用一个分类器来获得当前子句是情感原因的概率，并以此作为子句的注意力值，同时将当前子句距离情绪表达词的距离的分布式表示与子句表示拼接；子句级别编码器，通过子句级编码器获取不同子句之间的结构性信息更新子句表示，通过softmax来获得分类特征的概率分布。通过该装置可以帮助机器更加精准地判断人类触发情感的原因。

Text Emotional Prediction Learning System Based on Emotional Cause Discovery

全部详细技术资料下载

【技术实现步骤摘要】
结合情感原因发现的文本情感预测学习系统
本专利技术属于情感预测
，特别涉及结合情感原因发现的文本情感预测学习系统。
技术介绍
在传统文本情感分析的研究中，通常采用单任务学习模型，将文本情感原因发现和文本情感预测分别看作单一任务。由于传统的情感分析方法将情感原因发现和情感预测看作两个独立的学习任务，需要针对不同的任务设计不同的学习模型，这种方式效率低下且难以挖掘二者之间密切的联系，即情感原因驱动情感的产生，所以对文本情感原因的研究能够促进对情感本身的研究。此外，单任务学习模型在优化时，梯度的反向传播倾向于陷入局部极小值，而多任务学习中不同任务的局部极小值处于不同的位置，通过相互作用，可以帮助隐含层逃离局部极小值，找到更优解。
技术实现思路
为克服已有技术的不足之处，本专利技术提出一种结合情感原因发现的文本情感预测学习系统，可以帮助机器更加精准地判断人类的情感。为了实现上述目的，本专利技术采用的技术方案为：一种文本情感原因发现装置，其特征在于，该装置包括词-子句层级结构，包含有四部分：词级别编码器、词级别注意力、子句级别编码器、子句级别注意力；其中，词级别编码器，将文本送入词级别编码器，用于捕获词与词之间的序列特征；词级别注意力，通过当前词语的隐状态表示和与之对应的情绪表达之间的关系来获得词级别的注意力值，用来指示当前词在其所在的子句中所占的重要程度，然后通过权重和累加操作获得每个子句的表示；子句级别注意力，利用一个分类器来获得当前子句是情感原因的概率以此作为子句的注意力值，在子句层级将当前子句距离情绪表达词的距离与子句表示拼接；子句级别编码器，通过子句编码...

【技术保护点】
1.一种文本情感原因发现装置，其特征在于，该装置包括词‑子句层级结构，包含有四部分：词级别编码器、词级别注意力、子句级别注意力、子句级别编码器；其中，词级别编码器，将文本送入词级别编码器，用于捕获词与词之间的序列特征；词级别注意力，通过当前词语的隐状态表示和与之对应的情绪表达之间的关系来获得词级别的注意力值，用来指示当前词在其所在的子句中所占的重要程度，然后通过权重和累加操作获得每个子句的表示；子句级别注意力，利用一个分类器来获得当前子句是情感原因的概率以此作为子句的注意力值，在子句层级将当前子句距离情绪表达词的距离与子句表示拼接；子句级别编码器，通过子句级别编码器获取不同子句之间的结构性信息更新子句表示，通过softmax来获得分类特征的概率分布。

【技术特征摘要】
1.一种文本情感原因发现装置，其特征在于，该装置包括词-子句层级结构，包含有四部分：词级别编码器、词级别注意力、子句级别注意力、子句级别编码器；其中，词级别编码器，将文本送入词级别编码器，用于捕获词与词之间的序列特征；词级别注意力，通过当前词语的隐状态表示和与之对应的情绪表达之间的关系来获得词级别的注意力值，用来指示当前词在其所在的子句中所占的重要程度，然后通过权重和累加操作获得每个子句的表示；子句级别注意力，利用一个分类器来获得当前子句是情感原因的概率以此作为子句的注意力值，在子句层级将当前子句距离情绪表达词的距离与子句表示拼接；子句级别编码器，通过子句级别编码器获取不同子句之间的结构性信息更新子句表示，通过softmax来获得分类特征的概率分布。2.根据权利要求1所述的文本情感原因发现装置，其特征在于：所述词级别编码器采用门限循环单元。3.根据权利要求1所述的文本情感原因发现装置，其特征在于：所述词级别注意力的计算公式如下：其中，w为参数矩阵，为情绪表达ew的向量表示，αit指示单词，wit在子句ci中的重要程度，为子句ci的输出标识，git和git'为不同时间步中计算注意力值的中间值，hit为第i个子句的向量表示。4.根据权利要求3所述的情感原因发现装置，其特征在于：子句级别注意力中，在子句层级将当前子句距离情感表达词的距离与子句表示拼接，计算...

【专利技术属性】
技术研发人员：徐睿峰，范创，杜嘉晨，黄锦辉，陆勤，
申请(专利权)人：哈尔滨工业大学深圳，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人