一种基于注意力机制融合的跨领域情感分类系统技术方案

技术编号：23484979 阅读：24 留言：0更新日期：2020-03-10 12:36

本发明专利技术涉及一种基于注意力机制融合的跨领域情感分类系统。包括：评论文本预处理模块，用于获取源领域和目标领域文本的向量形式；文本语义学习模块，用于学习词语之间的语义依赖关系；注意力机制融合模块，通过将不同的注意力方式进行融合，获得词语对文本分类的综合权重；分层注意模块，分别从词级和句子级计算文本的注意力权重，判断词语对句子表示，句子对文档表示的权重；情感类别输出模块，利用分类函数得到最终的情感分类结果。本发明专利技术能够自动抽取出目标领域与源领域的潜在通用特征，并对特征进行抽象和组合，最终识别出目标领域文本的情感类别。

A cross domain emotion classification system based on attention mechanism fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制融合的跨领域情感分类系统
本专利技术涉及情感分析和观点挖掘领域，更具体地，涉及一种基于注意力机制融合的跨领域情感分类系统，能够通过跨领域的文本表示学习，学习领域适应的特征表示，较好地进行跨领域情感类别的分析。
技术介绍
情感分类是一项重要而富有挑战性的工作。在有足够标记训练数据的领域取得了显著的成功。然而，标注足够的数据是非常耗费时间和精力的，为情感分类系统适应新领域设置了重大障碍。同时，当用户在不同的领域表达情感时，他们经常使用不同的词语，如果我们直接将一个领域训练的分类器应用到其他领域，由于这些领域之间的差异，其所得到的表现会非常低。因此，跨领域情感文本分类是致力于开发一个通用的情感分类解决方案，我们通过在源领域，即有标签的数据进行训练出分类器，然后应用于目标领域，即无标签领域中对文本情感进行分类，我们称之为跨领域情感分类系统。目前大多数的跨领域情感分类研究属于基于特征的转换，需要手动选择枢轴特征和非枢轴特征。其中结构对应学习(SCL)是试图从非数据透视特征空间到数据透视特征空间获取映射矩阵的典型方法；SFA方法旨在通过对齐不同领域的枢轴特征和非枢轴特征，在源领域与目标领域之间建立桥梁。上述方法都需要在目标域中有大量未标记的数据来帮助构建传输过程。此外，这些方法并没有充分挖掘单词的语义，也没有充分利用数据和领域标签。而近几年深度学习的兴起在跨领域情感分类中取得了较好的成果，其主要是学习情感分类的共同特征和共享参数，其中堆叠降噪自动编码器(SDA)是用于为来自源领域和目标领域的文档生成统一...

【技术保护点】
1.一种基于注意力机制融合的跨领域情感分类系统，其特征在于，包括：/n文本预处理模块，用于获取源领域和目标领域文本对应的向量形式；/n文本语义学习模块，用于学习文本预处理模块获得的文本向量的词语之间的语义依赖关系；/n注意力机制融合模块，通过将不同的注意力方式进行融合，获得文本向量的词语对文本的综合权重；/n分层注意模块，分别从词级和句子级计算文本的注意力权重，判断词语对句子表示的权重，句子对文档表示的权重，得到文本表示向量；/n情感类别输出模块，利用分类函数对分层注意模块输出的文本表示向量进行处理，得到最终的情感分类结果。/n

【技术特征摘要】
1.一种基于注意力机制融合的跨领域情感分类系统，其特征在于，包括：
文本预处理模块，用于获取源领域和目标领域文本对应的向量形式；
文本语义学习模块，用于学习文本预处理模块获得的文本向量的词语之间的语义依赖关系；
注意力机制融合模块，通过将不同的注意力方式进行融合，获得文本向量的词语对文本的综合权重；
分层注意模块，分别从词级和句子级计算文本的注意力权重，判断词语对句子表示的权重，句子对文档表示的权重，得到文本表示向量；
情感类别输出模块，利用分类函数对分层注意模块输出的文本表示向量进行处理，得到最终的情感分类结果。

2.根据权利要求1所述的一种基于注意力机制融合的跨领域情感分类系统，其特征在于，文本预处理模块利用Word2vec提取源领域与目标领域文本对应的向量形式。

3.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员：廖祥文，陈癸旭，陈志豪，邓立明，陈开志，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人