一种基于参数迁移和注意力共享机制的跨领域文本情感分类方法技术

技术编号：29873177 阅读：15 留言：0更新日期：2021-08-31 23:48

本发明专利技术针对跨领域文本情感分类任务提出了一种基于参数迁移和注意力共享机制方法与系统。特别地，本发明专利技术体系结构包括源领域网络和目标领域网络。首先，在训练数据上构建具有预训练语言模型的分层注意力网络，预训练语言模型包含用于单词表示的全局矢量和双向编码器语言模型。其次，在模型迁移中，本发明专利技术引入了单词和句子级别参数迁移机制，采用参数迁移和微调技术将网络参数从源领域网络迁移到目标领域网络。最后，情感注意力可以充当连接不同领域的情感传递的桥梁，本发明专利技术引入单词和句子级别的注意力机制，并从这两个级别共享跨领域情感注意力。实验表明，本发明专利技术提出的方法在亚马逊跨领域情感分类数据集上达到了最优的结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于参数迁移和注意力共享机制的跨领域文本情感分类方法
本专利技术涉及自然语言处理文本情感分析领域，提出了一种基于参数迁移和注意力共享机制的跨领域文本情感分类方法。
技术介绍
传统的文本情感分类方法假定用于训练和测试之间的领域是独立同分布的。但是，在实际条件下，不同的领域之间具有分布差异。跨领域文本情感分类采用源领域数据资源来实现目标领域中的情感分类任务。为了有效解决特定领域中数据标记不足的问题，跨领域情感分类扩展了基于文本的社交媒体中迁移学习的应用，可以提高数据源不足的文本情感分类任务的分类效果。此外，它可以促进基于文本的情感分析相关的应用和行业的快速发展。深度学习方法在文本情感分类任务上取得了出色的成绩，但它需要大量的带标签训练数据。然而，标注特定领域的数据是一项非常费时费力的任务。情感的分布在不同的领域有所不同。在不同的领域，用户倾向于用不同的情感词表达情感。因此，情感的表达具有领域依赖性。在不同领域训练的分类器很难应用到其他领域，需要执行特定的情感迁移策略。跨领域的情感迁移的核心是找到领域不变性作为实现跨领域迁移的桥梁。社交媒体中的文本具有三个层次的语义结构，分别是单词、句子和文档。在文档的构成中，单词的情感决定句子的情感，而句子的情感决定文档的整体情感。容易注意到不同的单词和句子对文档整体情感表达的贡献不同。注意力机制可以通过执行加权变换有效地提升序列模型的效果。直觉表明，从源领域训练中获得的单词级和句子级注意权重可以指导目标领域注意权重的训练。通过注意力机制，可以找到对于情感决策...

【技术保护点】
1.一种基于参数迁移和注意力共享机制的跨领域文本情感分类方法，其特征在于，包括以下步骤：/nS1，基于参数迁移和注意力共享机制(Parameter transferring and attentionsharing mechanism，PTASM)的可迁移神经网络体系，具体包括源领域网络(Source domainnetwork)和目标领域网络(Target domain network)。源领域网络和目标领域网络具有相似的网络结构。它们包括单词序列层和编码层、单词注意力层、句子序列层和编码层、句子注意力层以及情感分类层；/nS2，分层注意力网络(Hierarchical attentional network，HAN)重视文档中的局部语义，并采用双向门控循环单元(Gated recurrent neural networks，GRU)学习单词和句子的表示形式。文档x由数个句子s组成，s由数个单词w组成，并且词w表示为固定维度的单词向量。通过文档级分布式表示可以有效地捕捉情感语义特征；/nS3，通过参数迁移技术将源领域网络参数直接迁移到目标领域网络。在源领域D

【技术特征摘要】
1.一种基于参数迁移和注意力共享机制的跨领域文本情感分类方法，其特征在于，包括以下步骤：
S1，基于参数迁移和注意力共享机制(Parametertransferringandattentionsharingmechanism，PTASM)的可迁移神经网络体系，具体包括源领域网络(Sourcedomainnetwork)和目标领域网络(Targetdomainnetwork)。源领域网络和目标领域网络具有相似的网络结构。它们包括单词序列层和编码层、单词注意力层、句子序列层和编码层、句子注意力层以及情感分类层；
S2，分层注意力网络(Hierarchicalattentionalnetwork，HAN)重视文档中的局部语义，并采用双向门控循环单元(Gatedrecurrentneuralnetworks，GRU)学习单词和句子的表示形式。文档x由数个句子s组成，s由数个单词w组成，并且词w表示为固定维度的单词向量。通过文档级分布式表示可以有效地捕捉情感语义特征；
S3，通过参数迁移技术将源领域网络参数直接迁移到目标领域网络。在源领域DS上训练源领域网络最佳参数Ws，以最大程度地降低经验风险；使用目标领域带有标记训练数据对目标领域网络进行微调；
S4，将情感注意力视为一组映射，对分层注意力网络输入最重要的单词或句子经过编码以确定其最终输出。使用源领域带标签数据DS和目标领域带标签数据获取与文档中的情感类别相关的位置信息，将此类信息视为情感注意力，并通过编码和解码过程在DS和上共享它们。采用注意力共享机制，将情感注意力信息共享到未标记的目标领域数据
S5，在基于分层注意力机制的可迁移神经网络的训练阶段，源领域DS和目标领域带标签数据可以指导彼此的训练过程。训练过程采用小批量的梯度下降优化策略用于源领域DS和目标领域带标签数据

2.根据权利要求1所述的一种基于参数迁移和注意力共享机制的跨领域文本情感分类方法，其特征在于，所述步骤S1包括：
S11，对源领域带标签数据DS和目标领域带标签数据进行预处理，然后执行单词向量化。随后，构建分层注意力网络(Hierarchicalattentionalnetwork，HAN)模型，然后分别在源领域带标签数据DS和目标领域带标签数据上进行特征提取，以获得文本数据的分布式表示形式；
S12，词级匹配网络包括正向和反向门控循环单元层(Gatedrecurrentneuralnetwork，GRU)，这些层旨在获得句子的情感语义表示。同样，句子级网络包含正向和反向的门控循环单元层，可以通过引入句子级注意力来提供文档的最终表示。网络输出是积极或消极的文本情感倾向；
S13，在模型迁移方面，将源领域网络中双向门控循环单元层的参数迁移到目标领域网络。源领域网络和目标领域网络的分层的注意机制在训练过程中互相指导。源领域词级注意力和目标领域词级注意力可以共享；源领域句子级注意力和目标领域句子级注意力也可以共享。注意力共享机制在学习过程中不断减小不同领域中注意力向量之间的距离。

3.根据权利要求1所述的一种基于参数迁移和注意力共享机制的跨领域文本情感分类方法，其特征在于，所述步骤S2包括：
S21，单词序列和编码层。在第i个句子si中，
xit＝Ewit，t∈[1，...，N]

其中N是si中的单词数；
S22，单词注意力层。此发明引入注意机制来提取这些重要单词的...

【专利技术属性】
技术研发人员：赵传君，
申请(专利权)人：山西财经大学，
类型：发明
国别省市：山西;14

全部详细技术资料下载我是这个专利的主人