【技术实现步骤摘要】
融合词性信息的方面级情感三元组抽取方法
[0001]本专利技术涉及融合词性信息的方面级情感三元组抽取方法,属于情感分析
技术介绍
[0002]方面级情感三元组抽取(aspect sentiment triplet extraction,ASTE)是最近提出的ABSA子任务,旨在抽取输入句中的情感三元组(方面词,观点词,情感极性)。针对此任务,Peng等人提出了一种两阶段流水线式方法,第一阶段使用两个序列标注器,一个用来联合抽取方面词
‑
情感极性,另一个用来抽取观点词,然后,第二阶段利用方面词和观点词之间的位置信息将二者联系起来从而确定它们的情感极性配对关系,实现情感三元组抽取。Xu等人采取了新颖的位置感知标记方案,该方案能够指定三元组的结构信息,通过标签语义来实现三个元素之间的连接。Xu等人考虑到方面词和观点词可能由多个单词组成,提出了一种基于跨度的ASTE模型(Span ASTE),该模型首次在预测方面词和观点词对的情感关系时直接捕获跨度到跨度的交互。这些方法在ASTE任务上均取得了可观的效果, ...
【技术保护点】
【技术特征摘要】
1.融合词性信息的方面级情感三元组抽取方法,其特征在于:所述融合词性信息的方面级情感三元组抽取方法的具体步骤如下:Step1、基于文本的词向量表示及其对应的词性向量表示,将二者融合;Step2、获得含有词性信息的融合特征表示;Step3、将融合特征表示输入多任务学习网络预测三元组,即以词性信息为引导,并行完成方面词抽取、观点词抽取、情感极性解析;Step4、三元组解码,根据启发式规则生成三元组跨度表示。2.根据权利要求1所述的融合词性信息的方面级情感三元组抽取方法,其特征在于:所述Step1中,使用预训练模型GloVe将输入句中的各个单词映射到一个低维向量空间,获得对应的词向量表示其中d是词向量的维度;对于输入序列首先,使用NLTK词性标注器pos_tag为其中的每个单词标注词性标签,然后,给每个词性标签分配一个词性向量d为词性向量的维度,与词向量维度一致;最后,将每个单词的词性向量与词向量拼接得到融合特征的向量表示f
i
。3.根据权利要求1所述的融合词性信息的方面级情感三元组抽取方法,其特征在于:所述Step2中,得到融合特征的向量表示f
i
之后,使用Bi
‑
LSTM网络来获取含有上下文信息的表示随后,通过一个线性层和一次非线性变换,实现降维的同时获取方面词和观点词的特征表示;在此,未将隐藏层向量直接输入模型下一阶段的原因有两个:其一,隐藏层状态的特征包含计算冗余信息,有过拟合的风险;其二,该操作可剔除与方面词和观点词无关的特征。4.根据权利要求1所述的融合词性信息的方面级情感三元组抽取方法,其特征在于:所述Step3中,多任务学习网络架构包括两个部分:方面词和观点词的抽取,以及词级情感依赖解析;抽...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。