一种基于深度表示学习的实体情感分析方法技术

技术编号：27006817 阅读：16 留言：0更新日期：2021-01-08 17:10

本发明专利技术公开了一种基于深度表示学习的实体情感分析方法，依序采用ELMo模型、BERT模型以及ALBERT模型进行预训练，得到基于这三个模型的预训练词向量；经过步骤2产生的预训练词向量作为BiLSTM层的输入，将最终迭代结束后的隐层作为本层的输出；利用attention层计算句子s中每个词与其他所有词注意力得分，来判断该词与其他词语的关系权重；依据得到attention层的结果将对应隐层输入分类器中；并计算情感类别的概率，并将分类结果通过输出层输出最终结果。与现有技术相比，本发明专利技术提高了基于实体属性的情感识别的准确率；让模型在中文数据集上的表现得到了提升；强化了模型的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度表示学习的实体情感分析方法
本方法涉及自然语言处理和机器学习领域，特别是涉及一种基于实体属性提取识别的情感分析方法。
技术介绍
情感分析是自然语言处理领域较为基础但又十分必要的一项任务，是对用户参与的、对于诸如人物、事件、产品等有价值的评论信息中带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。在传统文本情感分析技术中，单纯地将句子中情感词加以区分来判断句子的情感极性，例如出现“高兴”等正向词就会认为这句话是正向情感，出现“讨厌”等负向词会认为带有负面情感，其他则认为是中立状态。现阶段情感分析的研究主要集中在以下三个方面：(1)篇章级。篇章级情感分析认为每一篇文档都表达了作者对某一个特定对象的情感倾向，从整体上对文本的情感倾向进行分析。主要应用在用户评论，新闻和微博等文本分析领域。(2)句子级。篇单独的文档中可能包含作者对同一事物的多种观点，为了更细粒度的挖掘不同观点，就需要进行句子级的情感分析。句子级别的情感分析，一般的做法是先将句子分为主观句和客观句，然后再对主观句的情感倾向做出判断。(3)词级。词级的情感分析，就是判断出该词是褒义词、贬义词或是中性词。词级情感分析中，情感倾向的判别方法主要有基于语料库的方法和基于词典的方法两种。而随着文本量扩大和句子规模增加，一段话中可能出现多个实体对应的多个不同情感，而现实生活中往往需要针对某一特定实体进行分析，这时就需要排除其他实体评价的干扰。由此就提出了基于实体的情感分析来解决同一句话中出现多个实体的情况。例如“我买了一个新相机，它的画...

【技术保护点】
1.一种基于深度表示学习的实体情感分析方法，其特征在于，该方法具体包括以下流程：/n步骤1、判断句子的实体属性，将给定长度n的句子s的输入序列表示为s＝{t

【技术特征摘要】
1.一种基于深度表示学习的实体情感分析方法，其特征在于，该方法具体包括以下流程：
步骤1、判断句子的实体属性，将给定长度n的句子s的输入序列表示为s＝{t1,t2,...,a1,a2,...,tn}，每个句子由一系列的词语ti组成，将句子s中包括实体属性情感目标词表示为a1、a2，每个句子包含有一个或多个实体情感目标词；首先识别句子s中不同的实体情感词，所述实体情感词涵盖“外观”、“拍照”、“屏幕”、“待机时间”、“运行速度”这五个方面的实体属性，并根据所识别到的实体属性划分成不同句子，每个句子的输入序列均将实体属性前置，后再接输入的句子s，形成每一个实体属性对应的输入序列s＝{a|t1,t2,...,a,...,tn}，其中a表示该句实体属性词，ti表示第i个词语；
步骤2、在得到每一个实体属性对应的输入序列后，依序将输入序列s中的实体属性词和语料内容分别输入ELMo模型和BERT模型以及ALBERT模型，得到基于这三个模型的预训练词向量，并且分别利用三种预训练模型生成的词向量输入到下游模型中分别进行预测，生成基于三个预训练模型的不同预测结果；输入到下游模型之前，判断基于哪一种预训练模型生成的词嵌入；
步骤3、经过步骤2产生的预训练词向量作为BiLSTM层的输入，其输出的隐层中包含一定的上下文语义信息...

【专利技术属性】
技术研发人员：张翔，王赞，贾勇哲，马国宁，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人