【技术实现步骤摘要】
基于Target
‑
Aspect
‑
Opinion联合抽取的短文本评论情感分析方法
[0001]本专利技术涉及人工智能、深度学习
,尤其涉及自然语言处理有关的研究和分析,具体涉及评论文本属性级别的情感分析,涉及一种基于Target
‑
Aspect
‑
Opinion联合抽取的短文本评论情感分析方法。
技术介绍
[0002]微博、论坛、购物网站等平台为用户提供了信息交流的空间,由此产生了海量有价值的用户评论信息。如汽车领域的用户评论数据不仅可以帮助汽车生产商改进汽车产品设计及营销策略,而且可以为用户购买汽车提供决策依据和参考信息。因此,基于细粒度的情感分析对于不同用户皆具有重要意义。传统的方面级别情感分析问题包括基于主题的情感分析(Aspect Based SentimentAnalysis,ABSA)和基于目标的情感分析(Target Based SentimentAnalysis,TBSA)。但是单独的基于主题(Aspect)或目标(Target) ...
【技术保护点】
【技术特征摘要】
1.一种基于Target
‑
Aspect
‑
Opinion联合抽取的短文本评论情感分析方法,其特征在于,包括以下步骤:步骤A:获取公开的评论文本数据,形成原始数据集C;步骤B:文本预处理;步骤C:为所述原始数据集C打上四元组标签;所述四元组标签为(评价对象Target,主题Aspect,评价短语Opinion,情感倾向Sentiment);步骤D:将联合抽取四元组任务转化联合抽取三元组任务,并映射为实体关系联合抽取任务;步骤E:构建基于Target
‑
Aspect
‑
Opinion的情感分析模型,并训练得到最终模型。2.如权利要求1所述的一种基于Target
‑
Aspect
‑
Opinion联合抽取的短文本评论情感分析方法,其特征在于,步骤B中所述文本预处理包括:步骤B1:探查分析数据集C中的过短文本,删除过短评论;步骤B2:去除情感句中冗余的标点符号;步骤B3:统计数据集C中的领域短语及中英文不一致表达,基于官方领域词典,归一化为标准表达;步骤B4:统计分析数据集C中的错别字表达,归一化为正确表达。3.如权利要求1所述的一种基于Target
‑
Aspect
‑
Opinion联合抽取的短文本评论情感分析方法,其特征在于,步骤C中为数据标注阶段,统一对经过步骤B预处理之后的数据集C进行四元组标注,所述数据标注的具体步骤包括:步骤C1:基于情感句标注所有存在的Aspect和当前Aspect对应的Sentiment;步骤C2:基于Aspect和Sentiment标注对应的Target和Opinion,若不存在,则标记为空;步骤C3:获得标注完成后的数据结构。4.如权利要求1所述的一种基于Target
‑
Aspect
‑
Opinion联合抽取的短文本评论情感分析方法,其特征在于,步骤D包括:步骤D1:将基于Target
‑
Aspect
‑
Opinion联合抽取的情感分析问题记作TAOBSA任务;步骤D2:将四元组U<Target,Aspect,Opinion,Sentiment>记作TAOBSA任务抽取得到的结果;步骤D3:TAOBSA任务中Target和Opinion为关键词抽取任务,Aspect和Sentiment为分类任务,联合抽取四元组U,将两个分类任务Aspect和Sentiment合并为一个分类任务,并用TOR表示;步骤D4:将四元组U映射为三元组U
’
,U中的Target映射为U
’
主实体Target,U中的Opinion映射为U
’
客实体Opinion,将两个分类任务Aspect和Sentiment合并为一个分类任务TOR映射为U
’
中的TOR,从而将TAOBSA任务的四元组抽取任务U转化成三元组U
’
<Target,TOR,Opinion>的抽取。5.如权利要求1所述的一种基于Target
‑
Aspect
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。