一种基于注意力机制的实体方面级情感分析方法技术

技术编号:26171195 阅读:22 留言:0更新日期:2020-10-31 13:42
本发明专利技术涉及自然语言处理的情感分析领域,其公开了一种基于注意力机制的实体方面级情感分析方法,提高方面级情感分析的准确性。该方法包括以下步骤:S1、爬取分析对象的用户评论数据;S2、对爬取到的用户评论数据进行预处理;S3、采用基于历史感知注意力机制的属性词提取方法对评论数据进行属性词提取;S4、采用基于BERT和层次注意力机制的方面级情感分析方法获取属性词对应的方面类别及情感极性。

【技术实现步骤摘要】
一种基于注意力机制的实体方面级情感分析方法
本专利技术涉及自然语言处理的情感分析领域,特别涉及一种基于注意力机制的实体方面级情感分析方法。
技术介绍
随着社交网络的快速发展,大量用户针对各种事物发表了具有不同情感倾向的内容,将这些文本数据进行情感分析并统计,在社会和商业等领域都具有重要意义。情感分析是研究社交网络中人们对其事件、产品、服务、话题等的情感极性,极性最初包括积极、消极和中立三个类别,后续发展出了更多细粒度的分类。目前情感分析的一个研究重点是细粒度的方面级情感分析,实体方面级情感分析结合了属性词和方面对作为情感分析对象,即对于给定的属性词所属的方面一一进行情感分类。早期情感分析研究使用基于词典和规则的方法和基于传统机器学习的方法,但其在处理更加细粒度的方面级情感分析问题中不尽人意。随着深度学习相关研究的发展,循环神经网络模型具有灵活的计算步骤,其输出依赖于之前的计算,这使得它能够捕获语言中的上下文依赖关系,并能够对各种文本长度建模。但传统的编解码器框架存在一个潜在的问题,编码器可能会对不相关的信息进行编码,特别是在输入信息非常本文档来自技高网...

【技术保护点】
1.一种基于注意力机制的实体方面级情感分析方法,其特征在于,包括以下步骤:/nS1、爬取分析对象的用户评论数据;/nS2、对爬取到的用户评论数据进行预处理;/nS3、采用基于历史感知注意力机制的属性词提取方法对评论数据进行属性词提取;/nS4、采用基于BERT和层次注意力机制的方面级情感分析方法获取属性词对应的方面类别及情感极性。/n

【技术特征摘要】
1.一种基于注意力机制的实体方面级情感分析方法,其特征在于,包括以下步骤:
S1、爬取分析对象的用户评论数据;
S2、对爬取到的用户评论数据进行预处理;
S3、采用基于历史感知注意力机制的属性词提取方法对评论数据进行属性词提取;
S4、采用基于BERT和层次注意力机制的方面级情感分析方法获取属性词对应的方面类别及情感极性。


2.如权利要求1所述的一种基于注意力机制的实体方面级情感分析方法,其特征在于,
步骤S1具体包括:
S11、利用scrapy爬虫框架爬取网页源码;
S12、构造正则表达式对采集到的源码进行解析获取数据;
S13、将爬取到的数据存入数据库。


3.如权利要求1所述的一种基于注意力机制的实体方面级情感分析方法,其特征在于,
步骤S2具体包括:
S21、进行数据清洗:拼写检查更正、去除非文本信息、大小写转化和丢弃无效数据;
S22、将经过清洗后的数据处理为下游模型要求的输入格式:对清洗后的数据中的每个单词进行BIO标记,最终将数据处理成BIO序列,作为下游模型的输入序列。


4.如权利要求1所述的一种基于注意力机...

【专利技术属性】
技术研发人员:田玲卢国明段贵多罗光春申梦绮张伟
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1