【技术实现步骤摘要】
一种基于混合神经网络的可解释中文评论情感分析方法
[0001]本专利技术涉及一种基于混合神经网络的可解释中文评论情感分析方法,属于情感分析
技术介绍
[0002]随着互联网的高速发展,电子商务逐渐融入人们的日常生活,电商平台上积累了分布广泛且数量庞大的用户评论数据。通过分析用户评论,商家可以了解人们对产品的满意度,及时知晓市场动态,且及时了解用户的喜好情感,有助于商家推出新的产品,改进自身的服务。因此在各大平台分析用户评论中的情感色彩和具有倾向性的言论,对商家而言具有重要意义。然而,由于用户评论数量庞大,商家很难直接从众多评论中获取有效信息,因此需要借助人工智能技术从众多评论中挖掘有用的信息。近年来,深度学习在自然语言处理领域取得了很好的效果,一些基本的方向包括词向量化,分词,词性标注,命名实体识别,文本结构化等研究逐渐成熟,可以直接被用于一些基础的文本处理任务,诸如快递地址自动识别与填充,文本文件的分类,文章标签与摘要提取,标题生成等。研究发现,在众多情感分析算法中,基于深度学习的情感分析算法因为可以利用上下文信 ...
【技术保护点】
【技术特征摘要】
1.一种基于混合神经网络的可解释中文评论情感分析方法,其特征在于,所述方法包括以下步骤:(1)获取训练样本集:所述训练样本集来源于电商平台商品评论,(2)数据预处理:对获取到的评论进行去重,清洗,分词,(3)构建模型:分别构建分析器MacBERT
‑
TextCNN模型和解释生成器RCNN模型,(4)联合训练分析器和解释生成器:输入样本数据联合训练分析器与解释生成器。2.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法,其特征在于,其中获取训练样本集包括:利用网络爬虫爬取电商平台长度超过5个字的评论,评分小于3分的评论划为差评集,评分等于3分评论的划为中评集,评分超过3分的评论划为好评集。3.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法,其特征在于,其中数据预处理包括:先去除系统的默认好评,再清洗掉评论中的表情、颜文字、标点符号,然后利用比较删除法去除重复的文本,之后再删除清洗后长度小于5的评论,最后利用jieba第三方库进行分词。4.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法,其特征在于,其中构建分析器包括:先利用MacBERT捕捉底层语义语法信息,获取文本表示,然后使用TextCNN对文本进行特征提取后输入到全连接的Softmax层得到输出。5.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法,其特征在于,其中构建解释生成器包括:解释生成器为两层...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。