一种基于层次网络的领域自适应词嵌入的情感分析方法技术

技术编号：24756477 阅读：75 留言：0更新日期：2020-07-04 09:14

本发明专利技术涉及一种基于层次网络的领域自适应词嵌入的情感分析方法，预先获取文档级情感分析的用户评论数据集；对评论数据集进行无用字符清理；采用领域自适应词嵌入模块、双向长短期记忆网络以及注意力机制构建基于层次网络的领域自适应词嵌入的情感分析模型；对模型进行训练，数据沿着神经网络正向传播，所有网络在输出时进行多元信息的融合，反向传播时通过对损失函数求偏导对参数进行实时更新，在模型测试时利用训练过程中得到的已配置好参数的模型进行情感极性分析。本发明专利技术在传统情感分析的基础上，额外考虑了用户信息和产品信息，提高评论情感分析的效果；帮助商家和平台识别用户情感倾向，在电子商务领域有很广阔的应用前景。

An emotion analysis method based on hierarchical network for domain adaptive word embedding

全部详细技术资料下载

【技术实现步骤摘要】
一种基于层次网络的领域自适应词嵌入的情感分析方法
本专利技术属于文本情感分类
，具体涉及一种基于层次网络的领域自适应词嵌入的情感分析方法，特别适用于如影评、餐评等情感文本的文本情感分析。
技术介绍
随着现代化科学技术的不断发展，互联网已经成为现代人日常生活中必不可少的一部分,也成为当代人获取信息的最主要的来源,通过对情感文本进行处理可以更好的了解用户的情感倾向和关注要点，然而各大平台用户评价的不断激增致使以往对评论进行处理的方式成本消耗过大、错误率不容忽视，所以如何使用更先进的自动化分析工具对评论文本进行分析处理已经成为一个亟待解决的问题。粗粒度情感分析模型是指对整个句子和整个篇章进行分析，然而对于用户评论来讲，在评论时不但有评论文本，还包括一些用户信息和产品信息，目前的情感分析模型并未考虑将这些用户信息包括到建模过程中；同时文本包括词级、句级、篇章级等特征，现有模型无法捕捉多层次文本信息。
技术实现思路
专利技术目的：本专利技术提供一种基于层次网络的领域自适应词嵌入的情感分析方法，能帮助商...

【技术保护点】
1.一种基于层次网络的领域自适应词嵌入的情感分析方法，其特征在于，包括以下步骤：/n(1)预先获取文档级情感分析的用户评论数据集；/n(2)对评论数据集统一格式并进行无用字符清理；/n(3)采用领域自适应词嵌入模块、双向长短期记忆网络以及注意力机制构建基于层次网络的领域自适应词嵌入的情感分析模型；/n(4)对模型进行训练，数据沿着神经网络正向传播，所有网络在输出时进行多元信息的融合，反向传播时通过对损失函数求偏导对参数进行实时更新，在模型测试时利用训练过程中得到的已配置好参数的模型进行情感极性分析。/n

【技术特征摘要】
1.一种基于层次网络的领域自适应词嵌入的情感分析方法，其特征在于，包括以下步骤：
(1)预先获取文档级情感分析的用户评论数据集；
(2)对评论数据集统一格式并进行无用字符清理；
(3)采用领域自适应词嵌入模块、双向长短期记忆网络以及注意力机制构建基于层次网络的领域自适应词嵌入的情感分析模型；
(4)对模型进行训练，数据沿着神经网络正向传播，所有网络在输出时进行多元信息的融合，反向传播时通过对损失函数求偏导对参数进行实时更新，在模型测试时利用训练过程中得到的已配置好参数的模型进行情感极性分析。

2.根据权利要求1所述的一种基于层次网络的领域自适应词嵌入的情感分析方法，其特征在于，所述步骤(2)实现过程如下：
将情感数据集表示为G＝[(t1,y1),(t2,y2),…,(tn,yn)]，其中ti表示数据集中第i个样本，yi是样本对应的标签，n是样本的总数；ti表示为{ui,pi,di}的形式，其中ui代表对应的用户信息，pi代表对应的产品信息，di代表对应的文本信息。

3.根据权利要求1所述的一种基于层次网络的领域自适应词嵌入的情感分析方法，其特征在于，所述步骤(3)包括以下步骤：
(31)将步骤(2)中处理好的评论文本...

【专利技术属性】
技术研发人员：李欣栩，杨春霞，张贺舒，瞿涛，吴佳君，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人