一种基于知识迁移的跨领域情感分析方法及存储介质技术

技术编号：37568308 阅读：11 留言：0更新日期：2023-05-15 07:47

本发明专利技术公开了一种基于知识迁移的跨领域情感分析方法及存储介质，为了解决数据标注困难的问题，通常需要将其他领域的知识迁移到目标领域来。迁移的方式有很多，有基于模型的，基于实例的，基于关系的，这些方式在深度学习的背景下得到了很大的发展。但是在迁移的过程中，总是忽略了外部知识库的作用，因此尝试运用外部知识库的知识加强迁移学习的效果成为一种新的方法。本发明专利技术方法包括：构建语义网络模块、特征提取模块、域对抗训练模块。将亚马逊的五个产品评论数据集进行处理，提取其中一些出现频率比较高的词语并与conceptNet连接，构成语义网络。再使用rgcn对语义网络进行处理，提取特征表示。最后加入域对抗训练来提高模型的鲁棒性。的鲁棒性。的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于知识迁移的跨领域情感分析方法及存储介质

[0001]本专利技术属于深度学习、自然语言处理，跨领域情感分析
，尤其是将外部常识知识加入到领域自适应模块，增强了跨领域情感分析模型的判别能力和鲁棒性。

技术介绍

[0002]传统的情感分析方法包括基于词典和非神经网络分类器方法。基于词典的方法指通过构建情感词典、提取情感值等来判断情感极性，并根据词典对句子进行分类。基于词典的方法易于操作，但它严重依赖于情感词典，忽略了词与词之间的位置关系。非神经网络分类器属于有监督机器学习方法。最常见的分类器是朴素贝叶斯(NB)、最大熵和支持向量机。这些分类器在不同的分类领域表现良好，如图像分类和文本分类。
[0003]深度学习在人工智能、计算机视觉和物联网等许多领域都发挥着重要作用。随着深度学习在自然语言处理领域的巨大发展，深度学习在情感分析中的应用越来越广泛。用于情感分析的神经网络模型分为三类，一是基于CNN的模型、二是基于RNN的模型以及混合神经网络模型。然而，深度学习方法需要大量的标注数据，在实际中很难对一个领域的数据进行大量标注，这个时候，迁移学习应运而生。
[0004]迁移学习可以从源任务中获取共享知识然后将其运用到目标任务的学习中，从而提高模型的泛化性能，并且减少目标任务所需大量标记数据带来的时间和资源的消耗。而适当的引入外部知识库能提高迁移模型的准确性和稳定性。

技术实现思路

[0005]本专利技术旨在解决以上现有技术的问题。提出了一种利用外部知识库的基于迁移学习的跨领域情感分析...

【技术保护点】

【技术特征摘要】
1.一种基于知识迁移的跨领域情感分析方法，其特征在于，包括以下步骤：构建语义网络，将精炼后的文本与conceptNet结合起来，构成一个语义网络；提取语义特征，通过RGCN对语义网络进行处理，得到图的特征表示；域对抗训练，包括特征提取器、域分类器和类别预测器，将两个毫不相关的领域之间的特征进行迁移学习。2.根据权利要求1所述一种基于知识迁移的跨领域情感分析方法，其特征在于：所述构建语义网络具体包括：1.1用一个三元组<节点1，关系，节点2>来表示图，提取评论集的关键信息，并将其设置为节点，观察与其他节点之间的关系；1.2将原始数据集进行处理，使用分词工具，将其划分为短语，并忽略去停词，得到第一精炼文本信息；1.3对步骤1.2中的第一精炼文本信息继续进行精炼提取，取出在文本中出现频率较高的词语，得...

【专利技术属性】
技术研发人员：孙开伟，李彦，冉雪，王支浩，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人