一种基于胶囊网络的多目标细粒度立场分析方法技术

技术编号：41201172 阅读：4 留言：0更新日期：2024-05-07 22:27

本发明专利技术提供一种基于胶囊网络的多目标细粒度立场分析方法，包括如下步骤：抽取贴文文本集中每条贴文文本包含的目标词并进行拼接，得到拼接文本集合；构造胶囊网络作为立场分类模型，并将拼接文本集合输入胶囊网络进行立场分析；所述胶囊网络包括编码层、初级胶囊层和立场类别胶囊层。本发明专利技术一方面融合方面词抽取和立场分析方法，解决了现有立场分析模型需要事先指定目标，无法自动识别目标进行多目标立场分析的问题，提升了立场分析模型的适用范围和精准度；另一方面基于胶囊网络来提取文本与目标词之间的深层语义特征并采用基于先验知识构造立场词典来引导动态路由过程，提升了特征提取的准确性，从而提升了立场分析模型的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及立场分析，具体而言，涉及一种基于胶囊网络的多目标细粒度立场分析方法。

技术介绍

1、目前的立场分析算法大多需要事先指定立场分析的主题和目标，然后分析贴文文本对指定主题或者目标的立场，然而在实际的立场分析任务中，同一条贴文中会出现多个目标或者多个主题，例如“我觉得这家餐厅的环境很不错，但是餐厅服务很一般，经常喊好久服务员才来，菜品方面红烧肉做的很好吃，但是麻婆豆腐很一般”，这段文本对餐厅的环境、红烧肉是正面立场，但是对餐厅服务和麻婆豆腐是负面立场。现有的立场分析算法在分析时一般指定的目标为餐厅，由于该贴文对餐厅的不同方面具有正面和负面两种立场，因此采用现有算法则无法准确判断该贴文发布者对餐厅的立场。

2、现有立场分析算法的一般流程为：首先采用bert（bidirectional encoderrepresentations from transformers，基于transformers模型的双向编码器表示）等预训练语言模型来表征贴文的语义信息，然后基于bert表征的文本向量直接构建分类模型实现立场分析；或者首先基于bert等预训练预研模型表征文本，然后基于lstm（long short-term memory，长短期记忆网络）、gru（gate recurrent unit，门控循环单元）等神经网络模型提取文本语义特征，最后构建立场分类模型实现立场分类。以上述例子为例，在实际的立场分析任务中，一般是根据描述词“不错，好吃”来分别判断该贴文对餐厅服务、红烧肉的立场为正面，而直接基于bert或者基于现有语义

技术实现思路

1、本专利技术旨在提供一种基于胶囊网络的多目标细粒度立场分析方法，以解决现有立场分析算法需要事先指定目标，无法自动识别目标并进行多目标细粒度立场分析的问题，以及直接基于bert或者基于现有语义特征提取方法构造的立场分析算法在实际应用时无法提取文本的深层语义特征，并且存在训练难度较大、泛化性和可解释性差的问题。

2、本专利技术提供的一种基于胶囊网络的多目标细粒度立场分析方法，包括如下步骤：

3、抽取贴文文本集中每条贴文文本包含的目标词并进行拼接，得到拼接文本集合；

4、构造胶囊网络作为立场分类模型，并将拼接文本集合输入胶囊网络进行立场分析；所述胶囊网络包括编码层、初级胶囊层和立场类别胶囊层。

5、进一步的，所述抽取贴文文本集中每条贴文文本包含的目标词并进行拼接包括：

6、利用经过微调的通用信息抽取模型抽取贴文文本集中每条贴文文本包含的目标词，得到每条贴文文本的目标词列表；

7、利用sep符号将每个目标词和该贴文文本进行拼接，得到“贴文文本sep目标词”形式的拼接文本集合。

8、进一步的，所述微调的通用信息抽取模型是指，将经过标注的目标词抽取数据集输入通用信息抽取模型进行微调训练，更新通用信息抽取模型参数，得到在当前领域下抽取精准度更高的信息抽取模型。

9、进一步的，所述编码层中：利用roberta模型对拼接文本集合中的每条拼接文本和相应的目标词进行向量化表征，得到拼接文本向量以及目标词向量，并对目标词向量进行平均池化。

10、进一步的，所述初级胶囊层中：

11、首先利用线性变换和平方激活函数分别处理拼接文本向量和经过平均池化的目标词向量，得到初级胶囊和目标胶囊；

12、然后利用目标胶囊来选择重要的初级胶囊作为主胶囊；

13、最后对主胶囊的权重进行归一化，得到主胶囊的归一化权重。

14、进一步的，所述初级胶囊和目标胶囊的计算方式如下：

15、

16、

17、其中，表示对拼接文本向量处理得到的的初级胶囊，表示对目标词向量处理得到的目标胶囊，、、、是可学习的参数，为平方激活函数。

18、进一步的，所述平方激活函数定义为：

19、

20、其中，是一个可学习的尺度参数。

21、进一步的，所述归一化权重的计算方式为：

22、

23、其中，表示主胶囊的归一化权重，表示第个主胶囊，为主胶囊数量，是可学习的参数。

24、进一步的，所述立场类别胶囊层中：

25、在训练立场分类模型时，首先根据立场先验知识构造立场词典，并利用立场词的平均嵌入向量作为初始化向量构建立场矩阵；然后对立场矩阵进行平方激活得到立场胶囊，最后根据主胶囊和立场胶囊之间的相似度来计算路由权重；

26、在加载立场分类模型并判断贴文文本对目标词的立场时，根据主胶囊、归一化权重和路由权重，计算最终的立场类别。

27、进一步的，所述立场类别胶囊层的计算方式如下：

28、

29、

30、

31、

32、

33、其中，表示立场词典，为立场类别的立场词列表，为立场类别的立场词列表，为立场类别数量，为立场矩阵，为第个主胶囊的立场矩阵，为立场词嵌入向量的维度，表示由第个主胶囊得到的立场胶囊，表示第个主胶囊的归一化权重，表示从第个主胶囊到第个立场胶囊的路由权重，表示立场类别，是可学习的参数。

34、综上所述，由于采用了上述技术方案，本专利技术的有益效果是：

35、1、本专利技术融合方面词抽取和立场分析方法，构造了一种端到端的细粒度立场分析方法，解决了现有立场分析模型需要事先指定目标，无法自动识别目标进行多目标立场分析的问题，提升了立场分析模型的适用范围和精准度。

36、2、本专利技术基于胶囊网络来提取文本与目标词之间的深层语义特征并采用基于先验知识构造立场词典来引导动态路由过程，提升了特征提取的准确性，从而提升了立场分析模型的准确率。

本文档来自技高网...

【技术保护点】

1.一种基于胶囊网络的多目标细粒度立场分析方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述抽取贴文文本集中每条贴文文本包含的目标词并进行拼接包括：

3.根据权利要求2所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述微调的通用信息抽取模型是指，将经过标注的目标词抽取数据集输入通用信息抽取模型进行微调训练，更新通用信息抽取模型参数，得到在当前领域下抽取精准度更高的信息抽取模型。

4.根据权利要求2所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述编码层中：利用RoBERTa模型对拼接文本集合中的每条拼接文本和相应的目标词进行向量化表征，得到拼接文本向量以及目标词向量，并对目标词向量进行平均池化。

5.根据权利要求4所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述初级胶囊层中：

6.根据权利要求5所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述初级胶囊和目标胶囊的计算方式如下：

7.根据权利要求6

8.根据权利要求7所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述归一化权重的计算方式为：

9.根据权利要求8所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述立场类别胶囊层中：

10.根据权利要求9所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述立场类别胶囊层的计算方式如下：

...

【技术特征摘要】

1.一种基于胶囊网络的多目标细粒度立场分析方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述抽取贴文文本集中每条贴文文本包含的目标词并进行拼接包括：

4.根据权利要求2所述的基于胶囊网络的多目标细粒度立场分析方法，其特征在于，所述编码层中：利用roberta模型对拼接文本集合中的每条拼接文本和相应的目标词进行向量化表征，得到拼接文本向量以及目标词向量，并对目标词向量进行...

【专利技术属性】
技术研发人员：曾曦，刘锟，尚钰，王效武，王海兮，郭兴文，肖宁，韩霄龙，
申请(专利权)人：中国电子科技集团公司第三十研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人