基于图对比学习的未知目标立场检测方法、装置制造方法及图纸

技术编号:37880050 阅读:9 留言:0更新日期:2023-06-15 21:08
本发明专利技术提供了一种基于图对比学习的未知目标立场检测方法、装置,其中方法包括以下步骤:1)采集社交网络文本数据;2)在采集的数据基础上进行数据增强形成增强辅助文本;每个主题文本、评论文本、立场标签及其构造的增强辅助文本构成一个训练样本,按照该方式组织所有文本构建训练集;3)建立未知目标立场检测模型,输出评论文本对主题文本所持立场的预测概率;4)通过训练集训练未知目标立场检测模型,直至收敛得到未知目标立场预测模型;5)将需要预测的主题文本、评论文本、所得增强辅助文本输入训练好的未知目标立场预测模型,输出评论文本对主题文本所持立场的概率。本发明专利技术可以很好的处理未知目标立场预测任务。好的处理未知目标立场预测任务。好的处理未知目标立场预测任务。

【技术实现步骤摘要】
基于图对比学习的未知目标立场检测方法、装置


[0001]本专利技术涉及数据挖掘分析
,具体涉及一种基于图对比学习的未知目标立场检测方法、装置。

技术介绍

[0002]文本立场检测,也称为立场分类或立场识别,是指从用户发表的文本中自动判断其对于预先给定目标的立场。文本立场检测与文本情感分析是文本意见挖掘领域的重要研究方向,与文本情感分析不同的是,文本立场检测需要判别表达方式更为复杂的“支持、反对或中立”的立场,而不是对指定对象的积极或消极的情感极性。
[0003]传统特定目标的立场检测,更多的是针对单一目标立场检测的,是指给定单一的文本(推特、微博、新闻文章、辩论文本等)以及目标,需要确定文本对给定的目标的态度是支持、反对或者中立,即假设训练集和测试集中存在着相同目标的数据。然而,实际中收集所有目标主题的数据用于训练是不可行的,总是存在大量的未出现过目标的数据,且针对一个新的目标话题,获取其高质量的标签往往是很昂贵的,因此研究自适应未知目标的未知目标立场检测至关重要。

技术实现思路

[0004]本专利技术要解决的技术问题是:提供一种基于图对比学习的未知目标立场检测方法,通过采集社交网络文本数据,得到评论文本对主题文本所持立场的概率。
[0005]本专利技术解决上述技术问题所采用的技术方案是:一种基于图对比学习的未知目标立场检测方法,包括以下步骤:
[0006]1)采集数据:采集社交网络文本数据,社交网络文本数据包括讨论的主题文本及用户对该主题的评论文本。
[0007]2)在采集的数据基础上进行数据增强形成增强辅助文本;每个主题文本、评论文本、立场标签及其构造的增强辅助文本构成一个训练样本,按照该方式组织所有文本构建训练集;
[0008]3)建立未知目标立场检测模型,输出评论文本对主题文本所持立场的预测概率;
[0009]4)通过训练集训练未知目标立场检测模型,直至未知目标立场检测模型收敛得到未知目标立场预测模型;
[0010]5)将需要预测的主题文本、评论文本、所得增强辅助文本组成样本三元组后输入训练好的未知目标立场预测模型,输出评论文本对主题文本所持立场的概率。
[0011]优选的,所述增强辅助文本包括第一辅助文本和第二辅助文本;对每个评论文本掩码其内容中关键词构造第一辅助文本,对每个评论文本掩码其内容中的非关键词构造第二辅助文本;
[0012]有立场标签的已知话题目标数据集合为即训练集;无立场标签的未知目标数据集合即测试集;其中
是已知话题目标中有标记样例的立场标签,和分别为掩盖掉内容关键词的第一辅助文本和掩盖掉内容非关键词的第二辅助文本,N
s
和N
d
分别为已知目标和未知目标的样本个数,使用已知话题目标数据集合中关于已知话题目标的每一个句子训练未知目标立场检测模型,使得该未知目标立场检测模型泛化到新出现的未知目标数据集合上,预测关于未知目标的句子的立场。
[0013]优选的,所述未知目标立场检测模型基于图对比学习,所述未知目标立场检测模型包括特征编码模块和句法表征及语义表征提取模块;
[0014]特征编码模块:将所述主题文本、评论文本和/或增强辅助文本作为输入,输出主题文本、评论文本和/或增强辅助文本的特征和句法结构图;
[0015]句法表征及语义表征提取模块包括句法表征提取模块和语义表征提取模块,
[0016]对每个评论文本掩码其内容中关键词构造第一辅助文本,将获得的掩盖关键词的第一辅助文本以及句法结构图作为句法表征提取模块的输入,句法表征提取模块输出句法模式特征;
[0017]对每个评论文本掩码其内容中的非关键词构造第二辅助文本;将获得的掩盖非关键词的第二辅助文本以及句法结构图作为语义表征提取模块的输入,语义表征提取模块输出语义表征特征。
[0018]优选的,所述未知目标立场检测模型还包括全局语义重建模块、立场检测模块;
[0019]全局语义重建模块:将获得的句法模式特征和语义表征特征作为输入,输出句法与语义的融合特征;
[0020]立场检测模块:将获得的句法与语义的融合特征作为输入,输出评论文本对主题文本所持立场的预测概率。
[0021]优选的,所述特征编码模块学习文本的向量化特征表示;若是单个的文本r,将其构造为“[CLS]r[SEP]”格式输入给特征编码模块;若是针对主题目标t的评论x,则其将每个样例构造为"[CLS]t[SEP]x[SEP]"格式输入给特征编码模块,得到[CLS]标记隐藏层的d
m
维向量作为输入的特征表示,以及输入句子x所有单词在最后一层隐藏层的特征矩阵
[0022]z,Z=f
θ
(x)=BERT
base
([CLS]t[SEP]r[SEP][0023]在一个训练批中,所有样例的特征表示可定义为N
b
为训练批的大小。
[0024]优选的,所述句法表征及语义表征提取模块中,所述句法表征提取模块和语义表征提取模块分别将文本结构分解为句法表征结构图和语义表征结构图,分别从目标无关特征和目标依赖特征的角度对文本语义进行表示。
[0025]优选的,所述句法表征及语义表征提取模块中,基于句法依存树为每个句子构造图,以捕获句子中的词之间依赖关系;每个句子的邻接矩阵可以表示为:
[0026][0027]其中,A
i,j
为邻接矩阵第i行第j列的状态,x(w
i
,w
j
)表示句子x的句法依存树中单词
w
i
与单词w
j
有边相连。
[0028]优选的,所述句法表征及语义表征提取模块中,掩码关键词的句子与邻接矩阵A构成了“句法表征结构图”;掩码非关键词的句子与邻接矩阵A构成了“语义表征结构图”;
[0029][0030][0031]其中,分别为“句法表征结构图”的初始特征矩阵和“语义表征结构图”的初始特征矩阵,分别对应句法表征结构图中结点的特征向量和语义表征结构图中结点的特征向量。
[0032]优选的,所述句法表征及语义表征提取模块中,将“句法表征结构图”的特征矩阵和归一化的邻接矩阵输入GCN模块(图卷积神经网络模块)获取上下文中目标无关的句法特征矩阵;
[0033][0034]其中,为句法结构第l层卷积的特征矩阵,D为度矩阵,D为度矩阵,为可训练的权重矩阵;
[0035]将“语义表征结构图”的特征矩阵和归一化的邻接矩阵输入GCN模块获取上下文中主题目标依赖的语义特征矩阵;
[0036][0037]其中,为语义结构第l层卷积的特征矩阵。
[0038]已知主题目标t的特征为采用基于检索的注意力机制学习句法特征矩阵与特定目标的关系度。
[0039][0040][0041]其中,α
j
为的第j个特征对的注意力,T表示向量的转置操作,为可学习的参数。进而,我们计算得到代表句法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图对比学习的未知目标立场检测方法,其特征在于:包括以下步骤:1)采集数据:采集社交网络文本数据,社交网络文本数据包括讨论的主题文本及用户对该主题的评论文本。2)在采集的数据基础上进行数据增强形成增强辅助文本;每个主题文本、评论文本、立场标签及其构造的增强辅助文本构成一个训练样本,按照该方式组织所有文本构建训练集;3)建立未知目标立场检测模型,输出评论文本对主题文本所持立场的预测概率;4)通过训练集训练未知目标立场检测模型,直至未知目标立场检测模型收敛得到未知目标立场预测模型;5)将需要预测的主题文本、评论文本、所得增强辅助文本组成样本三元组后输入训练好的未知目标立场预测模型,输出评论文本对主题文本所持立场的概率。2.根据权利要求1所述的基于图对比学习的未知目标立场检测方法,其特征在于:所述增强辅助文本包括第一辅助文本和第二辅助文本;对每个评论文本掩码其内容中关键词构造第一辅助文本,对每个评论文本掩码其内容中的非关键词构造第二辅助文本;有立场标签的已知话题目标数据集合为即训练集;无立场标签的未知目标数据集合即测试集;其中是已知话题目标中有标记样例的立场标签,和分别为掩盖掉内容关键词的第一辅助文本和掩盖掉内容非关键词的第二辅助文本,N
s
和N
d
分别为已知目标和未知目标的样本个数,使用已知话题目标数据集合中关于已知话题目标的每一个句子训练未知目标立场检测模型,使得该未知目标立场检测模型泛化到新出现的未知目标数据集合上,预测关于未知目标的句子的立场。3.根据权利要求1所述的基于图对比学习的未知目标立场检测方法,其特征在于:所述未知目标立场检测模型基于图对比学习,所述未知目标立场检测模型包括特征编码模块和句法表征及语义表征提取模块;特征编码模块:将所述主题文本、评论文本和/或增强辅助文本作为输入,输出主题文本、评论文本和/或增强辅助文本的特征和句法结构图;句法表征及语义表征提取模块包括句法表征提取模块和语义表征提取模块,对每个评论文本掩码其内容中关键词构造第一辅助文本,将获得的掩盖关键词的第一辅助文本以及句法结构图作为句法表征提取模块的输入,句法表征提取模块输出句法模式特征;对每个评论文本掩码其内容中的非关键词构造第二辅助文本;将获得的掩盖非关键词的第二辅助文本以及句法结构图作为语义表征提取模块的输入,语义表征提取模块输出语义表征特征。4.根据权利要求3所述的基于图对比学习的未知目标立场检测方法,其特征在于:所述未知目标立场检测模型还包括全局语义重建模块、立场检测模块;全局语义重建模块:将获得的句法模式特征和语义表征特征作为输入,输出句法与语义的融合特征;立场检测模块:将获得的句法与语义的融合特征作为输入,输出评论文本对主题文本
所持立场的预测概率。5.根据权利要求3所述的基于图对比学习的未知目标立场检测方法,其特征在于:所述特征编码模块学习文本的向量化特征表示;若是单个的文本r,将其构造为“[CLS]r[SEP]”格式输入给特征编码模块;若是针对主题目标t的评论x,则其将每个样例构造为"[CLS]t[SEP]x[SEP]"格式输入给特征编码模块,得到[CLS]标记隐藏层的d
m
维向量作为输入的特征表示,以及输入句子x所有单词在最后一层隐藏层的特征矩阵z,Z=f
θ
(x)=BERT
base
([CLS]t[SEP]r[SEP])在一个训练批中,所有样例的特征表示可定义为N
b
为训练批的大小。6.根据权利要求3所述的基于图对比学习的未知目标立场检测方法,其特征在于:所述句法表征及语义表征提取模块中,所述句法表征提取模块和语义表征提取模块分别将文本结构分解为句法表征结构图和语义表征结构图,分别从目标无关特征和目标依赖特征的角度对文本语义进行表示。7.根据权利要求3所述的基于图对比学习的未知目标立场检测方法,其特征在于:所述句法表征及语义表征提取模块中,基于句法依存树为每个句子构造图,以捕获句子中的词之间依赖关系;每个句子的邻接矩阵可以表示为:其中,A
i,j
为邻接矩阵第i行第j列的状态,x(w
i

【专利技术属性】
技术研发人员:赵学臣周斌王晔李爱平江荣涂宏魁田磊邹家英汪海洋伍泓舟
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1