当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于多层次知识选择的零样本立场检测装置及方法制造方法及图纸

技术编号:38586410 阅读:22 留言:0更新日期:2023-08-26 23:28
本发明专利技术公开一种基于多层次知识选择的零样本立场检测装置及方法,包括多层次知识选择模块和零样本立场检测模块;多层次知识选择模块内设有知识选择模型,知识选择模型依次由输入层、编码层、上下文层、注意力层和输出层组成;知识选择模型用于匹配深层和浅层的语义信息,以通过提取句子间的交互关系及单个句子中词与词的交互关系来获得零样本立场检测所需的深层知识;将知识、目标、论点共同输入到零样本立场检测模块中完成零样本立场检测,使用已获得的深层知识作为辅助信息进行零样本立场检测。检测。检测。

【技术实现步骤摘要】
一种基于多层次知识选择的零样本立场检测装置及方法


[0001]本专利技术涉及文本意见挖掘领域中语义匹配和零样本学习的立场检测方向,特别是涉及一种基于多层次知识选择的零样本立场检测方法。

技术介绍

[0002]随着互联网的飞速发展,用户对于公共事件或意见等讨论文本的场景增加,文本立场是文本作者表露出的对于特定目标的认识或处理问题时所持有的态度,目标主要包括人物、组织、政策等,立场检测是指从用文本中判断其对于预先给定目标的立场,目标可以是单目标、多目标、跨目标。
[0003]从研究方法角度,主要分为基于传统机器学习,基于主题模型和基于深度学习的方法。
[0004]在传统机器学习方法中逻辑回归、朴素贝叶斯、决策树、SVM是最常用的机器学习方法,其重点是如何选取合适的特征表示,Xu[1]等人采用para2vec,LDA,LSA等语义特征来表示推特文本中的语义信息,在使用不同语义特征时立场检测的效果,Sun等人[2]分析了语义特征、词法特征、形态特征和句法特征多种语言特征在中文微博立场检测任务中的作用,实验表明上述特征均有助于立场检测性能本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多层次知识选择的零样本立场检测装置,其特征在于,包括多层次知识选择模块和零样本立场检测模块;多层次知识选择模块内设有知识选择模型,知识选择模型依次由输入层、编码层、上下文层、注意力层和输出层组成;知识选择模型用于匹配深层和浅层的语义信息,以通过提取句子间的交互关系及单个句子中词与词的交互关系来获得零样本立场检测所需的深层知识;具体根据目标选定维基百科的文章,再从文章中选择与论点语义相关的句子,通过知识选择模型学习论点句P和维基百科中待选择句子Q的深层和浅层的语义表示进行句子选择,在编码层中使用BERT模型A进行编码,BERT模型A采用多头注意力机制,BERT模型A中的[CLS]标记符号能够表示输入序列X的语义关系;上下文层中采用双向LSTM进行上下文级别的表征学习,并通过自注意力机制获取上下文中重点单词的信息;通过[CLS]标记符号的语义信息和双向LSTM与注意力机制提取的带有重点单词信息的语义信息拼接后,从深层和浅层语义的角度共同完成深层知识的选择;将知识、目标、论点共同输入到零样本立场检测模块中完成零样本立场检测,使用已获得的深层知识作为辅助信息进行零样本立场检测;零样本立场检测的类标签为支持、反对、中立,零样本立场检测在训练阶段对每一个类标签分别将立场特征映射到特征空间中,即每一个可见的类标签能够用一个向量来表示,学习一个映射函数,该映射函数能够用来衡量立场;在测试阶段,对给定需要进行类别预测的向量,通过映射函数找到在类别描述特征向量库中最匹配的类别,进而完成立场检测判断立场。2.一种基于多层次知识选择的零样本立场检测方法,基于权利要求1所述零样本立场检测装置,其特征在于,包括以下步骤:输入层中将论点句P和维基百科中待选择的句子Q使用[SEP]标记符号进行分割,并在输入的论点句P前插入[CLS]标记符号,[CLS]标记符号对应的输出向量看作是整个输入序列X的语义表示;[CLS]标记符号对应的输入向量在编码层内通过BERT模型A分别得到不同级别的输出向量,通过将不同输出向量相加得到最终的嵌入向量;再将输入序列X的嵌入表示输入到BERT模型A中进行编码,获得上下文编码向量表示;上下文层中通过双向LSTM将上下文信息融合到论点句P和维基百科中待选择的句子Q的每个向量中,以获得相应的上下文向量;自注意力层对论点句P和维基百科待选择句子Q的语义信息进行捕获上下文层中的重点信息;输出层将经过自注意力层获得的论点句P、维基百科待选择句子Q的句子向量及通过BERT模型A得到[CLS]语义向量进行拼接得到拼接后的向量A,最后将向量A输入到线性层,输出结果通过softmax标准化;将知识、目标、论点共同输入到零样本立场检测模块中完成零样本立场检测,使用已获得的知识作为辅助信息进行零样本立场检测。3.根据权利要求2所述一种基于多层次知识选择的零样本立场检测方法,其特征在于,输入层中,将论点句P={p1,...p
m
}和维基百科W中待选择的每个句子Q={q1,...,q
n
},其中p
...

【专利技术属性】
技术研发人员:王博马晓娟
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1