当前位置: 首页 > 专利查询>苏州大学专利>正文

一种篇章级事件可信度识别方法、装置及存储介质制造方法及图纸

技术编号:37333190 阅读:34 留言:0更新日期:2023-04-21 23:11
本发明专利技术涉及信息传播技术领域,尤其是指一种篇章级事件可信度识别方法、装置及计算机存储介质。本发明专利技术所述的篇章级事件可信度识别方法,对含有事件触发词的句子通过依存关系解析器得到以事件触发词为根节点的最短依存路径,将其与原文本进行对齐拼接并输入模型以得到语义句法融合表示,以此对篇章文本的图结构节点进行初始化;本发明专利技术充分考虑了文本的语义特征和句法特征,在篇章级事件可信度识别任务中首次将语义特征与句法特征进行融合,将篇章文本的关键句(带有事件触发词)的特征进行充分挖掘与利用,更好地利用文本潜在的依存句法信息辅助篇章级事件可信度识别任务,显著提升了篇章级事件可信度识别的识别性能。篇章级事件可信度识别的识别性能。篇章级事件可信度识别的识别性能。

【技术实现步骤摘要】
一种篇章级事件可信度识别方法、装置及存储介质


[0001]本专利技术涉及信息传播
,尤其是指一种篇章级事件可信度识别方法、装置及计算机存储介质。

技术介绍

[0002]现有的技术中,事件可信度识别一般是指将给定事件文本分类到:可能发生(Poss i b l e Pos it i ve,PS+)、可能未发生(Poss i b l e Negat ive,PS

)、肯定发生(Certa i n Pos it ive,CT+)、肯定未发生(Certa i n Negat i ve,CT

)以及未确定(Underspecifi ed,Uu)的五分类任务。传统的事件可信度识别研究主要集中在细粒度的句子层面。然而,现实世界中的事件多以长文本新闻稿形式来进行描述并报道的,其事件可信度唯一确定。在进行句子层面的事件可信度识别研究时,往往会遇到一种不可避免的问题场景,即针对单一事件句识别得到的事件可信度可能与对应事件新闻报道的真实的事件可信度产生矛盾,这对于篇章级事件可信度识别提出了巨大挑战。r/>[0003]Q本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种篇章级事件可信度识别方法,其特征在于,包括:对输入篇章文本中的每个句子按照是否包含事件触发词进行分类;将每个不包含事件触发词的句子分别进行BERT编码,得到多个普通句义特征表示;将每个包含事件触发词的句子分别输入依存分析解析器,得到以不同的事件触发词为根节点的多个最短依存路径,将每个最短依存路径分别与对应的句子进行对齐拼接后进行BERT编码,得到多个语义句法融合特征表示;构建输入篇章文本的图结构并初始化节点,所述节点包括句子节点、触发词节点和篇章节点,其中,将句子节点初始化为所述多个普通句义特征表示和所述多个语义句法融合特征表示;利用图神经注意力网络对初始化节点后的图结构进行图推理,并通过图注意力机制为每个节点分配权重,得到篇章文本图特征表示;利用分类器根据所述篇章文本图特征表示进行分类预测,得到输入篇章文本的事件可信度类别。2.根据权利要求1所述的篇章级事件可信度识别方法,其特征在于,所述构建输入篇章文本的图结构包括:将所述输入篇章文本中的每个句子抽象为多个句子节点,将每个事件触发词抽象为多个触发词节点,将所述输入篇章文本抽象为篇章节点;将每个句子节点按上下文顺序连接,将每个包含事件触发词的句子的节点与其对应的触发词节点连接,将所有触发词节点与所述篇章节点连接。3.根据权利要求1所述的篇章级事件可信度识别方法,其特征在于,所述构建输入篇章文本的图结构包括:将所述输入篇章文本中的每个句子抽象为多个句子节点,将每个事件触发词抽象为多个触发词节点,将所述输入篇章文本抽象为篇章节点;将每个句子节点按上下文顺序连接,将所述每个句子节点分别与与每个触发词节点连接,将触发词节点按顺序相互连接,将每个触发词节点与所述篇章节点连接。4.根据权利要求1所述的篇章级事件可信度识别方法,其特征在于,所述初始化节点还包括:将所述输入篇章文本经过BERT编码得到篇章文本特征表示;将每个事件触发词分别经过BERT编码得到多个触发词特征表示;将所述篇章节点初始化为所述篇章文本特征表示;将所述触发词节点初始化为触发...

【专利技术属性】
技术研发人员:张子豪钱忠
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1