跨文档事件共指消解方法、电子设备及存储介质技术

技术编号:40546240 阅读:21 留言:0更新日期:2024-03-05 19:03
本申请公开了一种跨文档事件共指消解方法、电子设备及存储介质,跨文档事件共指消解方法包括将至少两个文档输入到序列编码器,能得到至少两个文档中事件和实体的词表示集,构建图网络,能够得到至少两个文档中事件和实体的结构化特征,其中图网络包括多个节点和多个边,每个节点的初始化状态由相应的事件或实体的词表示表征;通过将图网络输入到图网络编码器,能够得到多个边中每个边的节点对表示,从而得到多个边的节点对表示集;本申请的方案,通过结合序列编码器和图网络编码器,能够得到至少两个文档中事件和实体的序列特征和结构化特征,以实现跨文档进行事件和实体共指消解建模,从而实现跨文档事件共指消解。

【技术实现步骤摘要】

本申请涉及自然语言处理,特别是涉及一种跨文档事件共指消解方法、电子设备及存储介质


技术介绍

1、事件共指消解旨在判断文本中不同的事件实例间是否存在共指关系,并将指向同一事件本体的实例进行聚类。在一些现有的事件共指消解研究中,侧重于判断单个文档内的事件实例是否具有共指关系,无法对分散在不同文档内的事件实例进行共指消解。


技术实现思路

1、本申请至少提供一种跨文档事件共指消解方法、电子设备及存储介质,以解决上述问题。

2、本申请第一方面提供了一种跨文档事件共指消解方法,包括:获取至少两个文档,并将所述至少两个文档输入到序列编码器,以得到所述至少两个文档中事件和实体的词表示集;

3、构建图网络,其中,所述图网络包括多个节点和多个边,每个节点表示所述至少两个文档中的一个事件或实体,每个边是以预设连边方式将所述多个节点中两个节点进行连边而得到的,每个节点的初始化状态由相应的事件或实体的词表示表征;

4、将所述图网络输入到图网络编码器,以得到所述多个边中每个边的节点对表示,从而得到所本文档来自技高网...

【技术保护点】

1.一种跨文档事件共指消解方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,预设连边方式包括如下至少一种:

3.根据权利要求1所述的方法,其特征在于,所述序列编码器和所述图网络编码器是通过预设约束条件,对序列编码器和图网络编码器内的参数进行优化得到的,所用的计算公式如下:

4.根据权利要求3所述的方法,其特征在于,所述预设约束条件包括一致性约束;

5.根据权利要求4所述的方法,其特征在于,所述预设约束条件还包括相似性约束;

6.根据权利要求1所述的方法,其特征在于,将所述至少两个文档输入到序列编码器,以得到所述...

【技术特征摘要】

1.一种跨文档事件共指消解方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,预设连边方式包括如下至少一种:

3.根据权利要求1所述的方法,其特征在于,所述序列编码器和所述图网络编码器是通过预设约束条件,对序列编码器和图网络编码器内的参数进行优化得到的,所用的计算公式如下:

4.根据权利要求3所述的方法,其特征在于,所述预设约束条件包括一致性约束;

5.根据权利要求4所述的方法,其特征在于,所述预设约束条件还包括相似性约束;

6.根据权利要求1所述的方法,其特征在于,将所述至少两个文档输入到序列编码器,以得到所述至少两个文档中事件...

【专利技术属性】
技术研发人员:徐睿峰范创李嘉明方明党一学余晓琪
申请(专利权)人:招商证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1