【技术实现步骤摘要】
事件抽取方法、装置、电子设备及存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种事件抽取方法、装置、电子设备及存储介质。
技术介绍
[0002]随着互联网技术的不断进步,信息的获取变得越来越容易。用户时时刻刻都会接触涉及各个领域的海量信息,比如体育、娱乐、军事等领域的新闻。然而这些信息一般都是无序、杂乱、非结构的,并且存在一定程度的信息冗余。因此,如何从海量信息中发现感兴趣的事件是亟需解决的问题。事件抽取(Event Extraction)技术正是解决这一问题的有力手段。事件抽取主要研究如何从含有事件信息的非结构化文本中识别出用户感兴趣的结构化事件信息。
[0003]现有的事件抽取方法,从句子中抽取事件,将事件抽取任务建模成序列进行预测,按照串行预测的方式进行事件以及事件元素的抽取,局限于单个事件元素的抽取,缺乏对全局事件信息的考虑,事件抽取的误差较大,准确性差。
技术实现思路
[0004]本专利技术提供一种事件抽取方法、装置、电子设备及存储介质,用于解决现有技术中事件抽取的误差较 ...
【技术保护点】
【技术特征摘要】
1.一种事件抽取方法,其特征在于,包括:获取待抽取文档;将所述待抽取文档输入至事件抽取模型,得到所述事件抽取模型输出的所述待抽取文档对应的预测结果;其中,所述预测结果包括多个预测事件,以及每一预测事件对应的事件元素;所述事件抽取模型用于基于所述待抽取文档中每一语句的上下文特征和事件元素,确定所述待抽取文档中事件之间的关系、角色之间的关系和事件到角色之间的关系,并确定所述预测结果。2.根据权利要求1所述的事件抽取方法,其特征在于,所述事件抽取模型包括句子级特征提取层、文档级特征提取层、特征解码层和事件预测层;所述将所述待抽取文档输入至事件抽取模型,得到所述事件抽取模型输出的所述待抽取文档对应的预测结果,包括:将所述待抽取文档输入至所述句子级特征提取层,得到所述句子级特征提取层输出的所述待抽取文档中每一语句对应的上下文特征向量和事件元素表示向量;将所述待抽取文档中每一语句对应的上下文特征向量和事件元素表示向量输入至所述文档级特征提取层,得到所述文档级特征提取层输出的所述待抽取文档对应的文档编码向量和文档事件元素表示向量;将所述待抽取文档对应的文档编码向量和文档事件元素表示向量输入至所述特征解码层,得到所述特征解码层输出的所述待抽取文档对应的角色关系表示向量、事件关系表示向量和事件到角色关系表示向量;将所述待抽取文档对应的角色关系表示向量、事件关系表示向量和事件到角色关系表示向量输入至所述事件预测层,得到所述事件预测层输出的所述待抽取文档对应的预测结果。3.根据权利要求2所述的事件抽取方法,其特征在于,所述将所述待抽取文档输入至所述句子级特征提取层,得到所述句子级特征提取层输出的所述待抽取文档中每一语句对应的上下文特征向量和事件元素表示向量,包括:将所述待抽取文档输入至所述句子级特征提取层中的语句编码层,得到所述语句编码层输出的所述待抽取文档中每一语句对应的上下文特征向量;将所述待抽取文档输入至所述句子级特征提取层中的序列标注层,得到所述序列标注层输出的所述待抽取文档中每一语句对应的事件元素表示向量。4.根据权利要求3所述的事件抽取方法,其特征在于,所述语句编码层和所述文档级特征提取层均采用Transformer模型。5.根据权利要求2所述的事件抽取方法,其特征在于,所述将所述待抽取文档对应的文档编码向量和文档事件元素表示向量输入至所述特征解码层,得到所述特征解码层输...
【专利技术属性】
技术研发人员:陈玉博,赵军,刘康,杨航,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。