事件抽取与语义信息增强方法及装置制造方法及图纸

技术编号:46586798 阅读:1 留言:0更新日期:2025-10-10 21:22
本说明书实施例提供了一种事件抽取与语义信息增强方法及装置,其中,方法包括:基于灾害事件输入文本,通过预先构建的预训练模型ERNIE深度理解灾害事件的语境,并输出携带有语境信息的灾害事件输入文本;通过门控循环单元GRU网络层对携带有语境信息的灾害事件输入文本进行灾害事件的抽取;通过条件随机场CRF序列标记层对抽取的灾害事件进行精确标注,并通过建模计算得到标注的标签之间的转移概率;通过灾害事件语义信息增强机制,利用额外的语义知识完善和增强抽取的灾害事件,并最终输出灾害事件信息。

【技术实现步骤摘要】

本文件涉及计算机,尤其涉及一种基于ernie-gru-crf模型的事件抽取与语义信息增强方法及装置


技术介绍

1、在现有技术中,在事件抽取技术中存在异构信息融合困难、隐性信息捕捉不足、复杂事件抽取困难、长距离依赖问题以及抽取的事件信息无法全面描述整个事件的问题。


技术实现思路

1、本专利技术的目的在于提供一种基于ernie-gru-crf模型的事件抽取与语义信息增强方法及装置,旨在解决现有技术中的上述问题。

2、本专利技术提供一种基于ernie-gru-crf模型的事件抽取与语义信息增强方法,包括:

3、基于灾害事件输入文本,通过预先构建的预训练模型ernie深度理解灾害事件的语境,并输出携带有语境信息的灾害事件输入文本;

4、通过门控循环单元gru网络层对携带有语境信息的灾害事件输入文本进行灾害事件的抽取;

5、通过条件随机场crf序列标记层对抽取的灾害事件进行精确标注,并通过建模计算得到标注的标签之间的转移概率;

6、通过灾害事件语义信息增强机本文档来自技高网...

【技术保护点】

1.一种基于ERNIE-GRU-CRF模型的事件抽取与语义信息增强方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述预训练模型ERNIE通过三种不同的掩码策略隐式地学习实体的特性和关系,其中,所述三种不同的掩码策略具体包括:词级掩码、实体级掩码和短语级掩码,在整个训练过程中,ERNIE将输入划分为单词、实体和其他粒度,在不同的语义和知识层次上学习单词之间的相关性,实现完整思想的语义表达;ERNIE基于Transformer架构设置有多层深度神经网络编码器,通过自注意力机制捕捉文本的全局依赖关系,根据知识增强的预训练策略,引入灾害领域的专业词典构建知识导向...

【技术特征摘要】

1.一种基于ernie-gru-crf模型的事件抽取与语义信息增强方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述预训练模型ernie通过三种不同的掩码策略隐式地学习实体的特性和关系,其中,所述三种不同的掩码策略具体包括:词级掩码、实体级掩码和短语级掩码,在整个训练过程中,ernie将输入划分为单词、实体和其他粒度,在不同的语义和知识层次上学习单词之间的相关性,实现完整思想的语义表达;ernie基于transformer架构设置有多层深度神经网络编码器,通过自注意力机制捕捉文本的全局依赖关系,根据知识增强的预训练策略,引入灾害领域的专业词典构建知识导向的掩码机制,在预训练阶段重点预测关键概念;ernie整合灾害知识图谱中的实体关系,通过实体链接和关系预测任务学习灾害领域的专业知识;ernie采用持续学习的方式,在通用语料预训练的基础上,使用海量灾害新闻、文本进行领域自适应训练,使获得的词向量兼具通用语言理解能力和灾害专业知识表征能力,为下游事件抽取任务提供更精准的语义表示基础。

3.根据权利要求1所述的方法,其特征在于,通过门控循环单元gru网络层对携带有语境信息的灾害事件输入文本进行灾害事件的抽取具体包括:

4.根据权利要求1所述的方法,其特征在于,通过条件随机场crf序列标记层对抽取的灾害事件进行精确标注,并通过建模计算得到标注的标签之间的转移概率具体包括:

5.根据权利要求1所述的方法,其特征在于,通过灾害事件语义信息增强机制,利用额外的语义知识完善和增强抽取的灾害事件,并最终输出灾害事件信息具体包括:

6.一种基于ernie-gr...

【专利技术属性】
技术研发人员:罗安刘旺旺王勇徐胜华车向红
申请(专利权)人:中国测绘科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1