【技术实现步骤摘要】
本专利技术属于音频处理及自然语言处理领域,具体涉及一种基于动态图传播的事件及事件关系联合抽取方法及系统。
技术介绍
1、在自然语言处理(natural language processing, nlp)领域中,事件抽取(eventextraction)是信息抽取的核心任务之一,旨在从非结构化文本中识别出具有语义意义的事件及其组成要素。事件抽取广泛应用于舆情分析、智能问答、金融信息分析、法律文本挖掘等场景。
2、传统的事件抽取任务通常依赖于预定义的事件类型模板或管道式结构(pipeline),按触发词识别、论元抽取、角色识别的顺序进行。然而,这类方法存在语义割裂、误差级联、结构建模不足等问题,难以应对复杂、模糊、嵌套的自然语言场景。
3、此外,当前事件抽取研究中广泛使用跨度(span)机制,即将文本中一定长度的字符或词序列作为候选实体或成分单位,用于建模触发词或论元。相较于基于单词级别的标注方式,基于跨度的建模方法更加灵活,能够捕捉多词构成的复杂成分。
4、为了更好地表示事件内部结构与事件之间的关联,近
...【技术保护点】
1.一种基于动态图传播的事件及事件关系联合抽取方法,其特征在于,包括:
2.如权利要求1所述的基于动态图传播的事件及事件关系联合抽取方法,其特征在于,所述S2中,利用不同长度的滑动窗口对所述令牌序列进行滑动提取,以穷举形式提取所有可能的候选跨度加入候选跨度集,候选跨度集中的每个候选跨度由一个或多个连续的令牌组成;然后根据句法依存规则对候选跨度集进行筛选,保留具有主谓结构、动宾结构、介宾结构或定中结构的候选跨度,删除其他候选跨度。
3.如权利要求1所述的基于动态图传播的事件及事件关系联合抽取方法,其特征在于,每个候选跨度的初始跨度表示由该候选跨度
...【技术特征摘要】
1.一种基于动态图传播的事件及事件关系联合抽取方法,其特征在于,包括:
2.如权利要求1所述的基于动态图传播的事件及事件关系联合抽取方法,其特征在于,所述s2中,利用不同长度的滑动窗口对所述令牌序列进行滑动提取,以穷举形式提取所有可能的候选跨度加入候选跨度集,候选跨度集中的每个候选跨度由一个或多个连续的令牌组成;然后根据句法依存规则对候选跨度集进行筛选,保留具有主谓结构、动宾结构、介宾结构或定中结构的候选跨度,删除其他候选跨度。
3.如权利要求1所述的基于动态图传播的事件及事件关系联合抽取方法,其特征在于,每个候选跨度的初始跨度表示由该候选跨度中的起始令牌嵌入、结束令牌嵌入、平均令牌嵌入以及令牌数量拼接而成。
4.如权利要求1所述的基于动态图传播的事件及事件关系联合抽取方法,其特征在于,所述s3中,对于候选跨度集中的每个候选跨度,若该候选跨度为动词词性的令牌,则将该候选跨度分类为触发词,否则该候选跨度分类为论元;初始构建事件要素动态图时,每个触发词节点均需要和全部论元节点建立边连接。
5.如权利要求1所述的基于动态图传播的事件及事件关系联合抽取方法,其特征在于,对于事件要素动态图和事件级动态图,采用所述门机制更新的方式为:...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。