当前位置: 首页 > 专利查询>中南大学专利>正文

文档级中文事件关系检测方法及系统技术方案

技术编号:42991837 阅读:29 留言:0更新日期:2024-10-15 13:22
本发明专利技术公开了一种文档级中文事件关系检测方法,包括获取现有的中文文档;进行句法语义依存分析图的构建;进行中文事件的抽取;进行事件对的构建;进行事件要素信息的嵌入;构建BERT关系分类器并进行训练得到事件关系预测模型;采用得到的事件关系预测模型进行文档级中文事件的关系检测。本发明专利技术还公开了一种实现所述文档级中文事件关系检测方法的系统。本发明专利技术根据句法语义依存分析图的构建、中文事件的抽取和事件对的构建,保证了事件关系判断的基础,并同时根据BERT关系分类器实现文档级中文事件的关系检测;而且本发明专利技术的可靠性更高,而且精确度更高。

【技术实现步骤摘要】

本专利技术属于数据挖掘领域,具体涉及一种文档级中文事件关系检测方法及系统


技术介绍

1、事件是由特定人、物、事在特定时间和特定地点相互作用的客观事实。事件触发词是指表达事件发生或变化的动词或动词短语,如“结婚”、“死亡”等。事件的发生往往不是孤立现象,必然存在与之相关的其它事件,例如原因事件、结果事件和并发事件等。这种事件之间相互依存和关联的逻辑形式,称为事件关系。事件关系客观存在于事件之间,并且作用于原本孤立的事件集合中。事件关系能将离散于文本中的事件相连接,形成事件关系网络和事件发展的拓扑脉络。因此,分析事件关系对于目前大规模的信息分析与处理具有重要的应用价值,例如,关联事件聚类、新闻事件的关系网络构建,以及突发事件推理与预测等。

2、事件关系检测是一种深入判定两两事件之间具有何种逻辑关系的任务。目前,事件关系检测的方法可以分为基于规则的方法和基于机器学习的方法。基于规则的方法主要依靠人工定义规则或模板来抽取事件关系,而基于机器学习的方法则通过训练大规模的语料库来学习事件关系的模式。在基于机器学习的方法中,深度学习技术如cnn、lstm和本文档来自技高网...

【技术保护点】

1.一种文档级中文事件关系检测方法,包括如下步骤:

2.根据权利要求1所述的文档级中文事件关系检测方法,其特征在于步骤S2所述的针对步骤S1获取的中文文档,进行句法语义依存分析图的构建,具体包括如下步骤:

3.根据权利要求2所述的文档级中文事件关系检测方法,其特征在于步骤S3所述的基于步骤S2构建的句法语义依存分析图,进行中文事件的抽取,具体包括如下步骤:

4.根据权利要求3所述的文档级中文事件关系检测方法,其特征在于步骤S4所述的根据步骤S3抽取得到的中文事件,进行事件对的构建,包括如下步骤:

5.根据权利要求4所述的文档级中文事件关系检...

【技术特征摘要】

1.一种文档级中文事件关系检测方法,包括如下步骤:

2.根据权利要求1所述的文档级中文事件关系检测方法,其特征在于步骤s2所述的针对步骤s1获取的中文文档,进行句法语义依存分析图的构建,具体包括如下步骤:

3.根据权利要求2所述的文档级中文事件关系检测方法,其特征在于步骤s3所述的基于步骤s2构建的句法语义依存分析图,进行中文事件的抽取,具体包括如下步骤:

4.根据权利要求3所述的文档级中文事件关系检测方法,其特征在于步骤s4所述的根据步骤s3抽取得到的中文事件,进行事件对的构建,包括如下步骤:

5.根据权利要求4所述的文档级中文事件关系检测方法,其特征在于所述的步骤s4,具体包括如下步骤:

6.根据权利要求5所述的文档级中文事件关系检测方法,其特征在于步骤s5所述的针对步骤s4得到的事件对,进行事件要素信息的嵌入,具体包括如下步骤:

7.根据权利要求6所述的文档级中文事件关系检测方法,其特征在于步骤s6所述的构建bert关系分类器并进行训练,得到事件关系预测模型,具体包括如下步骤:

8.根据权利要求7所述的文档级中文事件关系检测方法,其特征在于所述的基于adam算法实现对模...

【专利技术属性】
技术研发人员:黄端胡海洋王蓉许浩淇张玲石金晶施鹤远邓晓衡谭真
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1