基于序列标注的事件图谱构建方法、装置及可读储存介质制造方法及图纸

技术编号:40610266 阅读:23 留言:0更新日期:2024-03-12 22:18
本发明专利技术公开了基于序列标注的事件图谱构建方法、装置及可读储存介质,涉及知识图谱构建及应用领域;其中事件图谱构建方法包括:首先生成事件实体识别模型;再生成论元角色分类模型;最后针对输入的非结构化文本,基于事件实体识别模型和论元角色分类模型,构建事件图谱;本发明专利技术,将事件图谱构建过程分为事件触发词/论元实体识别、论元角色识别、图谱要素关联三个阶段。借助序列标注和文本分类模型,提高事件结构化描述中触发词、论元实体及角色信息抽取的准确率,进而提高事件图谱构建的有效性。

【技术实现步骤摘要】

本专利技术涉及知识图谱构建及应用领域,具体涉及一种基于序列标注的事件图谱构建方法、装置及可读储存介质


技术介绍

1、本节中的陈述仅提供与本公开相关的背景信息,并且可能不构成现有技术。

2、知识图谱是google用于增强其搜索引擎功能的知识库。本质上,知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。事件图谱是包括事件、事件属性、事件间关联关系的以事件为基本单位的知识网络。每个事件都有自己的事件类型,不同的事件类型拥有不同的角色。构建事件图谱能够将各类资源,包括资讯、观点等,围绕事件进行组织,从而帮助用户更高效更全面获取事件信息;同时,能够让决策者清晰地了解一个事件可能的原因和结果,进而使决策者做出更加全面及有根据的考虑。事件图谱构建的核心即是事件抽取,其目标是对事件的相关要素进行结构化抽取。事件相关要素具体包括触发词、论元实体、论元角色。传统的端到端事件抽取技术难度较大,学术上效果还没有达到直接可用的水平,在公开权威数据集ace2005上的f1只有60%。


<b>技术实现思路...

【技术保护点】

1.基于序列标注的事件图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的基于序列标注的事件图谱构建方法,其特征在于,所述步骤S1,包括:

3.根据权利要求1所述的基于序列标注的事件图谱构建方法,其特征在于,所述步骤S2,包括:

4.根据权利要求1所述的基于序列标注的事件图谱构建方法,其特征在于,所述步骤S3,包括:

5.根据权利要求2所述的基于序列标注的事件图谱构建方法,其特征在于,每种类型的论元实体识别样本数不少于30条。

6.根据权利要求3所述的基于序列标注的事件图谱构建方法,其特征在于,所述论元角色识别模型训练样本...

【技术特征摘要】

1.基于序列标注的事件图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的基于序列标注的事件图谱构建方法,其特征在于,所述步骤s1,包括:

3.根据权利要求1所述的基于序列标注的事件图谱构建方法,其特征在于,所述步骤s2,包括:

4.根据权利要求1所述的基于序列标注的事件图谱构建方法,其特征在于,所述步骤s3,包括:

5.根据权利要求2所述的基于序列标注的事件图谱构建方法,其特征在于,每种类型的论元实体识别样本数不少于30条。

6.根据权利...

【专利技术属性】
技术研发人员:杨露
申请(专利权)人:中国电子科技集团公司第十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1