一种时序知识图谱构建方法及系统技术方案

技术编号:37053137 阅读:13 留言:0更新日期:2023-03-29 19:30
本发明专利技术提供了一种时序知识图谱构建方法及系统,通过获取基础图谱数据;获取舆情信息,提取舆情信息中的关键事件数据;其中,基础图谱数据和关键事件数据都包含时间属性;确定关键事件数据和基础图谱数据中的共同实体,对包含共同实体的关键事件数据和基础图谱数据进行信息关联,得到包含关键事件数据的时序图谱数据;利用时序图谱数据构建包含时间属性的目标知识图谱。本发明专利技术实现了实体在时间发展的过程中涉及到的关键事件查找,通过获取包含时间属性的基础图谱数据和关键事件数据,用以构建具有时间维度的三维知识图谱,直观展示随着时间变化,实体、事件、关系发生的变化,使得基于时间段进行图谱检索成为可能。时间段进行图谱检索成为可能。时间段进行图谱检索成为可能。

【技术实现步骤摘要】
一种时序知识图谱构建方法及系统


[0001]本专利技术涉及知识图谱
,具体涉及一种时序知识图谱构建方法及系统。

技术介绍

[0002]知识图谱是一种由节点和边构成的图数据结构,每个节点表示现实世界中客观存在的实体,每个边作为实体与实体之间的关系。将这种抽象的图数据结构进行可视化,能够使用户以更直观的交互方式实现对数据的观测、探索及分析,从而挖掘数据中隐藏的信息特征、关系和模式。相关技术中,可视化针对的都是静态知识图谱,实体和关系本身不具备可持续的时序特性,即图谱中的实体和关系不会随着时间的变化而变化,从而构建出的都是静态不可变的知识图谱,无法反映现实世界中事物时序的持续性。但是,随着时间推移,实体和实体间的关系也会不断变化,不同实体在重叠时序空间可能产生相互或者共同影响。而一般的静态知识图谱无法从时间发展的维度直观展示伴随着时间变化,实体和实体之间关系产生的变化和影响。

技术实现思路

[0003]为此,本专利技术提供一种时序知识图谱构建方法及系统,对实体、事件及关系赋予持续的时间属性,并在二维图谱的基础上加入时间维度,构建三维可视化的知识图谱,实现实体、事件及关系随着时间变化发生变化的直观展示。
[0004]为实现以上目的,本专利技术采用如下技术方案:依据本专利技术第一方面,提供了一种时序知识图谱构建方法,所述方法包括:获取基础图谱数据;其中,所述基础图谱数据包括多个实体、所述实体之间的第一关联关系以及所述实体和所述第一关联关系对应的基础时间数据;获取舆情信息,提取所述舆情信息中的关键事件数据;其中,所述关键事件数据至少包括关键事件、相关实体和事件时间数据;确定所述关键事件数据和所述基础图谱数据中的共同实体,对包含共同实体的所述关键事件数据和所述基础图谱数据进行信息关联,得到包含所述关键事件数据的时序图谱数据;利用所述时序图谱数据构建包含时间属性的目标知识图谱。
[0005]依据本专利技术第二方面,提供了一种时序知识图谱构建系统,所述系统包括:数据获取模块,用于获取基础图谱数据;其中,所述基础图谱数据包括多个实体、所述实体之间的第一关联关系以及所述实体和所述第一关联关系对应的基础时间数据;信息获取模块,用于获取舆情信息,提取所述舆情信息中的关键事件数据;其中,所述关键事件数据至少包括关键事件、相关实体和事件时间数据;数据处理模块,用于确定所述关键事件数据和所述基础图谱数据中的共同实体,对包含共同实体的所述关键事件数据和所述基础图谱数据进行信息关联,得到包含所述关键事件数据的时序图谱数据;
图谱构建模块,用于利用所述时序图谱数据构建包含时间属性的目标知识图谱。
[0006]本专利技术采用以上技术方案,至少具备以下有益效果:通过本专利技术方案,获取基础图谱数据;获取舆情信息,提取所述舆情信息中的关键事件数据;其中,所述基础图谱数据和所述关键事件数据都包含时间属性;确定所述关键事件数据和所述基础图谱数据中的共同实体,对包含共同实体的所述关键事件数据和所述基础图谱数据进行信息关联,得到包含所述关键事件数据的时序图谱数据;利用所述时序图谱数据构建包含时间属性的目标知识图谱,由此,实现实体在时间发展的过程中涉及到的关键事件查找,通过获取包含时间属性的基础图谱数据和关键事件数据,用以构建具有时间维度的三维知识图谱,直观展示随着时间变化,实体、事件、关系发生的变化,使得基于时间段进行图谱检索成为可能。
[0007]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0008]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0009]图1示出了本专利技术一实施例提供的时序知识图谱构建方法的流程示意图;图2示出了本专利技术一实施例提供的三维目标知识图谱的简要示意图;图3示出了本专利技术一实施例提供的时序知识图谱构建系统的结构示意图;图4示出了本专利技术另一实施例提供的时序知识图谱构建系统的结构示意图。
具体实施方式
[0010]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0011]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0012]本专利技术实施例提供了一种时序知识图谱构建方法,如图1所示,至少可以包括以下步骤S101~S104:步骤S101,获取基础图谱数据。
[0013]其中,基础图谱数据可以包括多个实体、实体之间的第一关联关系以及实体和第
一关联关系对应的基础时间数据。
[0014]对于步骤S101,在一个可选实施例中,获取基础图谱数据,可以包括步骤S101

1~S101

2:步骤S101

1,获取基础数据,提取基础数据中的实体和实体之间的第一关联关系;本专利技术实施例以构建一种金融领域企业发展的时序知识图谱为例,获取构建该知识图谱所需要的基础数据,可以包括人物、企业机构、投资关系、分支机构、就职人员、债券关系、交易对手等。基础数据中的实体可以为人物或企业机构,可以理解的是,利用上述获取的基础数据,可以分析得到各人物及企业机构之间的相互关系,例如,人物与企业机构、人物与人物、企业机构与企业机构之间的竞争关系、投资关系、就职关系、交易关系等,即可以作为基础数据中多个实体之间的第一关联关系。
[0015]步骤S101

2,利用与实体的类型相匹配的预设规则,为对应的实体设置对应时间属性的基础时间数据;以及,利用与第一关联关系的类型相匹配的预设规则,为对应的第一关联关系设置对应时间属性的基础时间数据。
[0016]为了构建包含时间维度的知识图谱,本专利技术实施例需要对基础数据中的实体和第一关联关系赋予时间属性,即对实体或第一关联关系设置基础时间数据。针对实体,需要先确定实体类型,基于实体类型设置对应时间属性的基础时间数据。例如,实体类型为人物,则设置人物实体的出生年月作为起始时间,死亡年月作为结束时间,若人物实体在世则无结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时序知识图谱构建方法,其特征在于,所述方法包括:获取基础图谱数据;其中,所述基础图谱数据包括多个实体、所述实体之间的第一关联关系以及所述实体和所述第一关联关系对应的基础时间数据;获取舆情信息,提取所述舆情信息中的关键事件数据;其中,所述关键事件数据至少包括关键事件、相关实体和事件时间数据;确定所述关键事件数据和所述基础图谱数据中的共同实体,对包含共同实体的所述关键事件数据和所述基础图谱数据进行信息关联,得到包含所述关键事件数据的时序图谱数据;利用所述时序图谱数据构建包含时间属性的目标知识图谱。2.根据权利要求1所述的方法,其特征在于,所述利用所述时序图谱数据构建包含时间属性的目标知识图谱,包括:提取所述时序图谱数据中的多个目标实体和所述目标实体之间的第二关联关系;其中,所述目标实体包括实体和关键事件中至少之一;利用力引导算法确定所述目标实体和所述第二关联关系在二维方向平面的对应位置;提取所述时序图谱数据中针对所述目标实体和所述第二关联关系的目标时间数据;其中,所述目标时间数据包括基础时间数据、事件时间数据中至少之一;构建垂直于所述二维方向平面的时间维度,基于所述目标实体和所述第二关联关系在所述二维方向平面的目标时间数据确定所述目标实体和所述第二关联关系在所述时间维度上的时间起始位置;基于所述目标实体和所述第二关联关系在所述二维方向平面的对应位置和在所述时间维度上的时间起始位置生成三维的所述目标知识图谱。3.根据权利要求1所述的方法,其特征在于,所述获取基础图谱数据,包括:获取基础数据,提取所述基础数据中的实体和所述实体之间的第一关联关系;所述基础数据包括人物、企业机构、投资关系、分支机构、就职人员、债券关系、交易对手中至少之一;利用与所述实体的类型相匹配的预设规则,为对应的实体设置对应时间属性的基础时间数据;以及,利用与所述第一关联关系的类型相匹配的预设规则,为对应的第一关联关系设置对应时间属性的基础时间数据。4.根据权利要求1所述的方法,其特征在于,所述提取所述舆情信息中的关键事件数据,包括:构建事件分类模型,根据所述事件分类模型确定所述舆情信息对应的事件类型;所述事件类型包括司法事件、处罚事件、企业变更、投资事件、负面事件、纠纷事件中至少之一;构建事件抽取模型,根据所述事件抽取模型对所述舆情信息中的关键事件数据进行抽取;所述事件抽取模型用于针对不同事件类型的所述舆情信息抽取对应信息属性的关键事件数据。5.根据权利要求4所述的方法,其特征在于,所述构建事件分类模型,包括:利用预设事件类型和舆情信息样本对Bert预训练模...

【专利技术属性】
技术研发人员:贾承斌莫倩艾青张传文
申请(专利权)人:网智天元科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1