【技术实现步骤摘要】
一种时隙异构知识图谱的表示与存储方法
[0001]本专利技术属于知识图谱领域,具体涉及一种时隙异构知识图谱的表示与存储方法。
技术介绍
[0002]知识图谱是一种用图模型来描述知识和建模事物之间关联关系的技术方法。知识图谱可以分为同构知识图谱和异构知识图谱,同构知识图谱假设图谱中的所有实体为相同类型,所有关系也为相同类型,而异构知识图谱的实体和关系可以为不同类型。很明显,异构知识图谱包含了更为丰富的信息,对知识推理准确性的提升有很大的帮助。目前,异构知识图谱一般采用三元组的方法对知识进行表示和存储,实体对应三元组的起始实体和终止实体,关系对应三元组的关系。
[0003]相较同构知识图谱而言,异构知识图谱包含了更为丰富的语义信息,使得知识推理的结果更为准确,但其却忽略了知识图谱随时间变化所蕴含的重要信息,导致无法满足对准确性日益提高的要求。例如,在学术研究知识图谱中,研究者的研究兴趣可能随时间推移产生重大变化,相应的分类、聚类、关系预测、相似性搜索等数据挖掘结果也应随之变化。
[0004]中国专利文献CN 10 ...
【技术保护点】
【技术特征摘要】
1.一种时隙异构知识图谱的表示与存储方法,其特征在于,包括以下步骤:(a)概念图谱构建:分析数据源包含的信息,对信息归纳组织,确定实体和关系的类型集合,以及时间范围;(b)知识抽取:根据概念图谱解析数据源,从数据源中进行实体抽取和关系抽取,其中部分关系包含时间戳;(c)时隙知识图谱表示:将起始实体和终止实体相同的关系,时间戳归入相应时隙,用向量表示其动态变化;(d)时隙知识图谱的图存储:将抽取的知识进行向量化表示后,按相应格式,导入图数据库中进行存储。2.根据权利要求1所述时隙异构知识图谱的表示与存储方法,其特征在于,步骤(a)包括以下步骤:(a-1)确定实体类型集合:分析数据源,提取所需实体类型,确定实体类型集合(a-2)确定关系类型集合:结合数据源以及上述步骤(a-1)确定的实体类型集合确定关系类型集合如果两个关系属于同一关系类型,那么这两个关系具有相同类型的起始实体和目标实体,根据实际业务的需要,其中部分关系类型的关系实例的存在随时间变化;(a-3)确定时间范围:从数据源中提取步骤(a-2)中所涉及关系实例随时间变化的关系类型相应的起始时间和结束时间,确定关系的时间范围T;(a-4)构建概念图谱:根据上述步骤确定的实体类型、关系类型以及时间范围T,构建异构知识图谱的概念图谱3.根据权利要求2所述时隙异构知识图谱的表示与存储方法,其特征在于,步骤(b)中包含以下步骤:(b-1)实体抽取:根据步骤(a)确定的概念图谱从数据源中提取各类型实体的全部实例V,存储于结构化数据库;(b-2)关系抽取:根据步骤(a)确定的概念图谱从数据源中提取各类型关系的全部实例E,存储于结构化数据库,其中包含时间信息的元素记为e=<u,v,t>∈E,其中u为起始实体,v为目标实体,t为关系实例e的时间戳,且t在时间范围T所包含区域内。4.根据权利要求3所述时隙异构知识图谱的表示与存储方法,其特征在于,解析数据源的方法采用正则表达式方法。5.根据权利要求4所述时隙异构知识图谱的表示与存储方法,其特征在于,所述异构知识图谱的每一类实体对应一张实体表;所述实体表包括:各类实体的类型、各类实体的标识、各类实体的名称信息。6.根据权利要求5所述时隙异构知识图谱的表示与存储方法,其特征在于,步骤(c)中包含以下步骤:(c-1)划分时隙:根据步骤(a)所获取的时间范围的具体情况,结合实际的需求,确定时隙宽度,将时间范围T划分为a个时隙,得到时隙划分:T=[t0,t1),[t1,t2)
…
[t
a-1
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。