当前位置: 首页 > 专利查询>陆洋专利>正文

一种基于深度知识图谱的数据库系统技术方案

技术编号:25756400 阅读:71 留言:0更新日期:2020-09-25 21:05
本发明专利技术公开了一种基于深度知识图谱的数据库系统,包括:概念分割模块,用于根据实体对象概念将知识图谱的全体实体对象分割为多个子集;关联创建模块,用于根据分割后的多个子集创建实体对象之间的关联,生成关联对象集合;关联计算模块,用于将关联对象集合按照关联的类型进行分组,并使用独立内存数据库对关联对象集合进行存取计算。通过实施本发明专利技术,解决了传统知识图谱数据库信息表达能力不足,无法有效支撑大多数工业和商业应用系统后台数据服务需求的问题。提升了超大型知识图谱中计算效率,并且通过算法内部的改进实现了毫秒级的全范围全文本搜索。

【技术实现步骤摘要】
一种基于深度知识图谱的数据库系统
本专利技术涉及计算机科学和信息科学领域,具体涉及一种基于深度知识图谱的数据库系统。
技术介绍
知识图谱是近年来在人工智能,知识问答领域备受关注的一种信息表达技术。传统的知识图谱一般基于实体以及实体之间的关联构建和管理某一个领域内的知识结构,从而实现知识查询或者人机对话的目的。理论上知识图谱对于知识的表达是万能的,无论物理实体还是抽象的原则都被建模成为实体,然而目前,传统知识图谱难以作为信息底盘支撑实际大型信息系统开发。问题主要归结为:1)目前知识图谱数据库的信息表达能力仍然比较低,难以适应任何通用的信息系统开发的需求。2)随着移动互联网的逐步发展,近年来多媒体数据尤其是视频流和音频流数据成为信息系统中必不可少的组成部分,传统的知识图谱数据库缺乏对海量多媒体数据储存和提取的整合性方案。3)计算性能的瓶颈,随着图谱规模的扩大,其计算性能会因为数据量的扩大而下降。使得如关联查询这样的基础操作的耗时超出一般应用的可接受范围(毫秒级)。4)以往的知识图谱数据库偏向于表层知识的表达,没有针对详细的数据库操作进行细化的接口约定。基于信息表达的有限性,计算效率的限制,以及通用查询协议的确实等多方面的原因,目前为止还没有足够成熟的商用知识图谱数据库能够为各种信息系统提供性能稳定,信息表达能力足够丰富,接口使用方便的产品。
技术实现思路
因此,本专利技术要解决的技术问题在于克服现有技术中的信息表达的有限性、计算效率的限制、缺少多媒体数据整合方案以及缺失通用查询协议的缺陷,从而提供一种基于深度知识图谱的数据库系统。为此,本专利技术实施例提供了如下技术方案:本专利技术实施例提供一种基于深度知识图谱的数据库系统,包括:概念分割模块、关联创建模块及关联计算模块,其中,概念分割模块,用于根据实体对象概念将知识图谱的全体实体对象分割为多个子集;关联创建模块,用于根据分割后的多个子集创建实体对象之间的关联,生成关联对象集合;关联计算模块,用于将关联对象集合按照关联的类型进行分组,并使用独立内存数据库对关联对象集合进行存取计算。在一实施例中,关联计算模块,包括:关联类型子模块,用于指定任何两个实体对象之间的关联类型以及在关联计算中按照不同关联类型进行查询和提取;关联强度子模块,用于通过一个预设区间段的实数刻画任意两个实体对象之间的关联强度。在一实施例中,所述实体对象的结构,包括:基本数据、属性标签数据及扩展属性数据,其中,基本数据包括实体对象的识别信息、概念分类、名称和关联信息;属性标签数据通过以键值对的形式附在实体对象上描述所述实体对象特征;扩展属性数据包括隶属于实体对象的所有数据结构的信息。在一实施例中,所述扩展属性数据结构的信息,包括:数据类型和承载数据类型的结构容器,其中,数据类型包括:字符数据类型和二进制数据类型;结构容器包括:列表结构、时间序列结构和映射表结构。在一实施例中,基于深度知识图谱的数据库系统还包括:操作功能模块,用于对概念、实体对象、属性标签及扩展属性进行创建、删除、修改及查询操作;扩展属性数据操作模块,用于对扩展属性中的数据信息进行数据添加、修改、筛选、转换、分页和计算操作;搜索模块,用于基于逆向索引的方式对数据库的实体对象进行搜索;文件管理模块,用于通过多媒体文件管理框架将多媒体资源嵌入知识图谱中;文件查询模块,用于文件数据的提取、转换和基本操作;权限管理模块,用于通过预设权限管理机制控制不同实体对象之间的访问权限;接口模块,用于建立关于概念、实体对象及对象用户的数据库操作接口。在一实施例中,所述搜索模块通过使用数据库的集合功能,在通过概念划分得到的一个范围内基于实体对象三个层次的信息进行逆向索引的计算。在一实施例中,所述三个层次分别是对象层面、对象属性层面和属性内的单元层面。在一实施例中,所述权限管理机制,包括:接收用户对象发送的请求,其中,请求中包含用户对象的识别信息;根据用户对象的识别信息提取操作的主体以及权限范围;根据所述操作的主体以及权限范围判断用户对象有无进行目前操作的权限;在判定用户对象有进行目前的操作的权限后,执行此权限,并将操作结果返回至用户对象。在一实施例中,所述权限范围由实体对象储存的属性标签数据以及扩展属性数据确定的,包括:概念级别的权限和对象级别的权限,根据所述操作的主体以及权限范围判断用户对象有无进行目前操作的权限,包括,判断概念级别有无进行目前操作的权限;当概念级别有进行目前操作的权限,执行此权限,并将操作结果返回至用户对象;当概念级别无进行目前操作的权限,判断对象级别有无进行目前操作的权限;当对象级别有进行目前操作的权限,执行此权限,并将操作结果返回至用户对象;当对象级别无进行目前操作的权限,则判定用户对象无进行目前操作的权限。本专利技术技术方案,具有如下优点:1.本专利技术提供的基于深度知识图谱的数据库系统,通过引入深度知识图谱机制,解决了传统知识图谱数据库信息表达能力不足,无法有效支撑大多数工业和商业应用系统后台数据服务需求的问题。数据库底层支持多种基础性的数据操作满足不同应用场景的需求。2.本专利技术提供的基于深度知识图谱的数据库系统,允许超大型知识图谱数据库的构建和使用,节点数量规模可达到亿级。通过在知识图谱中引入“概念”划分机制,解决了超大型知识图谱中由于对象节点过多导致计算效率低下的问题。能够实现毫秒级别的关联查询,极大提升了知识图谱中核心操作的实用性。3.本专利技术提供的基于深度知识图谱的数据库系统,在深度知识图谱数据库体系内完整的嵌入一个多媒体文件的管理框架,使得多媒体管理框架与主题数据库的实体对象数据能够无缝配合,共同表示一个内部装有任意多个多媒体信息的实体对象,从而解决了一般类知识图谱数据库支持多媒体数据困难的问题。4.本专利技术提供的基于深度知识图谱的数据库系统,完善了权限管理机制,建立了用户权限代理对象的概念。通过权限关联,实现不同对象之间的访问权限控制,并且权限控制可以具体到对象内部的属性级别,实现精细的数据读取和编辑控制。5.本专利技术提供的基于深度知识图谱的数据库系统,采用基于逆向索引的搜索方法,在知识图谱数据库内部实现了全局的文本搜索算法。实现对象级别和对象内级别的搜索,并且通过算法内部的改进实现了毫秒级的全范围全文本搜索。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中基于深度知识图谱的数据库系统的一个具体示例的原理框图;图2为本专利技术实施例中不同的概念之间的一个树状结构图;图3为本专利技术实施例中关联计算模块的一个具体示例的原理框图;图4为本专利技术实施例中基于深度知识图谱的数据库系统的一个数据结构图;图5为本专利技术实施例中结构容器类型图;<本文档来自技高网...

【技术保护点】
1.一种基于深度知识图谱的数据库系统,其特征在于,包括:概念分割模块、关联创建模块及关联计算模块,其中,/n概念分割模块,用于根据实体对象概念将知识图谱的全体实体对象分割为多个子集;/n关联创建模块,用于根据分割后的多个子集创建实体对象之间的关联,生成关联对象集合;/n关联计算模块,用于将关联对象集合按照关联的类型进行分组,并使用独立内存数据库对关联对象集合进行存取计算。/n

【技术特征摘要】
1.一种基于深度知识图谱的数据库系统,其特征在于,包括:概念分割模块、关联创建模块及关联计算模块,其中,
概念分割模块,用于根据实体对象概念将知识图谱的全体实体对象分割为多个子集;
关联创建模块,用于根据分割后的多个子集创建实体对象之间的关联,生成关联对象集合;
关联计算模块,用于将关联对象集合按照关联的类型进行分组,并使用独立内存数据库对关联对象集合进行存取计算。


2.根据权利要求1所述的基于深度知识图谱的数据库系统,其特征在于,关联计算模块,包括:
关联类型子模块,用于指定任何两个实体对象之间的关联类型以及在关联计算中按照不同关联类型进行查询和提取;
关联强度子模块,用于通过一个预设区间段的实数刻画任意两个实体对象之间的关联强度。


3.根据权利要求1所述的基于深度知识图谱的数据库系统,其特征在于,所述实体对象的结构,包括:基本数据、属性标签数据及扩展属性数据,其中,
基本数据包括实体对象的识别信息、概念分类、名称和关联信息;
属性标签数据通过以键值对的形式附在实体对象上描述所述实体对象特征;
扩展属性数据包括隶属于实体对象的所有数据结构的信息。


4.根据权利要求3所述的基于深度知识图谱的数据库系统,其特征在于,所述扩展属性数据结构的信息,包括:数据类型和承载数据类型的结构容器,其中,
数据类型包括:字符数据类型和二进制数据类型;
结构容器包括:列表结构、时间序列结构和映射表结构。


5.根据权利要求1所述的基于深度知识图谱的数据库系统,其特征在于,还包括:
操作功能模块,用于对概念、实体对象、属性标签及扩展属性进行创建、删除、修改及查询操作;
扩展属性数据操作模块,用于对扩展属性中的数据信息进行数据添加、修改、筛选、转换、分页和计算操作;
搜索模块...

【专利技术属性】
技术研发人员:陆洋陈新明赵洹琪
申请(专利权)人:陆洋
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1