用于管理知识库的方法、装置、设备和介质制造方法及图纸

技术编号:21398950 阅读:24 留言:0更新日期:2019-06-19 06:59
根据本公开的示例实施例,提供了一种用于管理知识库的方法、装置、设备和计算机可读存储介质。一种用于管理知识库的方法,包括:响应于接收到针对第一命名空间的修改规则的请求,使得规则被复制到第一命名空间,规则用于约束知识库中的结构化数据;基于修改规则的请求,修改第一命名空间中的规则;以及将经修改的规则添加到与知识库相关联的规则库中。由此,本方案在灵活适配不同知识库的需求的同时,具有良好的复用性和可追溯性。

【技术实现步骤摘要】
用于管理知识库的方法、装置、设备和介质
本公开的实施例主要涉及信息处理领域,并且更具体地,涉及用于管理知识库的方法、装置、设备和计算机可读存储介质。
技术介绍
知识库由大量结构化数据组成。这些结构化数据需要遵循一定的表示规范,使得数据可以被人阅读和被机器理解。用于约束结构化数据的表示规范被称为规则或模式(Schema)。通常,在存在大量知识库实例(例如通用知识库、与各种专业领域相关的行业知识库,以及与各种产品相关的应用知识库)的情况下,在不同的知识库之间,存在对重复领域知识的描述。例如,影视库和明星库中都存在娱乐明星的数据,因此为这些知识库定义的规则也具有很大的相似性。然而,传统技术无法低成本地定义大量知识库的规则。
技术实现思路
根据本公开的示例实施例,提供了一种用于管理知识库的方案。在本公开的第一方面中,提供了一种用于管理知识库的方法,包括:响应于接收到针对第一命名空间的修改规则的请求,使得规则被复制到第一命名空间,规则用于约束知识库中的结构化数据;基于修改规则的请求,修改第一命名空间中的规则;以及将经修改的规则添加到与知识库相关联的规则库中。在本公开的第二方面中,提供了一种用于管理知识库的装置,包括:复制模块,被配置为响应于接收到针对第一命名空间的修改规则的请求,使得规则被复制到第一命名空间,规则用于约束知识库中的结构化数据;修改模块,被配置为基于修改规则的请求,修改第一命名空间中的规则;以及添加模块,被配置为将经修改的规则添加到与知识库相关联的规则库中。在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。在本公开的第四方面中,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了本公开的实施例能够在其中实现的一个示例环境的示意图;图2示出了本公开的实施例能够在其中实现的另一示例环境的示意图;图3示出了根据本公开的一些实施例的用于管理知识库的流程图;图4示出了根据本公开的一些实施例的用于管理知识库的装置的示意框图;以及图5示出了能够实施本公开的一些实施例的计算设备的框图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。术语“知识库”是指一种基于图的数据结构,由节点和边组成,例如知识图谱或其他适当的数据库。在知识库中,每个节点表示现实世界中存在的“实体”,每条边表示实体与实体之间的“关系”。知识库是关系的有效表示方式。换句话说,知识库将不同种类的信息连接在一起而得到的一个关系网络,从而提供了从“关系”的角度对问题进行分析的能力。术语“规则”是指用于约束知识库中的结构化数据的表示规范。术语“命名空间”是指一种代码组织的形式。通过命名空间来组织和重用代码,以区别不同的代码功能。如上文所述,传统技术无法低成本地定义大量知识库的规则。传统上,存在两种解决跨知识库的规则定义的方案。在第一种方案中,知识库的所有方独立负责构建其自己的规则。在存在数据重叠的知识库的情况下,线下共享所构建的规则体系。尽管独立定义规则具有高效和隔离的优势,但是当存在大量规则时,规则体系的管理成本、数据的使用和复用成本将显著提高。例如,针对语义上相同的类/属性,不同所有方定义的符号可能不同。相反,针对相同符号,不同所有方可能赋予完全不同的语义。此外,由于不同规则体系之间的复制无从追溯,因此在经过一段时间的升级之后,原本一致的符号变为不一致。上述问题导致在进行跨知识库的知识关联和计算时,需要进行大量的规则映射工作并且非常容易出错。在第二种方案中,通过定义统一的规则体系,使得所有知识库都遵循该规则体系的约束。尽管通过维护统一的规则体系可以解决知识表示的一致性问题,但是不可避免将导致更多其他问题。例如,规则体系的定义和合并成本很高,对规则定义方的专业和时间要求很高,使得统一的规则体系的更新周期较长,这不利于快速迭代的产品。此外,不同应用场景对知识库表示的依赖程度不同,即使针对相同的知识,不同应用所要求的知识表示规范也可能完全不同。统一的规则体系无法解决这些问题。为此,在此提出用于管理知识图谱的解决方案。总体而言,根据本公开的实施例,可以在一命名空间出现对规则进行定制的需求的情况下,将规则从包含统一定义的规则的规则库或另一命名空间中复制(fork)到该命名空间中,并且对被复制到该命名空间中的规则进行修改,以满足不同知识库的定制化要求。进一步地,可以将经修改的规则添加/合并到规则库中,以对规则库进行扩展。由此,本方案在灵活适配不同知识库的需求的同时,具有良好的复用性和可追溯性。图1示出了本公开的实施例能够在其中实现的一个示例环境100的示意图。如图1所示,环境100包括计算设备110、用户120(也被称为“第一用户”)、针对第一用户的命名空间130(也被称为“第一命名空间”)和规则库140。例如,计算设备110可以是分布式计算设备、大型机、服务器、个人计算机、平板计算机、智能电话等具有计算能力的任何设备。如上所述,知识库由大量结构化数据组成。这些结构化数据需要遵循一定的表示规范,用于约束结构化数据的表示规范被称为规则。在某些实施例中,结构化数据可以被表示为三元组。如下为结构化数据和规则的一个具体示例:第一结构化数据:(刘德华,wife,朱丽倩),第二结构化数据:(刘德华,isA,Person),第三结构化数据:(朱丽倩,isA,Person),规则:(Person,wife,Person),其中以三元组表示的第一结构化数据、第二结构化数据和第三结构化数据表示客观事实或实体,并且规则为基于客观事实或实体抽象的知识约束,规则可以用于验证第一结构化数据、第二结构化数据和第三结构化数据的合法性,也可以用于指导类似知识的生产。规则可以包含实体和实体之间的关系。例如,规则“(Person,wife,Person)”可以包含实体“Person”(也被称为类)和实体之间的关系“wife”(也被称为属性)。规则库140可以包含统一定义的规则。在某些实施例中,在新的知识库被创建时,第一用户120可以向计算设备110请求直本文档来自技高网
...

【技术保护点】
1.一种用于管理知识库的方法,包括:响应于接收到针对第一命名空间的修改规则的请求,使得所述规则被复制到所述第一命名空间,所述规则用于约束知识库中的结构化数据;基于所述修改规则的请求,修改所述第一命名空间中的所述规则;以及将经修改的所述规则添加到与所述知识库相关联的规则库中。

【技术特征摘要】
1.一种用于管理知识库的方法,包括:响应于接收到针对第一命名空间的修改规则的请求,使得所述规则被复制到所述第一命名空间,所述规则用于约束知识库中的结构化数据;基于所述修改规则的请求,修改所述第一命名空间中的所述规则;以及将经修改的所述规则添加到与所述知识库相关联的规则库中。2.根据权利要求1所述的方法,其中使得所述规则被复制到第一命名空间包括:使得所述规则从以下中的至少一项被复制到所述第一命名空间:所述规则库,以及第二命名空间,所述第二命名空间与所述第一命名空间不同。3.根据权利要求1所述的方法,其中修改所述规则包括:从所述修改规则的请求中确定用于修改所述规则的规则修改方式;以及基于所述规则修改方式,修改以下中的至少一项:所述规则包含的多个实体中的一个实体,以及所述多个实体之间的关系。4.根据权利要求1所述的方法,其中将经修改的所述规则添加到所述规则库中包括:响应于接收到从所述第一命名空间向所述规则库添加经修改的所述规则的请求,将经修改的所述规则添加到所述规则库中。5.根据权利要求4所述的方法,其中将经修改的所述规则添加到所述规则库中包括:发送要将经修改的所述规则添加到所述规则库的请求;以及响应于接收到允许将经修改的所述规则添加到所述规则库中的应答,将经修改的所述规则添加到所述规则库中。6.根据权利要求1所述的方法,还包括:响应于接收到针对第三命名空间的使用经修改的所述规则的请求,向第三命名空间提供经修改的所述规则,所述第三命名空间与所述第一命名空间不同。7.根据权利要求1所述的方法,还包括以下中的至少一项:以可视化方式输出经修改的所述规则;以及以用户编程接口方式输出经修改的所述规则。8.一种用于管理知识库的装置,包括:复制模块,被配置为响应于接收到针对第一命名空间的修改规则的请求,使得所述规则被复制到所述第一命名空间,所述规则用于约束知识库中的结构化数据;修改模块,被配置为基于所述修改规则的请求,修改所述第一命名空间中的所述规则;以及添...

【专利技术属性】
技术研发人员:王维煜陆超朱勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1