知识图谱的构建方法及装置制造方法及图纸

技术编号:20655110 阅读:81 留言:0更新日期:2019-03-23 06:48
本发明专利技术公开了一种知识图谱的构建方法及装置。其中,该方法包括:抽取预定科学领域的各个本体,并确定各个本体之间的关联关系,其中,本体用于对预定科学领域中的实体进行抽象表达;根据本体的本体类型以及本体之间的关联关系构建本体库;从预定数据源中获取预定科学领域的实体以及实体的结构化信息;将实体以及实体的结构化信息导入本体库,以构建预定科学领域的知识图谱。本发明专利技术解决了相关技术中采用的构建知识图谱的方式构建得到的知识图谱容易导致获取知识的效率较低的技术问题。

【技术实现步骤摘要】
知识图谱的构建方法及装置
本专利技术涉及知识图谱构建
,具体而言,涉及一种知识图谱的构建方法及装置。
技术介绍
知识图谱的构建是指建立图谱的数据模式,就是对整个知识图谱的结构进行定义。知识图谱有自顶向下和自底向上两种构建方式:自底向上构建,是借助一定的技术手段,从公开采集的数据中提取出资源模式,经人工审核之后,加入到知识库中,多用于通用知识图谱;而自顶向下指的是先基于大量数据为知识图谱定义好本体与数据模式,再将实体加入到知识库,多用于行业知识图谱。例如,数据科学是对数据进行科学研究的领域,是实现人工智能的主要途径。在研究过程中,数据科学家们往往自身拥有不同的专业知识与项目经验,但由于这些知识没有进行系统的管理与及时的共享,导致数据科学家在工作中遇到问题时只能通过网络查找零散的信息或者求助他人,加大了知识获取的时间成本以及降低了工作效率。针对上述相关技术中采用的用于构建知识图谱的方式构建得到的知识图谱容易导致获取知识的效率较低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种知识图谱的构建方法及装置,以至少解决相关技术中采用的构建知识图谱的方式构建得到的知本文档来自技高网...

【技术保护点】
1.一种知识图谱的构建方法,其特征在于,包括:抽取预定科学领域的各个本体,并确定各个本体之间的关联关系,其中,所述本体用于对所述预定科学领域中的实体进行抽象表达;根据所述本体的本体类型以及所述本体之间的关联关系构建本体库;从预定数据源中获取所述预定科学领域的实体以及所述实体的结构化信息;将所述实体以及所述实体的结构化信息导入所述本体库,以构建所述预定科学领域的知识图谱。

【技术特征摘要】
1.一种知识图谱的构建方法,其特征在于,包括:抽取预定科学领域的各个本体,并确定各个本体之间的关联关系,其中,所述本体用于对所述预定科学领域中的实体进行抽象表达;根据所述本体的本体类型以及所述本体之间的关联关系构建本体库;从预定数据源中获取所述预定科学领域的实体以及所述实体的结构化信息;将所述实体以及所述实体的结构化信息导入所述本体库,以构建所述预定科学领域的知识图谱。2.根据权利要求1所述的方法,其特征在于,根据所述本体的本体类型以及所述本体之间的关联关系构建本体库包括:根据所述本体中每个本体的属性参数确定所述本体中每个本体的本体类型;基于所述本体中每个本体的关联参数确定所述本体中每个本体之间的关联关系;根据所述本体中每个本体的本体类型以及所述本体中每个本体之间的关联关系构建所述本体库。3.根据权利要求1所述的方法,其特征在于,从预定数据源中获取所述预定科学领域的实体包括:获取预设过滤条件,并根据所述预设过滤条件对多个数据源进行过滤,得到属于所述预定科学领域的范畴的预定数据源;从所述预定数据源中获取所述预定科学领域的实体。4.根据权利要求1所述的方法,其特征在于,从所述预定数据源中获取所述预定科学领域的实体包括:对所述预定数据源进行信息抽取,得到所述预定科学领域的实体;其中,对所述预定数据源进行信息抽取包括:从半结构化数据和无结构数据中抽取信息,所述半结构数据为数据之间具有预定关系的数据,所述无结构数据为数据之间不具有预设关系的数据。5.根据权利要求4所述的方法,其特征在于,获取所述实体的结构化信息包括:通过命名实体识别、实体间关系抽取以及实体属性抽取技术,对所述预定科学领域的实体进行信息抽取,得到所述预定科学领域的实体的属性以及所述实体中每个实体之间的关联关系。6.根据权利要求1所述的方法,其特征在于,在从预定数据源中获取所述预定科学领域的实体以及所述实体的结构化信息之后,还包括:对所述预定科学领域的实体以及所述实体的结构化信息进行整合;其中,对所述预定...

【专利技术属性】
技术研发人员:任卓
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1