一种应用知识推理到知识图谱生成方法及系统技术方案

技术编号:25638476 阅读:46 留言:0更新日期:2020-09-15 21:30
本发明专利技术涉及知识推理技术领域,具体涉及一种应用知识推理到知识图谱生成方法及系统,包括六个步骤、web管理平台、业务平台数据库DB、Engine平台、Hive数据源、TmpDB临时数据源以及DataSource数据源;其中,步骤一为通过web管理平台上传自定义算法程序,并配置参数;步骤二为通过配置推理场景。本发明专利技术,其解决了知识推理到知识图谱生成整个流程缺少可自定义推理算法,可视化配置,自动化本体构建,并同步生成可视化的知识图谱的问题,用户可通过可视化的页面进行自定义算法的配置以及推理场景的配置,再通过自研的工作流管理系统,利用airflow,spark对知识进行推理,最终通过自研的ETL工具,实现知识图谱的本体构建,以及可视化的图谱展。

【技术实现步骤摘要】
一种应用知识推理到知识图谱生成方法及系统
本专利技术涉及知识推理
,更具体地说,它涉及一种应用知识推理到知识图谱生成方法及系统。
技术介绍
知识推理是指在计算机或智能系统中,模拟人类的智能推理方式,依据推理控制策略,利用形式化的知识进行机器思维和求解问题的过程。知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。迄今为止,其实际应用在发达国家已经逐步拓展并取得了较好的效果,但它在我国仍属研究的起步阶段。现有技术中存在知识推理到知识图谱生成整个流程缺少可自定义推理算法,可视化配置,自动化本体构建,并同步生成可视化的知识图谱的问题,导致难以实现知识图谱的本体构建,以及可视化的图谱展。
技术实现思路
针对现有技术存在的不足,本专利技术的目的在于提供一种应用知识推理到知识图谱生成方法及系统,其解决了知识推理到知识图谱生成整个流程缺少可自定义推理算法,可视化配置,自动化本体构建,并同步生成可视化的知识图谱的问题,用户可通过可视化的页面进行自定义算法的配置以及推理场景的配置,再通过自研的工作流管理系统,利用airflow,spark对知识进行推理,最终通过自研的ETL工具,实现知识图谱的本体构建,以及可视化的图谱展,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供了如下技术方案:一种应用知识推理到知识图谱生成方法,包括如下步骤:步骤一、通过web管理平台上传自定义算法程序,并配置参数;步骤二、通过配置推理场景,对推理任务进行编排,使用手动或定时触发任务执行;步骤三、在编排任务创建后将对知识图谱进行本体构建;步骤四、通过airflow,spark对推理任务进行调度;步骤五、通过自研的ETL工具将推理出来的数据保存到知识图谱本体对应数据源中;步骤六、最终在知识图谱可视化页面中实时查看自定义推理算法产生的数据。本专利技术还提出一种应用知识推理到知识图谱生成系统,包括web管理平台、业务平台数据库DB、Engine平台、Hive数据源、TmpDB临时数据源以及DataSource数据源;所述web管理平台用于上传自定义推理算法、配置算法参数,用于生成推理场景配置程序P1,以及用于生成可视化知识图谱管理程序P2,最终实现在知识图谱可视化页面中实时查看自定义推理算法产生的数据;所述业务平台数据库DB用于存储业务平台数据,并配合推理场景配置程序P1用于生成自定义算法组件Component以及airflow的DAG,所述DAG为airflow的一个场景工作流;所述Engine平台包括Engine模块和Read模块,所述Engine模块集成了airflow、spark的调度引擎,所述Read模块用于读数自定义算法组件Component任务节点中的数据并以此对自定义算法组件任务节点ALG1,ALG2,ALG3进行编排任务,在编排任务创建后将对知识图谱进行本体构建,然后通过airflow、spark对推理任务进行调度,再通过自研的ETL组件任务节点将推理出来的数据保存到知识图谱本体对应Hive数据源中、TmpDB临时数据源中以及DataSource数据源中。综上所述,本专利技术主要具有以下有益效果:本专利技术,解决了知识推理到知识图谱生成整个流程缺少可自定义推理算法,可视化配置,自动化本体构建,并同步生成可视化的知识图谱的问题,用户可通过可视化的页面进行自定义算法的配置以及推理场景的配置,再通过自研的工作流管理系统,利用airflow,spark对知识进行推理,最终通过自研的ETL工具,实现知识图谱的本体构建,以及可视化的图谱展。附图说明图1为一种实施方式的应用知识推理到知识图谱生成方法的流程图。具体实施方式以下结合附图1对本专利技术作进一步详细说明。实施例1一种应用知识推理到知识图谱生成方法,如图1所示,包括如下步骤:步骤一、通过web管理平台上传自定义算法程序,并配置参数;步骤二、通过配置推理场景,对推理任务进行编排,使用手动或定时触发任务执行;步骤三、在编排任务创建后将对知识图谱进行本体构建;步骤四、通过airflow,spark对推理任务进行调度;步骤五、通过自研的ETL工具将推理出来的数据保存到知识图谱本体对应数据源中;步骤六、最终在知识图谱可视化页面中实时查看自定义推理算法产生的数据。本专利技术还提出一种应用知识推理到知识图谱生成系统,包括web管理平台、业务平台数据库DB、Engine平台、Hive数据源、TmpDB临时数据源以及DataSource数据源;所述web管理平台用于上传自定义推理算法、配置算法参数,用于生成推理场景配置程序P1,以及用于生成可视化知识图谱管理程序P2,最终实现在知识图谱可视化页面中实时查看自定义推理算法产生的数据;所述业务平台数据库DB用于存储业务平台数据,并配合推理场景配置程序P1用于生成自定义算法组件Component以及airflow的DAG,所述DAG为airflow的一个场景工作流;所述Engine平台包括Engine模块和Read模块,所述Engine模块集成了airflow、spark的调度引擎,所述Read模块用于读数自定义算法组件Component任务节点中的数据并以此对自定义算法组件任务节点ALG1,ALG2,ALG3进行编排任务,在编排任务创建后将对知识图谱进行本体构建,然后通过airflow、spark对推理任务进行调度,再通过自研的ETL组件任务节点将推理出来的数据保存到知识图谱本体对应Hive数据源中、TmpDB临时数据源中以及DataSource数据源中。参照附图1,具体如下:推理场景配置程序P1用于可视化上传自定义推理算法,配置算法参数,以及推理场景配置程序;op1用于保存自定义算法,自定义算法配置,推理场景,构建知识图谱本体;DB为业务平台数据库用于存储业务平台数据;op2用于生成airflow的DAG,以及自定义算法组件Component;其中DAG为airflow的一个场景工作流;Engine模块集成了airflow,spark的调度引擎;Read模块用于读数组件任务节点,可从Hive数据源中读取数据;op3用于读取Hive数据;Hive为Hive数据源;ALG1,ALG2,ALG3为自定义算法组件任务节点;op4用于写入中间数据到TmpDB临时数据源;ETL为自研ETL工具任务节点;op5用于将推理产生的数本文档来自技高网
...

【技术保护点】
1.一种应用知识推理到知识图谱生成方法,其特征在于:包括如下步骤:/n步骤一、通过web管理平台上传自定义算法程序,并配置参数;/n步骤二、通过配置推理场景,对推理任务进行编排,使用手动或定时触发任务执行;/n步骤三、在编排任务创建后将对知识图谱进行本体构建;/n步骤四、通过airflow,spark对推理任务进行调度;/n步骤五、通过自研的ETL工具将推理出来的数据保存到知识图谱本体对应数据源中;/n步骤六、最终在知识图谱可视化页面中实时查看自定义推理算法产生的数据。/n

【技术特征摘要】
1.一种应用知识推理到知识图谱生成方法,其特征在于:包括如下步骤:
步骤一、通过web管理平台上传自定义算法程序,并配置参数;
步骤二、通过配置推理场景,对推理任务进行编排,使用手动或定时触发任务执行;
步骤三、在编排任务创建后将对知识图谱进行本体构建;
步骤四、通过airflow,spark对推理任务进行调度;
步骤五、通过自研的ETL工具将推理出来的数据保存到知识图谱本体对应数据源中;
步骤六、最终在知识图谱可视化页面中实时查看自定义推理算法产生的数据。


2.一种应用知识推理到知识图谱生成系统,其特征在于:包括web管理平台、业务平台数据库DB、Engine平台、Hive数据源、TmpDB临时数据源以及DataSource数据源;
所述web管理平台用于上传自定义推理算法、配置算法参数,用于生成推理场景配置程序P1,以及...

【专利技术属性】
技术研发人员:易滔
申请(专利权)人:北京海致星图科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1