【技术实现步骤摘要】
一种基于知识图谱的数据管理方法、系统、设备及介质
[0001]本专利技术涉及大数据
,特别指一种基于知识图谱的数据管理方法、系统、设备及介质。
技术介绍
[0002]随着大数据分析服务能力的不断提升,推动着企业经营分析、应用方式和架构的转变,以动态化、可视化、关联分析为核心的业务分析场景逐步成为主要手段。因此,产生了对大数据的数据指标进行管理的需求。
[0003]针对数据指标的管理,传统上仅仅停留在指标规范定义的层面,未对指标关系、指标口径进行管理,即只管理到数据指标的定义,导致存在如下缺点:容易出现指标口径不统一、同名不同义、同义不同名的情况,当数据指标的口径变更后,应用调整的工作量巨大,或出现真正落地的口径未发生变化,频发表里不一的情况。
[0004]因此,如何提供一种基于知识图谱的数据管理方法、系统、设备及介质,实现提升数据管理的质量,成为一个亟待解决的问题。
技术实现思路
[0005]本专利技术要解决的技术问题,在于提供一种基于知识图谱的数据管理方法、系统、设备及介质,实现提升数
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱的数据管理方法,其特征在于:包括如下步骤:步骤S10、服务器创建一仓库表,解析任务信息得到数据间的关联关系并存储至所述仓库表中;步骤S20、服务器获取待管理的大数据,并对所述大数据进行预处理;步骤S30、服务器从所述仓库表中读取关联关系,利用所述关联关系以及预处理后的大数据生成对应的知识图谱;步骤S40、基于所述知识图谱对大数据进行管理。2.如权利要求1所述的一种基于知识图谱的数据管理方法,其特征在于:所述步骤S10具体为:服务器创建一仓库表,通过ETL同步任务信息,并利用元数据管理工具解析所述任务信息得到数据间的关联关系,并将所述关联关系存储至仓库表中;所述关联关系为数据之间的生成关系、依赖关系以及数据类别。3.如权利要求1所述的一种基于知识图谱的数据管理方法,其特征在于:所述步骤S20具体为:服务器获取待管理的大数据,利用机器学习技术对所述大数据进行分词处理,生成若干个分词,并利用所述分词提取出指标名称以及指标定义。4.如权利要求3所述的一种基于知识图谱的数据管理方法,其特征在于:所述步骤S30具体为:服务器从所述仓库表中读取关联关系,以所述指标名称作为知识图谱的节点,以所述关联关系作为各节点间连接的边,进而基于各所述节点和边生成对应的知识图谱。5.一种基于知识图谱的数据管理系统,其特征在于:包括如下模块:关联关系解析模块,用于服务器创建一仓库表,解析任务信息得到数据间的关联关系并存储至所述仓库表中;大数据预处理模块,用于服务器获取待管...
【专利技术属性】
技术研发人员:陈翔,
申请(专利权)人:福建新大陆软件工程有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。