基于多源异构数据的统一本体连接查询方法、介质及系统技术方案

技术编号:38412175 阅读:33 留言:0更新日期:2023-08-07 11:17
本发明专利技术涉及数据处理技术领域,尤其涉及一种基于多源异构数据的统一本体连接查询方法、计算机可读存储介质及系统。该基于多源异构数据的统一本体连接查询方法,基于预设的语义模型执行统一数据萃取OneID,使得各个多源异构数据被识别为统一格式ID,然后根据预设的本体模型构建OneID视图清单,为各个多源异构数据导入与本体模型对应的本体属性项,从而实现检索时基于本体属性项的语义适配,将语义适配最接近的统一格式ID输出为检索结果。从多个数据源中提取各种不同的数据,将其面向用户通过统一的、一致的业务语义,通过逻辑SQL进行数据访问和路由,并将最终结果呈现给用户,从而实现多源异构数据的统一、快速、便捷的访问。便捷的访问。便捷的访问。

【技术实现步骤摘要】
基于多源异构数据的统一本体连接查询方法、介质及系统


[0001]本专利技术涉及数据处理
,尤其涉及一种基于多源异构数据的统一本体连接查询方法、计算机可读存储介质及系统。

技术介绍

[0002]基于多源数据的大数据的数据查询及分析方式,传统方式是首先推进数据平台建设,将大量的数据汇集到一个中心后,再进行数据的标准化和清洗工作,最后基于汇总宽表数据进行数据查询和分析。见图1,传统构建方式通过数据接入层、中间层、应用层等逐层构建,数据查询及数据分析通过应用层数据模型进行查询和分析。现有技术存在数据太多,灵活性不够等问题,比如:随着业务发展,新的数据迅速产生,若将数据汇聚到数据湖,量不可控;庞大且适用性低的数据量使得面向新需求,往往需要从头去找新数据源再汇聚,进一步导致业务响应能力降低。如何在数据可信基础上提高业务响应能力成为本领域亟待解决的技术问题。

技术实现思路

[0003]本专利技术所要解决的技术问题是提供一种基于多源异构数据的统一本体连接查询方法以及存储有被执行时实现该方法的计算机程序的计算机可读存储介质,该基于多源异构数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多源异构数据的统一本体连接查询方法,其特征是,包括以下步骤:数据获取步骤,在物理层获取待处理的多源异构数据;数据映射步骤,将所获取的多源异构数据从物理层虚拟映射到逻辑层;本体模型处理步骤,对映射在逻辑层的各个多源异构数据,分别基于预设的语义模型执行统一数据萃取OneID,使得各个多源异构数据被识别为统一格式ID,多源异构数据的数据信息全部关联该统一格式ID;动态本体关联步骤,根据预设的本体模型构建OneID视图清单,为各个多源异构数据导入与本体模型对应的本体属性项;检索步骤,对接收的检索请求进行基于所述本体属性项的语义适配,将语义适配最接近的统一格式ID输出为检索结果。2.如权利要求1所述的基于多源异构数据的统一本体连接查询方法,其特征是,以各个多源异构数据的原始来源和业务特征作为这些多源异构数据各自的数据类别。3.如权利要求2所述的基于多源异构数据的统一本体连接查询方法,其特征是,根据所述多源异构数据所属的数据类别,确定出所述多源异构数据的分发策略。4.如权利要求3所述的基于多源异构数据的统一本体连接查询方法,其特征是,所述分发策略包括数据格式、数据传输协议、数据加密方式和数据摆渡机制当中的一种或多种。5.如权利要求2所述的基于多源异构数据的统一本体连接查询方法,其特征是...

【专利技术属性】
技术研发人员:高伟王全胜张晓光李劲松张东升
申请(专利权)人:广州信安数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1