一种企业数据架构方法技术

技术编号:27975387 阅读:58 留言:0更新日期:2021-04-06 14:09
一种企业数据架构方法,包括以下步骤,扫描企业数据仓库,采集该数据仓库的元数据,获得应用数据模型;利用数据血缘分析工具,获得物理‑应用数据模型的交叉映射关系;依据物理‑应用数据模型的交叉映射关系,识别并定义业务数据对象;分析物理‑应用数据模型的交叉映射关系,建立业务数据对象间关系,形成企业逻辑数据模型。

【技术实现步骤摘要】
一种企业数据架构方法
本专利技术属于制造企业数据治理领域,特别涉及一种基于元模型交叉映射的企业数据架构方法。
技术介绍
随着制造业的发展,企业从产品设计研发、生产到商业活动变得越来越复杂,企业的运营和决策越来越依赖于高效、高质量的数据支持。针对该需求,企业目前的做法是对整个企业业务数据库的数据进行采集、整理聚集至数据仓库中,以支持跨部门、跨系统的数据分析和查询服务。然而,随着民机企业对民用飞机制造活动的开展,对于数据的分析需求越来越广泛、深入,加之民机制造业业务和技术非常复杂,具有数据体量大、分布广、类型多的特点。如果民机企业数据架构不清,缺乏数据全景视图,则容易造成数据冗余,数据响应不及时,提供数据不一致等问题。如果民机企业数据资产使用效率低下,将严重制约数据共享服务能力提升。基于此,民机制造业迫切需要构建企业全局高度的数据架构,以支持企业数据治理,保障企业数据价值的有效发挥。
技术实现思路
本专利技术的目的在于提供一种基于元模型交叉映射的数据架构方法,以通过比对业务系统物理模型与数据仓库应用数据模型的映射关系,构建企业全局高度的逻辑数据模型,为企业数据治理、数据服务领域提供有力支持。本专利技术实施例之一,一种企业数据架构方法,包括以下步骤,扫描企业数据仓库,采集该数据仓库的元数据,获得应用数据模型;利用数据血缘分析工具,获得物理-应用数据模型的交叉映射关系;依据物理-应用数据模型的交叉映射关系,识别并定义业务数据对象;分析物理-应用数据模型的交叉映射关系,建立业务数据对象间关系,形成企业逻辑数据模型。附图说明通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:图1根据本专利技术实施例之一的基于元数据交叉映射的企业数据架构方法流程图。具体实施方式目前,在企业数据架构开发领域,大多数企业通过构建数据模型的方式来是实现。传统的实现方式通常有自上而下和自下而上两种。其中,自上而下方式依赖于对业务的熟悉度,建模人员需要大量的业务调研,虽然获得的业务信息较为精确,但往往耗时耗力。而自下而上方法需要从数据库入手构建数据与业务的映射关系,然而企业的系统建设技术架构并不统一,且企业对系统本身的数据情况并不完全掌握,导致数据资产盘点结果难以贴合业务实际。因此,企业需要一个上手难度小、人员要求低、过程标准化,且得到的结果准确、可靠,具备较高可落地性的数据架构梳理方法。针对上述难题,现有的解决方案是先利用元数据采集工具采集技术元数据,再从系统业务场景为源点采集相应业务元数据,对业务元数据进行链路分析,整合数据架构,提供数据全景视图,以支持数据问题追踪和数据热度分析。该方法从元数据角度出发,利用技术手段追踪数据链路,构建数据架构,有效减少了人力成本,且所开发数据架构具有较强的数据分析能力。然而该方案基于业务系统进行数据架构设计,实现元数据整合过程繁琐且技术依赖程度较高,难以推进落实。为了解决上述问题,本专利技术考虑从面向业务“主题”整合的数据仓库数据入手,探索高效构建企业全局高度数据架构的方法,以推进企业数据治理,实现企业数据资产可管理、可追溯,保障各业务系统间的数据的有效共享与服务。根据一个或者多个实施例,一种基于元模型交叉映射的企业数据架构方法,所述方法包括,扫描数据仓库,收集数据仓库的元数据,获得应用数据模型;利用数据血缘分析工具,获得物理-应用数据模型的交叉映射关系;依据物理-应用数据模型的交叉映射关系,识别并定义业务数据对象;分析物理-应用数据模型的交叉映射关系,建立业务数据对象间关系,形成逻辑数据模型。所述扫描数据仓库,收集数据仓库的元数据信息,获得应用元模型。具体操作为:采集数据仓库元数据包括:元数据的主题,数据表名称,字段名称等信息。此外,考虑到数据仓库建设是应用驱动型,则将其元数据所构建的模型称之为应用数据模型。元数据采集分为客户端和服务端两个部分,服务端与数据仓库及业务系统适配并采集元数据,客户端对元数据进行整合及可视化展现。所述利用数据血缘分析工具,获得物理-应用数据模型,方法包括:借助数据血缘分析工具,以数据仓库的元数据(应用数据模型)为起点,向前追溯数据来源,目的是理清当前数据从哪里来,又经过了怎样的处理。基于血缘分析结果,收集源业务系统元数据(以下将源业务系统元模型简称为物理数据模型),构建物理-应用数据模型的映射关系。其中采集源业务系统元数据包括:数据库类型、连接方式、Schema、数据结构、数据库表名、字段、描述等信息。所述依据物理-应用数据模型的交叉映射关系,识别并定义业务数据对象的步骤基于数据仓库应用数据模型提取数据对象。原因在于,源系统的物理数据模型通常严格遵循第三范式,以支持业务的可扩展性,需要进一步将业务关系紧密的元数据聚合形成一个数据对象。而数据仓库应用模型则强调数据整合,数据仓库表单设计依据“高内聚、低耦合”的原则,在物理实现中,已将业务关系紧密,源系统影响差异小的进行整合;业务关系小,源系统影响差异大的进行分而置之。相比之下,从应用数据模型中识别数据对象更为高效。并且,数据仓库应用模型通常采用星型模型,由事实表和维度表组成,其中事实表记录了某一业务主题的全量信息。因此,数据仓库事实表即可抽象为一个业务数据对象。此外,一般在数仓实现中,存在多张数据表抽取、整合相同或业务相近的源数据,造成数仓业务元数据重复或相似。因此,在数据资产梳理的过程中,需要将指向相同业务数据对象的元数据进行合并,以简化后续业务数据对象关联关系分析。具体实现方式为,依据物理-应用数据模型的交叉映射关系,计算两业务数据对象数据源的相似度,若相似度高于某一阈值,则将两数据对象合并。所述分析物理-应用数据模型的交叉映射关系,建立业务数据对象间关系,形成逻辑数据模型。旨在通过分析源系统物理数据模型的数据关联关系,来构建上述业务数据对象间的关联关系。原因在于,源系统物理模型通常基于业务流程中的每个业务动作设计一个事实表来追踪业务流程细节数据,而来基于数据仓库数据识别的数据对象则通常聚合一个业务流程的主体信息且保持数据对象间关系松散。因此需要借助物理数据模型找回数据对象间关联关系,具体实现方式为,针对存在同源数据的数据对象,依据计算结果,建立相应数据对象间的关联关系。针对不存在同源数据的数据对象,查询两数据对象间任一源数据表是否具有主外键关联关系,如果有则进行两数据对象关联。该方法通过物理-应用数据模型交叉映射关系分析,进而快速转化物理模型为业务层面逻辑数据模型。有效解决了自上而下构建逻辑数据模型时间周期长,自下而上缺乏对数据库数据了解,梳理结果无法贴合业务事实的问题。根据一个或者多个实施例,如图1所示,基于元模型交叉映射的数据架构方法的流程图。该方法具有以下步骤:步骤101,扫描数据仓库,收集数据仓库的元数据,获得应用数据模型;...

【技术保护点】
1.一种企业数据架构方法,其特征在于,包括以下步骤,/n扫描企业数据仓库,采集该数据仓库的元数据,获得应用数据模型;/n利用数据血缘分析工具,获得物理-应用数据模型的交叉映射关系;/n依据物理-应用数据模型的交叉映射关系,识别并定义业务数据对象;/n分析物理-应用数据模型的交叉映射关系,建立业务数据对象间关系,形成企业逻辑数据模型。/n

【技术特征摘要】
1.一种企业数据架构方法,其特征在于,包括以下步骤,
扫描企业数据仓库,采集该数据仓库的元数据,获得应用数据模型;
利用数据血缘分析工具,获得物理-应用数据模型的交叉映射关系;
依据物理-应用数据模型的交叉映射关系,识别并定义业务数据对象;
分析物理-应用数据模型的交叉映射关系,建立业务数据对象间关系,形成企业逻辑数据模型。


2.根据权利要求1所述的企业数据架构方法,其特征在于,所述扫描数据仓库的步骤中采集数据仓库的元数据包括该元数据的主题、数据表名称、字段名称,
通过服务端与数据仓库及业务系统适配并采集元数据,通过客户端对元数据进行整合及可视化展现。


3.根据权利要求2所述的企业数据架构方法,其特征在于,所述利用数据血缘分析工具的步骤包括,
借助数据血缘分析工具,以数据仓库的应用数据模型为起点,向前追溯数据来源,
基于血缘分析结果,收集源业务系统元数据,将源业务系统元模型定义为物理数据模型,构建物理-...

【专利技术属性】
技术研发人员:胡盛行刘彬李春鸣弘娅晖陈帅
申请(专利权)人:上海航空工业集团有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1