跟踪数据集血缘关系中的错误制造技术

技术编号:35464981 阅读:19 留言:0更新日期:2022-11-05 16:07
跟踪数据集血缘关系中的错误包括:从用户接收对模型数据集的改变,其中,模型数据集是包括从数据仓库检索的数据源的至少一部分的可重复使用的建模层;访问将模型数据集用作数据源的相关工作表的列表,其中,每个相关工作表均被配置为在不改变模型数据集的情况下对模型数据集内的第一数据源的一部分执行分析;生成利用模型数据集的相关工作表的错误报告;以及向用户提供利用模型数据集的相关工作表的错误报告。的错误报告。的错误报告。

【技术实现步骤摘要】
【国外来华专利技术】跟踪数据集血缘关系中的错误


[0001]本专利技术的领域是数据处理,或更确切地是用于跟踪数据集血缘关系(lineage)中的错误的方法、装置和产品。

技术介绍

[0002]现代企业可以将大量数据存储在基于云的数据仓库内的远程数据库中。可以使用数据库查询语言(诸如结构化查询语言(structured query language,SQL))来访问该数据。然而,数据的不同显示和配置可能需要构建复杂的查询,这对于大多数用户而言可能是困难的。进一步,不同用户可能会用不同方式从数据库检索和组织数据,从而导致相同数据的多个不同视图。

技术实现思路

[0003]用于跟踪数据集血缘关系中的错误的方法、系统和装置。跟踪数据集血缘关系中的错误包括:从用户接收对模型数据集的改变,其中,模型数据集是包括从数据仓库检索的数据源的至少一部分的可重复使用的建模层;访问将模型数据集用作数据源的相关工作表的列表,其中,每个相关工作表均被配置为在不改变模型数据集的情况下对模型数据集内的第一数据源的该部分执行分析;生成利用模型数据集的相关工作表的错误报告,包括:针对利用模型数据集的相关工作表的列表中的每个相关工作表,利用对模型数据集的改变来重建相关工作表以及确定所重建的相关工作表是否引起至少一个错误;以及向用户提供利用模型数据集的相关工作表的错误报告。
[0004]根据如在附图中示出的本专利技术的示例性实施例的以下更具体的描述,本专利技术的前述和其他目的、特征以及优点将是显而易见的,其中,相同的参考标记总体上表示本专利技术的示例性实施例的相同部件。
附图说明
[0005]图1阐述了根据本专利技术的实施例的被配置用于跟踪数据集血缘关系中的错误的示例系统的框图。
[0006]图2阐述了根据本专利技术的实施例的被配置用于跟踪数据集血缘关系中的错误的示例系统的框图。
[0007]图3阐述了根据本专利技术的实施例的被配置用于跟踪数据集血缘关系中的错误的示例图形用户界面的框图。
[0008]图4阐述了示出根据本专利技术的实施例的用于跟踪数据集血缘关系中的错误的示例性方法的流程图。
[0009]图5阐述了示出根据本专利技术的实施例的用于跟踪数据集血缘关系中的错误的示例性方法的流程图。
[0010]图6阐述了示出根据本专利技术的实施例的用于跟踪数据集血缘关系中的错误的示例
性方法的流程图。
具体实施方式
[0011]从图1开始,参照附图描述根据本专利技术的用于跟踪数据集血缘关系中的错误的示例性方法、装置和产品。图1阐述了根据本专利技术实施例的自动计算机器的框图,该自动计算机器包括被配置用于跟踪数据集血缘关系中的错误的示例性计算系统(152)。图1的计算系统(152)包括至少一个计算机处理器(156)或

CPU

以及随机存取存储器(168)(

RAM

),该随机存取存储器(168)通过高速存储器总线(166)和总线适配器(158)连接到处理器(156)和计算系统(152)的其他组件。
[0012]操作系统(154)存储在RAM(168)中。根据本专利技术的实施例的在被配置用于跟踪数据集血缘关系中的错误的计算机中有用的操作系统包括:UNIX
TM
、Linux
TM
、Microsoft Windows
TM
、AIX
TM
以及本领域技术人员将想到的其他操作系统。图1的示例中的操作系统(154)被在RAM(168)中示出,但是这样的软件的许多组件通常也被存储在非易失性存储器中,诸如被存储在数据存储装置(170)(诸如盘驱动器)上。建模模块(126)也存储在RAM中,该建模模块(126)是根据本专利技术的实施例的用于跟踪数据集血缘关系中的错误的模块。
[0013]图1的计算系统(152)包括:通过扩展总线(160)和总线适配器(158)耦接至处理器(156)和计算系统(152)的其他组件的盘驱动适配器(172)。盘驱动适配器(172)将非易失性数据存储装置以数据存储装置(170)的形式连接到计算系统(152)。根据本专利技术实施例的在被配置用于跟踪数据集血缘关系中的错误的计算机中有用的盘驱动适配器包括:集成驱动电子设备(Integrated Drive Electronic,

IDE

)适配器、小型计算机系统接口(Small Computer System Interface,

SCSI

)适配器和本领域技术人员将会想到的其他适配器。如本领域技术人员将想到的,非易失性计算机存储器还可以被实现为光盘驱动器、电可擦除可编程只读存储器(所谓的

EEPROM



快闪

存储器)、RAM驱动器等。
[0014]图1的示例计算系统(152)包括:一个或更多个输入/输出(

I/O

)适配器(178)。I/O适配器通过例如软件驱动器和计算机硬件实现面向用户的输入/输出,用于控制到诸如计算机显示屏之类的显示设备的输出,以及控制来自诸如键盘和鼠标之类的用户输入设备(181)的用户输入。图1的示例计算系统(152)包括:视频适配器(209),该视频适配器(209)是特别设计用于将图形输出到显示设备(180)(诸如显示屏或计算机监视器)的I/O适配器的示例。视频适配器(209)通过高速视频总线(164)、总线适配器(158)以及前端总线(162)(该前端总线(162)也是高速总线)连接到处理器(156)。
[0015]图1的示例性计算系统(152)包括:用于与其他计算机进行数据通信以及用于与数据通信网络进行数据通信的通信适配器(167)。可通过RS

232连接、通过外部总线(例如,通用串行总线(Universal Serial Bus,

USB

))、通过数据通信网络(例如,IP数据通信网络)和以本领域的技术人员将想到的其他方式串行地执行这种数据通信。通信适配器实现硬件级别的数据通信,通过该硬件级别的数据通信,一个计算机直接地或通过数据通信网络向另一个计算机发送数据通信。根据本专利技术实施例的在被配置用于跟踪数据集血缘关系中的错误的计算机中有用的通信适配器的示例包括:用于有线拨号通信的调制解调器、用于有线数据通信的以太网(IEEE 802.3)适配器和用于无线数据通信的802.11适配器。
[0016]通信适配器(167)通信地耦接至广域网(190),该广域网(190)还包括:基于云的数
据仓库(192)和客户端系统(194)。基于云的数据仓库(192)是托管用于通过广域网(190)访问的数据库的计算系统或计算系统组。客户端计算系统(194)是使用计算系统(152)上的建模模块(126)访问数据库的计算系统。
[0017]图2示出了根据本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种跟踪数据集血缘关系中的错误的方法,所述方法包括:从用户接收对模型数据集的改变,其中,所述模型数据集是包括从数据仓库检索的数据源的至少一部分的可重复使用的建模层;访问将所述模型数据集用作数据源的相关工作表的列表,其中,每个相关工作表均被配置为在不改变所述模型数据集的情况下对所述模型数据集内的第一数据源的一部分执行分析;生成利用所述模型数据集的所述相关工作表的错误报告,包括:针对利用所述模型数据集的所述相关工作表的列表中的每个相关工作表,利用对所述模型数据集的所述改变来重建所述相关工作表;以及确定所重建的相关工作表是否引起至少一个错误;以及向所述用户提供利用所述模型数据集的所述相关工作表的所述错误报告。2.根据权利要求1所述的方法,其中,利用对所述模型数据集的所述改变来重建所述相关工作表包括:在不从所述数据仓库检索所述数据源的情况下重建所述相关工作表。3.根据权利要求1所述的方法,其中,利用对所述模型数据集的所述改变来重建所述相关工作表包括:使用本地数据源来重建所述相关工作表。4.根据权利要求1所述的方法,其中,生成利用所述模型数据集的所述相关工作表的所述错误报告还包括:组织所述错误报告以将来自不同相关工作表的相似错误分组在一起。5.根据权利要求1所述的方法,其中,向所述用户提供利用所述模型数据集的所述相关工作表的所述错误报告包括:生成建议的错误解决动作。6.根据权利要求1所述的方法,其中,确定所重建的相关工作表是否引起至少一个错误包括:确定所重建的相关工作表中的函数是否涉及移除的元素。7.根据权利要求1所述的方法,其中,对模型数据集的所述改变是对所述模型数据集的列的改变。8.一种用于跟踪数据集血缘关系中的错误的装置,所述装置包括:计算机处理器、操作地耦接至所述计算机处理器的计算机存储器,所述计算机存储器中布置有计算机程序指令,所述计算机程序指令在由所述计算机处理器执行时,使所述装置执行以下步骤:从用户接收对模型数据集的改变,其中,所述模型数据集是包括从数据仓库检索的数据源的至少一部分的可重复使用的建模层;访问将所述模型数据集用作数据源的相关工作表的列表,其中,每个相关工作表均被配置为在不改变所述模型数据集的情况下对所述模型数据集内的第一数据源的一部分执行分析;生成利用所述模型数据集的所述相关工作表的错误报告,包括:针对利用所述模型数据集的所述相关工作表的列表中的每个相关工作表,利用对所述模型数据集的所述改变来重建所述相关工作表;以及确定所重建的相关工作表是否引起至少一个错误;以及向所述用户提供利用所述模型数据集的所述相关工作表的所述错误报告。9.根据权利要求8所述的装置,其中,利用对所述模型数据集的所述改变来重建所...

【专利技术属性】
技术研发人员:约瑟夫
申请(专利权)人:西格玛计算机有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1