流动分析工具化制造技术

技术编号:9360481 阅读:133 留言:0更新日期:2013-11-21 06:05
本发明专利技术提供了用于流动分析的方法、系统、和装置,包括编码在计算机存储介质上的计算机程序。在一个方面中,该方法包括修改(206)数据流图,该数据流图包括连接至少一个入口点和至少一个出口点的多条路径,该修改数据流图包括将把流动单元加入数据记录中和从数据记录中除去流动单元的部件加入数据流图中,每个流动单元标识数据记录穿过的一段路径。该方法还包括根据使用所修改数据流图处理多个数据记录获得的流动单元识别(222)执行路径。该方法还包括确定(230)多个数据记录的子集(232),其中该子集代表所选一组执行路径。

【技术实现步骤摘要】
【国外来华专利技术】流动分析工具化交叉引用相关申请本申请要求2011年1月7日提交、专利技术名称为“FlowAnalysisInstrumenta-tion(流动分析工具化)”的美国临时申请第61/430,625号的优先权,特此通过引用并入其全部内容。
本专利技术涉及流动分析。
技术介绍
数据流图用于对数据进行操作。将数据供给数据流图。数据流图对数据进行一系列操作。在一些情形下,对数据进行的一系列操作可以随数据记录而变。将小组的数据记录用于测试数据流图;但是,选择一组数据记录可能是困难的,因为所选的该组数据记录可能代表不了生产环境下的数据记录。
技术实现思路
本说明书描述与流动分析有关的技术。一般说来,描述在本说明书中的主题的一个方面可以用包括修改数据流图的动作的方法具体化,该数据流图包括连接至少一个入口点和至少一个出口点的多条路径。该修改数据流图包括将把流动单元加入数据记录中和从数据记录中除去流动单元的部件加入数据流图中,每个流动单元标识数据记录穿过的一段路径。该方法还包括根据使用所修改数据流图处理多个数据记录获得的流动单元识别执行路径的动作。该方法还包括确定多个数据记录的子集的动作,其中该子集代表所选一组执行路径。这些和其他实施例每一个都可选地可以包括一种或多种如下特征。识别执行路径可以包括确定加入数据记录中的一组流动单元。该特征还可以包括识别多条路径中不在执行路径中的未用路径。该特征还可以包括使用数据流图处理多个数据记录的子集。处理多个数据记录可以包括将第一流动单元加入多个数据记录中的数据记录中。处理多个数据记录可以包括将第二流动单元加入该数据记录中,以及将第一流动单元加入第二流动单元中。识别执行路径可以包括从使用所修改数据流图处理的多个数据记录中除去流动单元,以及分析所除流动单元以便为每个数据记录确定执行路径。确定多个数据记录的子集可以包括识别具有一条所选执行路径的数据记录。可以实现描述在本说明书中的主题的特定实施例,以便获得一种或多种如下好处。可以简化数据流图的调试。可以选择使数据流图得到充分锻炼的数据记录的样本集合。可以随着各个记录流过图形跟踪它们。在附图和下面的描述中展示了描述在本说明书中的主题的一个或多个实施例的细节。该主题的其他特征、方面、和好处可以从该描述、附图、和权利要求书中明显看出。附图说明图1例示了通过数据流图的执行路径;图2例示了可以确定数据记录的记录谱系(lineage)的示范性环境;图3例示了使用流动单元跟踪通过所修改数据流图的记录的例子;图4例示了消耗流动单元的例子;图5例示了使用流动单元跟踪通过数据流图的路径的例子;图6例示了识别导致输出数据记录的产生的输入数据记录的例子;图7例示了修改数据流图的数据源部件以便将流动单元加入数据记录中的例子;图8例示了修改有多个输出端口的部件以便将流动单元加入数据记录中的例子;图9例示了修改数据宿以便处理流动单元的例子;图10例示了跨过多个数据流图地使用流动单元的例子;以及图11例示了流动分析的示范性过程。各种附图中的相同标号和名称指示相同元件。具体实施方式一般说来,流动分析允许更全面地理解一组数据记录内值的分布、数据记录之间的关系、和处理数据记录以产生输出记录的方式。图1例示了通过数据流图的执行路径。数据流图102包括可以从入口点104(例如,数据源)到出口点106,112(例如,数据宿)处理数据记录的多条路径,例如,路径108和路径110。在该例子中,路径108从入口点104通到出口点106。路径110从相同入口点104开始但分支到出口点112。一般说来,数据流图由一些部件和识别数据记录在这些部件之间的流动的链路组成。这些部件包括数据源、数据宿、和用于处理的部件。数据源可以提供进入数据流图的入口点,以及可以读取通过该图形处理的一组数据记录。例如,数据源可以包括关系数据库中的表格或文件系统上的文件。数据源从表格或文件中读取记录并创建数据记录。数据宿可以提供从数据流图中出来的出口点,以及一旦数据流图完成了处理,就可以存储输出记录。数据源和数据宿可以包括,例如,关系数据库的表格或存储在文件系统上的文件。数据流图可以在计算机112或其他类型的计算机设备上执行。在其他实现中,数据流图的执行可以分配给多个计算设备。在一些实现中,这些部件可以包括输入端口和输出端口。这些链路将第一部件的输出端口与第二部件的输入端口连接。一些部件可以具有多个输入和输出端口。数据记录可以从入口点航行到出口点的一系列部件和链路被称为路径(例如,路径108,110)。流动分析是跟踪数据记录流过一个或多个数据流图的过程。流动分析使得可以在调试,测试和剖析(profiling)的领域中调试,测试和剖析一组新的应用程序。对于调试,流动分析使得可以在通过图形处理各个数据记录时跟踪各个数据记录。用户可以标记一个或多个记录,或停止在断点上,以及图形开发环境跟踪指定记录通过图形的路径,包括识别依赖于指定记录的任何记录和指定记录所依赖的任何记录。开发者可以识别可能呈现难以预料结果的输出数据记录,观看用于创建数据记录的输入数据记录,以及跟踪那些输入数据记录以确定数据流图可能表现得出人意外的地方。对于测试,流动分析使用户能够生成只包含通过特定路径的记录的输入数据的子集。通过根据通过数据流图的特定路径选择输入数据,可以保护所处理数据记录的引用完整性。对于剖析,流动分析使用户能够创建将记录分类成群的图形,然后从这些类别中的记录所依赖的输入数据集中生成记录的子集。例如,一个图形可以通过居住地和产品类别将输入的顾客和交易分成群,然后分解计算的输出记录据此落在“有利可图”的输出数据宿中还是落在“无利可图”的输出数据宿中的顾客和交易记录。图2例示了可以确定数据记录的谱系的示范性环境。运行在计算机,例如,来自图1的计算机112上的示范性系统200包括数据流图中心库202。如过程箭头204所表示,数据流图工具化引擎206从数据流图中心库202中获取数据流图。数据流图工具化引擎206修改数据流图,以便使数据流图能够随着如下面所讨论,通过修改的图形处理数据记录,跟踪它们的记录级谱系。数据流图工具化引擎206可以是,例如,运行在计算机上的进程。在一些实现中,数据流图工具化引擎206将使数据记录能够流过数据流图以便加以跟踪的处理部件加入数据流图中。例如,附加处理部件可以将附加字段加入每个数据记录中。这些附加字段可以称为流动单元。在一些实现中,每个流动单元标识通过数据流图的一段路径。该流动单元可以从数据记录中除去和存储起来供以后分析用。在一些实现中,数据流图工具化引擎本身可以包括接受数据流图作为输入和产生修改的数据流图的工具化数据流图。如过程箭头208所表示,可以将修改的数据流图提供给数据流图运行时环境210,数据流图运行时环境210可以是运行在一台计算机或多台计算机上的一个或多个进程。如过程箭头212所表示,将来自数据源214的数据记录提供给数据流图运行时环境210。数据流图运行时环境210使用修改的数据流图处理数据记录。如过程箭头216所表示,修改的数据流图将流动单元存储在流动单元中心库218中。流动单元中心库218可以是,例如,关系数据库或文件系统上的文件。如过程箭头220所表示,流动单元分析引擎222分析存储的流动单元。从本文档来自技高网...
流动分析工具化

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2011.01.07 US 61/430,6251.一种计算机实现的方法,其包括:修改数据流图,该数据流图包括连接至少一个入口点和至少一个出口点的多条路径,该修改数据流图包括:将把流动单元加入数据记录中和从数据记录中除去流动单元的部件加入数据流图中,其中,每个流动单元利用标识以下的信息来标记指定数据记录:(i)经所述数据流图的路径中的被所述指定数据记录穿过的一段、以及(ii)在所述指定数据记录依赖于一个或多个其它数据记录的情况下所述指定数据记录所依赖的一个或多个其它数据记录;针对利用修改后的数据流图所处理的数据记录,基于标记所述数据记录的一个或多个流动单元来生成记录谱系,所述谱系指定(i)所述数据流图的所述多条路径中的哪条路径被所述数据记录穿过、以及(ii)在所处理的数据记录依赖于一个或多个其它数据记录的情况下所处理的数据记录所依赖的一个或多个其它数据记录;基于所生成的记录谱系,标识所述数据记录经所述修改后的数据流图的执行路径,所述修改后的数据流图包括连接所述至少一个入口点和所述至少一个出口点的所述多条路径;以及基于经所述修改后的数据流图的所述执行路径中的所选择的一组执行路径,确定所述多个数据记录的子集,该子集的数据记录已穿过所述所选择的一组执行路径,其中所述修改后的数据流图包括连接所述至少一个入口点和所述至少一个出口点的所述多条路径。2.如权利要求1所述的方法,其中识别执行路径包括确定加入数据记录中的一组流动单元。3.如权利要求1所述的方法,进一步包括识别所述多条路径中不在所述执行路径中的未用路径。4.如权利要求1所述的方法,进一步包括使用所述数据流图处理多个数据记录的所述子集。5.如权利要求1所述的方法,其中处理多个数据记录包括将第一流动单元加入所述多个数据记录中的数据记录中。6.如权利要求5所述的方法,其中处理多个数据记录包括将第二流动单元加入该数据记录中,以及将所述第一流动单元加入所述第二流动单元中。7.如权利要求1所述的方法,其中识别执行路径包括:从使用修改后的数据流图处理的多个数据记录中除去流动单元;以及分析所除去的流动单元以便为每个数据记录确定执行路径。8.如权利要求7所述的方法,其中确定多个数据记录的所述子集包括识别具有所述所选择的一组执行路径中的一条执...

【专利技术属性】
技术研发人员:AF罗伯茨
申请(专利权)人:起元技术有限责任公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1