数据流探索制造技术

技术编号:13326061 阅读:69 留言:0更新日期:2016-07-11 15:27
被配置成捕捉数据源和数据客户端之间的第一数据流的系统、方法、以及非瞬态计算机可读介质。确定与所述第一数据流有关的一个或多个元素。用第一标记来标记所述第一数据流的至少一个元素。基于与所述数据有关的元素生成所述第一数据流的可视表示。响应于对于所述第一标记的选择根据所述第一标记来调整所述第一数据流的可视表示。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】数据流探索 专利
本文公开的专利技术设及数据分析,更具体地,设及提供对数据源和数据客户端之间 的数据流的分析。[000^ 背景 已知的是现代企业生成和交换数字数据作为它们的经营活动的结果。数字数据 (诸如电子邮件、电子文档、访问因特网、W及访问数据库)是常见的并且通常被用来促进企 业内的各种经营活动。当运类数字数据在各个计算设备之间交换(例如,通过计算机网络) 时,运些交换形成数据的流(即数据流),当数据流被分析时能够提供对于商业经营的有用 见解并且帮助公司和企业作出商业决策(例如,数据安全性或数据策略决策)。 不幸的是,关于数据流的信息常常被限制于日志文件(例如,服务器日志文件)中, 日志文件包含关于各种数据事务(例如,数据交换)的信息,但却W原始数据形式(例如,未 经格式化或缺乏可读性)提供运一信息,其中包含很少或者没有关于运些事务的分析或情 报。在大型商业企业的上下文中,运一数据分析或情报的缺少进一步由于存在于运类组织 中的数据流的数量和因此生成的大量的日志数据而令人恼怒。拥有能够分析关于数据流的 信息(例如描述数据事务的日志文件)并且提供(针对运类数据流的)易于阅读/理解的智能 分析的工具将是有益的。
技术实现思路
本公开的各实施例可包括用于捕捉数据源和数据客户端之间的第一数据流的系 统、方法、W及非瞬态计算机可读介质。确定与所述第一数据流有关的一个或多个元素。用 第一标记来标记所述第一数据流的至少一个元素。基于与所述数据有关的元素生成所述第 一数据流的可视表示。响应于对于所述第一标记的选择根据所述第一标记来调整所述第一 数据流的可视表示。 在一个实施例中,所述第一标记是由用户选择的。 在一个实施例中,用第二标记来标记所述第一数据流的另一元素。所述调整可视 表示包括响应于对所述第一标记的选择和对所述第二标记的选择根据所述第一标记和所 述第二标记来调整所述第一数据流的可视表示。[000引在一个实施例中,用注释对所述第一数据流的至少一个元素进行注释,所述可视 表示包括所述注释。 在一个实施例中,分析所述第一数据流。基于对所述第一数据流的分析优化第二 数据流的处理,所述第二数据流发生在所述第一数据流之后。 在一个实施例中,捕捉第二数据流。至少使用经优化的处理来分析所述第二数据 流。 在一个实施例中,捕捉第二数据流。确定所述第一数据流的第一语义身份;确定所 述第二数据流的第二语义身份。确定所述第一语义身份和所述第二语义身份是否类似或相 同。当例如所述第一和第二数据流设及重复的电子邮件或丢失的网络分组的失败的重传 (运导致第二、再次丢失的分组)时,所述第一语义身份和所述第二语义身份可被认为具有 类似或相同的语义身份(W及因此是彼此的别名)。 在一个实施例中,所述第一数据流与对数据源的第一数据库查询有关,所述第二 数据流与对数据源的第二数据库查询有关,所述第一语义身份是第一查询别名,并且所述 第二语义身份是第二查询别名。 在一个实施例中,基于确定所述第一语义身份和所述第二语义身份是否类似或相 同来分析所述第一数据流。 在一个实施例中,基于确定所述第一语义身份和所述第二语义身份是否类似或相 同来分析所述第二数据流。 在一个实施例中,捕捉所述第一数据流、标记所述第一数据流的至少一个元素 、W 及选择所述第一标记中的至少一者是基于用户定义的脚本来执行的。 在一个实施例中,执行所述用户定义的脚本。 在一个实施例中,从用户接收所述用户定义的脚本。 在一个实施例中,所述用户定义的脚本是基于对条件的满足而执行(例如实行) 的。 在一个实施例中,所述条件包括事件、日期、W及时间中的至少一者的发生。 在一个实施例中,在标记分层结构中组织所述第一标记。在一个实施例中,所述标记分层结构包括标记的非循环图。 在一个实施例中,执行基于所述第一标记的捜索。 在一个实施例中,为两个或更多个用户提供对于所述可视表示和所述第一标记的 协作式访问。 本专利技术的许多其它特征和实施例将通过伴随的附图和W下的详细描述而变得清 楚。附图简述 图1示出了根据本公开的一个实施例的数据流探索系统的示例环境。 图2示出了根据本公开的一个实施例的示例数据流探索系统。 图3示出了根据本公开的一个实施例的示例数据流探索客户端。 图4示出了根据本公开的一个实施例的示例数据流捕捉模块。 图5示出了根据本公开的一个实施例的示例数据流分析模块。 图6示出了根据本公开的一个实施例的用于分析数据流的示例过程。 图7示出了根据本公开的一个实施例的为了可视化用作数据源的数据库表和用作 数据客户端的数据库用户之间的多个数据库数据流而生成的Sankey示图的屏幕截图。 图8示出了根据本公开的一个实施例的Sankey示图的当与标记分层结构相关联的 特定标记被选择用于数据库表时的屏幕截图。 图9示出了根据本公开的一个实施例的包括与关于数据库数据流的正则查询有关 的详细测量的表的屏幕截图。 图10示出了根据本公开的一个实施例的为了可视化多个数据库数据流而生成的 Sankey示图的屏幕截图。 图11示出了根据本公开的一个实施例的为了可视化多个数据库数据流而生成的 Sankey示图的屏幕截图。 图12示出了根据本公开的一个实施例的可被用于各个场景的计算机系统的示例。 附图仅出于说明的目的描绘了所公开的技术的各个实施例,其中附图使用相同的附图标记 来标识相同的元件。本领域的技术人员将容易地从W下讨论中认识到,可W在不背离此处 所述的本专利技术的原则的情况下采用此处所示的结构和方法的替换实施例。 详细描述 在各实施例中,提供了用于分析数据源和数据客户端之间的一个或多个数据流的 系统和方法。运类系统和方法对于分析组织内或跨不同组织的数据源和数据客户端之间的 数据流和提供对于数据流的理解可能是有益的。 在一些情况下,如本文中描述的对数据流的分析可促进与数据供应链有关的各种 操作。例如,对数据流的分析可通过使用数据流分析来监视或审核数据供应链来维持数据 供应链的安全性或恰当的性能。数据供应链的示例可包括在其协作的环境下彼此共享专用 数据的两个协作公司之间的数据供应链。另一数据供应链可设及针对单个项目进行协作的 多个方,诸如一个总承包商和多个子承包商。供应链的其它示例可包括(1)由广告客户提交 给广告代理或电子商务系统的广告或用户数据、(2)公司提交的他们的物理供应链的数字 视图形式的定价和库存数据、或者(3)公司提交给其记账或其它处理供应商并W经处理形 式返回的记账、收益和其它财务数据。 数据供应链的又一示例可设及托管数据,其中不可信的各方想要将他们的数据相 关W生成总体统计,但是不想要让参与者中的任何单一方来执行对他们数据的分析。数据 受托方可接收原始数据、执行分析、并且将聚合结果分享给所有公司。例如,多家公司可将 其雇员补偿信息分享给计算平均补偿的商行,并且将该平均值分享给参与该平均值的计算 的公司;每家公司可随后针对该平均值制定其自己的补偿。当托管数据时,数据供应链可包 括数据受托方和托管方之间的那些数据供应链。数据流分析可确保数据受托方的安全性并 且向每一方保证他们的数据不会对其他方可用,其中分析可不间断地进行或者静态的、一 次性地进行。 本文中所使用的"数据流"可包括数据源本文档来自技高网...

【技术保护点】
一种计算机实现的方法,包括:由计算机系统捕捉数据源和数据客户端之间的第一数据流;由所述计算机系统确定与所述第一数据流有关的一个或多个元素;由所述计算机系统用第一标记来标记所述第一数据流的至少一个元素;由所述计算机系统基于与所述数据有关的元素生成所述第一数据流的可视表示;以及由所述计算机系统响应于对于所述第一标记的选择根据所述第一标记来调整所述第一数据流的可视表示。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:A·莱里奥斯T·瓦西拉基斯L·A·M·恩古耶J·M·阿德莱尔L·D·卡特勒D·A·斯卡伯勒
申请(专利权)人:麦塔奈迪克斯有限公司
类型:发明
国别省市:美国;US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1