分析分布式数据集的数据系统架构技术方案

技术编号:3997310 阅读:232 留言:0更新日期:2012-04-11 18:40
一种支持通过电子的、安全的信道进行数据传输的方法、计算机可读介质和装置,其中,减少了收集、校对或发布报告结果的人工干预。可以为不同账户收集经由不同数据源的一致数据集。可对数据集中的数据条目进行进一步审核以确认数据的完整性。可以通过管理员机器的本地(分布式)网络对数据源进行备份,以便可以在另一个数据站点分析数据而不必破坏原数据。也可以通过使用账户间的标准商业规则生成报告。此外,支持定制报告允许多重(如由条目标准确定的)自由度。

【技术实现步骤摘要】

本专利技术总的来说涉及一种分布式数据系统,更具体地说,本专利技术提供了从一个数 据站点到另一数据站点镜像数据的方法、装置以及计算机可读介质。
技术介绍
分布式系统典型地包括通过数据通信网络互连的大量数据处理器。例如,在一个 数据站点的数据可以由在分布式系统中另一个数据站点执行的数据处理程序透明地访问。 在分布式数据库系统中,数据可以被分开并存储到几个数据站点中,目的是使其更靠近处 理器以便处理器在访问时降低通信网络中的数据业务量。然而,通常的情况是一些数据站 点必须访问位于另一数据站点的数据。这种远程访问增加了数据处理操作所涉及的成本和 延迟,使得这些数据站点的处理性能比拥有其自己的数据的等效的分立系统的处理性能明 显要差。另一个问题是在其他的网络数据站点的通信链接的失败或数据处理器的失败可能 妨碍在一定时期访问远程数据。因此,数据的可用性可能比每个数据站点都是分立系统的 情况更差。虽然分布式系统的目的是允许用户共享数据源,但是这些负面效果可能使得用 户不能够依赖远程数据访问。相比于简单的集中式系统来说,这些缺点又会减少分布式系 统的益处。分布式数据系统可以被分类为不同类型的数据系统,包括分布式文件系统或共享 文件系统。分布式文件系统典型地允许访问位于另一个远程主机上的文件,就像工作在实 际的主机计算机上。这使得在多个不同的机器上的多个用户可以共享文件并存储资源。用 户节点不能直接访问下面的块存储,但是可以使用协议经由网络来交互。这使得可以取决 于怎样设计协议,来根据限制根据访问列表对文件系统的访问,或限制服务器和客户端上 的性能。相反,在共享磁盘文件系统中,所有节点同等地访问文件系统所在的块存储。在这 些数据系统上,访问控制典型地驻留在客户端。分布式文件系统可能包括用于透明复制和 容错控制的工具(facility)。因此,当文件系统中有限数目的节点不在线时,系统继续工作 而没有任何数据丢失。此外,在分布式数据系统中,可以在一个数据站点创建数据文件。用户可能希望访 问和分析在该分布式数据系统的另一个数据站点的数据而不干扰原数据文件。
技术实现思路
本专利技术提供支持通过电子的安全信道的数据传输的分布式数据系统的方法、装置 和计算机可读介质,其中减少了收集、校对或发布报告结果的人工干预。可以为不同的账户 收集在不同的数据源之上的一致数据集。通过本专利技术的另一方面,数据集中的数据条目可被进一步审核以确认数据的完整 性。并且,可以通过管理员机器的本地(分布式)网络对数据源进行备份,使得就可以在另 一个数据站点分析数据而不必破坏原数据。通过本专利技术的另一方面,使用账户间的标准商业规则生成报告。并且,支持客户报告允许多重(如由条目标准确定的)自由度。通过本专利技术的另一方面,数据库架构支持对每个数据列表创建数据库副本的处 理,以及通过使用软件脚本和SQL (宏和查询)对来自多个数据站点的多个数据集进行校 对,并且使用预定义的商业规则对数据进行分析。通过本专利技术的另一方面,来自第一数据站点的第一数据集和第二数据站点的第二 数据集分别在本地数据站点被镜像。已镜像数据对应于聚集的数据集,并且基于商业规则 来进行分析。结果会被公布在分布式数据系统中的选定的数据站点。通过本专利技术的另一方面,相对独立的数据集而分析聚集的数据集。通过本专利技术的另一方面,定制报告标准是从数据站点接收的,而聚集的数据集是 基于定制报告标准来分析的。定制报告的结果可以被进一步报告给数据站点。附图说明通过实例的方式来图示本专利技术但是并不由附图限制,并且附图中相同的附图标记 指示相似的元件,附图中图1示出了根据本专利技术实施例的在增强型支付集成系统中使用的计算机系统。图2示出了根据本专利技术实施例的用于从数据库源到已镜像数据库镜像数据集的 框图。图3示出了根据本专利技术实施例的从SharePoint 站点镜像数据并对镜像数据进 行分析的流程图。图4示出了根据本专利技术实施例的在SharePoint站点镜像数据的流程图。图5示出了根据本专利技术实施例的定制报告已镜像数据的的流程图。图6A和图6B示出了根据本专利技术实施例的用于镜像和分析分布式数据集的数据库 架构。图7示出了根据本专利技术实施例的向SharePoint站点中输入数据的截屏。图8示出了根据本专利技术实施例的具有可通过参考号码来检查的数据条目的数据 表格(datasheet) 0图9示出了根据本专利技术实施例的可以编辑的数据条目。图10示出了根据本专利技术实施例的具有将已镜像数据库与SharePoint站点链接的 表的列表的截屏。图11示出了根据本专利技术实施例的截屏,其中每个SharePoint数据集是通过查询 (SQL)本地输入的,且然后被通过附加功能本地镜像。图12示出了根据本专利技术实施例的截屏,其中Visual Basic 脚本语句自动地进行 聚集处理。图13示出了根据本专利技术实施例的截屏,其中Microsoft Access 查询(SQL)分 析聚集数据,其中查询的逻辑顺序根据商业规则和报告需求来过滤数据。图14示出了根据本专利技术实施例的截屏,其中示例性的SQL代码用于对在线数据集 执行初步的本地数据库镜像。图15示出了根据本专利技术实施例的截屏,其中相对另一独立的数据集(总的基础要 求)对已校对的数据集进行分析。图16示出了根据本专利技术实施例的截屏,其中SQL查询进一步相对所预测的需求来 分析聚集数据。图17示出了根据本专利技术实施例的截屏,其中商业规则分析结果被附加到所链接 的报告表。图18示出了根据本专利技术实施例的截屏,其中来自所有已链接的SharePoint站点 /客户端的聚集结果被公布,并且被镜像到指定的SharePoint站点。图19示出了根据本专利技术实施例的截屏,其中查询分析的结果(由商业规则驱动) 被公布,并且在数据聚集SharePoint站点内可用。图20示出了根据本专利技术实施例的请求顾客报告的截屏。图21示出了根据本专利技术实施例的截屏,其中通过报告处理来引导管理员。图22示出了根据本专利技术实施例的其中呈现了定制报告的数据浏览的截屏。具体实施例方式通过本专利技术的这些方面,通过电子的和保密的信道传输数据,其中减少了收集、校 对或发布报告结果的人工干预。可以为不同的账户收集经由不同数据源的一致数据集。根据一些实施例,数据集(dataset)是数据的集合。数据集可被假定为不同的形 式,包括计算机数据架构或甚至是一个变量。例如,可以以表格的形式呈现数据集,每一列 代表特定变量,每一行对应于正被讨论的数据集中的给定成员。表格形式列出了每个变量 的值,例如对象的高度和权重或者随机数字的值。每个值被认为是一个数据(datum)。数据 集可以包括对应于行数的一个或多个成员的数据。数据集中的数据条目可以被进一步审核以确认数据的完整性。并且,可以通过管 理员机器的本地(分布式)网络来备份数据源(数据站点),以便可以在另一个数据站点分 析数据而不可能破坏原数据。使用账户间的标准商业规则生成报告。并且,支持定制报告允许多重(由条目标 准确定)自由度。本专利技术的元件可以以计算机系统实现,例如图1所示的系统100。系统100支持已 镜像本地数据库207 (如图2所示)的功能,以分别执行与根据如在这里所公开的本专利技术的 方面的图3、4、5和6对应的处理300、400、500和600。本文档来自技高网
...

【技术保护点】
一种计算机辅助方法,包括:(a)在本地数据站点,镜像来自第一数据站点的第一数据集;(b)在该本地数据站点,镜像来自第二数据站点的第二数据集;(c)聚集该第一数据集和该第二数据集为聚集的已镜像数据集;并且(d)基于一组商业规则分析该聚集的数据集的选定部分以获得分析结果。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:凯万W拉姆
申请(专利权)人:阿森图尔环球服务有限责任公司
类型:发明
国别省市:CH[瑞士]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1