用于多处理环境中的数据聚合的方法和系统技术方案

技术编号:2837112 阅读:247 留言:0更新日期:2012-04-11 18:40
公开了在多处理环境中用于数据聚合的方法和系统。容错功能用于可靠地收集和聚合来自多个处理单元的不同数据。在处理单元处,对该处理单元的数据进行收集和本地聚合。将本地聚合数据存储在本地数据库中,并将其定期转发到中央管理器。当接收数据时,中央管理器确定在处理环境的数据总聚合是否应包括该数据。

【技术实现步骤摘要】

本专利技术通常涉及在分布式处理环境中的数据管理,特别是,涉及用于以容错方式从分布式处理环境的多个处理单元收集(collection)和聚合(aggregation)数据。
技术介绍
在分布式处理环境(例如,集群环境)中,从环境的多个处理单元收集和聚合(aggregate)数据。该聚合数据能在许多任务中使用,这些任务包括但不限于在处理环境内的工作负荷管理。在以前,为了收集该数据,由处理单元将数据发送到环境的中央管理器。然后,中央管理器负责将数据聚合。然而,在处理单元与中央管理器之间的通信介质是非可靠的,因此,会丢失数据和/或反复发送数据。这导致数据聚合的不准确。
技术实现思路
基于以上描述,需要一种用于从环境的多个处理单元收集和聚合数据的增强型设备。特别是,需要一种用于数据收集和聚合的容错设备,其中,中央管理器能够容许数据的丢失和重复。通过提供一种用于在多处理环境中进行数据聚合的方法,克服现有技术的缺点,并提供额外的优点。该方法包括例如由处理环境的中央管理器对处理环境的多个处理单元的多个处理单元中每个处理单元的本地聚合数据进行跟踪,其中,处理单元的本地聚合数据是关于该处理单元的数据,且本文档来自技高网...

【技术保护点】
一种用于在多处理环境中进行数据聚合的方法,所述方法包括:由处理环境的中央管理器对处理环境的多个处理单元的多个处理单元中每个处理单元的本地聚合数据进行跟踪,其中,处理单元的本地聚合数据是关于该处理单元的数据,且其中,该跟踪确保重复的本 地聚合数据和过时的本地聚合数据被丢弃;和由中央管理器聚合该多个处理单元的本地聚合数据,以获得多处理环境的总聚合数据。

【技术特征摘要】
US 2006-4-27 11/412,7571.一种用于在多处理环境中进行数据聚合的方法,所述方法包括由处理环境的中央管理器对处理环境的多个处理单元的多个处理单元中每个处理单元的本地聚合数据进行跟踪,其中,处理单元的本地聚合数据是关于该处理单元的数据,且其中,该跟踪确保重复的本地聚合数据和过时的本地聚合数据被丢弃;和由中央管理器聚合该多个处理单元的本地聚合数据,以获得多处理环境的总聚合数据。2.根据权利要求1的方法,其中,该跟踪包括在数据结构中保持多处理环境的一个或多个处理单元的列表,以及针对该一个或多个处理单元中至少一个处理单元的每个处理单元,保持该处理单元的本地聚合数据。3.根据权利要求1的方法,其中,对处理单元的本地聚合数据的跟踪包括由中央管理器从该处理单元接收本地聚合数据;将所接收的本地聚合数据的时间戳与中央管理器所保持的该处理单元的本地聚合数据的时间戳以及缺省值之一进行比较;和响应于比较表明要跟踪该本地聚合数据,存储该本地聚合数据。4.根据权利要求3的方法,其中聚合包括响应于比较表明要包括该本地聚合数据,重新计算总聚合数据以包括该本地聚合数据。5.根据权利要求1的方法,还包括由多处理环境的处理单元收集该处理单元的数据;在该处理单元处聚合所收集的数据,以获得该处理单元的本地聚合数据;以及将本地聚合数据转发到中央管理器,以用于中央管理器的跟踪。6.根据权利要求5的方法,还包括,将该处理单元的本地聚合数据存储在该处理单元的数据库中,以提供该本地聚合数据的持久性拷贝。7.根据权利要求5的方法,其中,该处理单元的本地聚合数据具有与之相关联的时间戳,所述时间戳被转发到中央管理器,并且在跟踪时用于确保忽略过时的数据。8.根据权利要求1的方法,还包括,重新启动该多个处理单元的处理单元,并且响应于此,将重新启...

【专利技术属性】
技术研发人员:戴维P布里尔斯福德理查德J库彭格亚历山大杜拉雅恩钟恩慈
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1