【技术实现步骤摘要】
用于处理数据的方法和系统
本专利技术的各实施方式涉及数据处理,更具体地,涉及用于并行地处理流(stream)数据的方法和系统。
技术介绍
随着数据处理技术的发展,数据处理已经不再局限于串行的处理方式,而是可以在分布式处理系统中的多个节点处进行并行处理。对于涉及大数据处理的应用而言,分布式并行处理可以大大提高数据处理的效率,进而为实时数据处理提供了更多支持。实时数据处理可以应用于多种应用环境,例如,实时监控已经成为目前的一个重要应用热点。对于城市道路、主要交通枢纽等重要区域的监控中将产生大量的视频流数据;又例如,在环境监控、生产线监控等领域中,也将产生温度、湿度等大量的实时监控的流数据(例如,在1秒的时间间隔进行采样)。由于这些流数据中承载的信息的数量并不相同,因而很可能会出现在某一时刻的工作负载骤增并且需要额外的计算资源的情况。此时,如何以更为有效的方式来以动态地并行处理流数据,成为目前的一个研究热点。
技术实现思路
因而,期望能够开发并实现一种能够有效地处理流数据的技术方案,并且期望该技术方案可以在不停止处理数据的情况下,动态地调节处理数据时所涉及的计算资源的数量。在本专利技术的一个实施方式中,提供了一种用于处理数据的方法,包括:响应于接收到将消费者实例的数量从第一数量调整至第二数量的调整请求,确定将与第一数量的消费者实例相关联的状态的第一分布调整为与第二数量的消费者实例相关联的所述状态的第二分布的调整策略,所述状态是处理所述数据的中间结果;根据所述调整策略,在所述第一数量的所述消费者实例与所述第二数量的所述消费者实例之间迁移所述状态;以及在所述第二数量的所 ...
【技术保护点】
一种用于处理数据的方法,包括:响应于接收到将消费者实例的数量从第一数量调整至第二数量的调整请求,确定将与第一数量的消费者实例相关联的状态的第一分布调整为与第二数量的消费者实例相关联的所述状态的第二分布的调整策略,所述状态是处理所述数据的中间结果;根据所述调整策略,在所述第一数量的所述消费者实例与所述第二数量的所述消费者实例之间迁移所述状态;以及在所述第二数量的所述消费者实例处基于所述状态的所述第二分布处理所述数据。
【技术特征摘要】
1.一种用于处理数据的方法,包括:响应于接收到将消费者实例的数量从第一数量调整至第二数量的调整请求,确定将与第一数量的消费者实例相关联的状态的第一分布调整为与第二数量的消费者实例相关联的所述状态的第二分布的调整策略,所述状态是处理所述数据的中间结果;根据所述调整策略,在所述第一数量的所述消费者实例与所述第二数量的所述消费者实例之间迁移所述状态;以及在所述第二数量的所述消费者实例处基于所述状态的所述第二分布处理所述数据。2.根据权利要求1所述的方法,其中确定所述调整策略包括:确定将所述状态的所述第一分布调整至所述状态的所述第二分布的迁移开销;以及基于所述迁移开销确定所述调整策略。3.根据权利要求2所述的方法,其中确定所述迁移开销包括:基于一致性哈希算法确定所述迁移开销。4.根据权利要求1所述的方法,进一步包括:在迁移所述状态之前,在所述第一数量的消费者实例上游的第三数量的生产者实例处,向所述第一数量的所述消费者实例发送调整指示符,所述调整指示符指示在所述调整指示符之后分发的数据是根据所述状态的所述第二分布来分发的。5.根据权利要求4所述的方法,进一步包括:在发送所述调整指示符之后,根据所述状态的所述第二分布,从所述第三数量的生产者实例处向所述第二数量的消费者实例分发所述数据。6.根据权利要求4所述的方法,其中根据所述调整策略迁移所述状态包括:响应于在所述第一数量的所述消费者实例中的一个消费者实例处接收到来自上游的全部生产者实例的调整指示符,按照所述调整策略,从所述消费者实例向所述第二数量的所述消费者实例中的相关联的另一消费者实例迁移所述状态中的相关部分。7.根据权利要求6所述的方法,进一步包括:在所述消费者实例处接收到来自上游的全部生产者实例的调整指示符之前,在所述消费者实例处基于所述状态的所述第一分布处理所述数据。8.根据权利要求7所述的方法,进一步包括:在所述消费者实例处接收到来自上游的全部生产者实例的调整指示符之前,在所述另一消费者实例处,缓存从所述第三数量的所述生产者实例分发的数据。9.根据权利要求8所述的方法,进一步包括:响应于在所述另一消费者实例处接收到从所述消费者实例迁移的所述状态中的所述部分,基于所述部分来处理缓存的所述数据。10.根据权利要求1所述的方法,进一步包括以下中的任一项:响应于确定与处理所述数据相关联的工作负载增加,发出将所述消费者实例的所述数量从第一数量增加至第二数量的调整请求;以及响应于确定与处理所述数据相关联的工作负载减少,发出将所述消费者实例的所述数量从第一数量减少至第二数量的调整请求。11.一种用于处理数据的系统,包括:一个或者多个处理器;耦合至所述一个或者多个处理器中的至少一个处理器的存储器;在所述存储器中存储的计算机程序指令,当由...
【专利技术属性】
技术研发人员:陶隽,曹逾,董哲,李三平,
申请(专利权)人:伊姆西公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。