The present invention discloses a data processing method after node restart. When the processing nodes restart after the completion of the acquisition of the legacy data processing node current cache the longest time distributed message queue, according to the current time and the time left to determine the data recovery cycle, and in the recovery period of dealing with new data and distributed data in the message queue. Thereby avoiding the interruption of data processing caused by restarting, eliminating the influence on the user perception and enhancing the user's use experience.
【技术实现步骤摘要】
一种节点重启后的数据处理方法及设备
本申请涉及通信
,特别涉及一种节点重启后的数据处理方法。本申请同时还涉及一种数据处理设备。
技术介绍
随着互联网技术的不断发展,云计算平台越来越成为人们所重视的对象,云计算平台也称为云平台。云平台可以按照功能划分为3类:以数据存储为主的存储型云平台,以数据处理为主的计算型云平台以及计算和数据存储处理兼顾的综合云计算平台。云平台允许开发者们或是将写好的程序放在“云”里运行,或是使用“云”里提供的服务,或二者皆是的平台。如图1所示,为现有的云平台实时监控服务的架构设计示意图。云平台日志服务的架构设计通常分为五层:(日志)收集层、(日志)传输层、处理层、存储层和监控中心。收集层负责读取用户的各类日志,然后将需要存储的日志发送到传输层,在图1所示的现有云平台日志服务架构示意图中,该层的功能由各种Agent(代理)结合现有的云服务功能实现,其中Agent部署在各级物理机或虚拟机上,按规则读取用户的日志并发送。处理层一般由多个可扩展的工作节点(图2中的处理worker)组成,接收传输层的日志,处理后存储到各类存储设备,一个处理worker本质是一个系统进程,无状态,可横向扩展,日志能否保证顺序跟处理层的逻辑密切相关。存储层负责数据存储,可以是物理磁盘,也可以是由分布式文件系统提供的虚拟磁盘。传输层处于收集层与处理层中间,负责保证日志被发送到处理层,一般由可容灾可堆积的消息队列实现,它是收集层和处理层的桥梁。存储层负责数据存储。监控中心包括访问层,访问层设置有专用的访问API,用以对外提供统一的数据访问接口。实时监控服务对实时性 ...
【技术保护点】
一种节点重启后的数据处理方法,其特征在于,所述方法应用于包括分布式消息队列以及处理节点的数据处理系统中,该方法包括:当所述处理节点重新启动完成后,所述处理节点获取所述分布式消息队列中当前缓存时间最长的遗留数据的时刻;所述处理节点根据当前的时刻以及所述遗留数据的时刻确定恢复周期;所述处理节点在所述恢复周期内处理所述遗留数据以及所述分布式消息队列中的新增数据。
【技术特征摘要】
1.一种节点重启后的数据处理方法,其特征在于,所述方法应用于包括分布式消息队列以及处理节点的数据处理系统中,该方法包括:当所述处理节点重新启动完成后,所述处理节点获取所述分布式消息队列中当前缓存时间最长的遗留数据的时刻;所述处理节点根据当前的时刻以及所述遗留数据的时刻确定恢复周期;所述处理节点在所述恢复周期内处理所述遗留数据以及所述分布式消息队列中的新增数据。2.如权利要求1所述的方法,其特征在于,所述数据处理系统还包括存储节点,在所述处理节点重新启动完成之前,还包括:所述处理节点接收计算任务关闭指令;所述处理节点停止从所述分布式消息队列中接收数据,并将自身当前已缓存的数据在处理完毕后写入所述存储节点。3.如权利要求1所述的方法,其特征在于,所述处理节点根据当前的时刻以及所述遗留数据的时刻确定恢复周期,具体为:获取所述缓存时间最长的遗留数据所对应的时刻距离当前的时刻的时间长度;生成所述恢复周期,所述恢复周期的时长与所述时间长度一致。4.如权利要求1所述的方法,其特征在于,所述处理节点在所述恢复周期内处理所述遗留数据以及所述分布式消息队列中的新增数据,具体为:根据所述恢复周期的单位时间长度依次设置多个处理时间段,并基于所述遗留数据以及所述新增数据为各所述处理时间段分配待处理数据;在各所述处理时间段内处理对应的待处理数据,并在所述恢复周期结束后将所述计算任务恢复为正常处理逻辑。5.如权利要求4所述的方法,其特征在于,所述处理时间段由数据处理时间以及数据同步时间按序组成,在各所述处理时间段内处理对应的待处理数据,具体为:在所述数据处理时间内处理所述待处理数据,并在所述数据处理时间结束时将已处理的待处理数据进行存储;若所述数据处理时间结束后存在尚未处理的待处理数据,在所述数据...
【专利技术属性】
技术研发人员:李灼灵,熊奇,韩森,李巨雷,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。