工作流断点续跑方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号:27741036 阅读:28 留言:0更新日期:2021-03-19 13:34
本发明专利技术涉及软件监控技术领域,公开了一种工作流断点续跑方法、装置、计算机设备及可读存储介质,包括:响应于工作流运行时,获得工作流中任务节点的运行状态;巡检任务节点的运行状态,以识别工作流中是否具有出现异常的任务节点;若具有出现异常的任务节点,则将任务节点设为异常节点,并获取异常节点的错误返回信息,错误返回信息是反映异常节点在工作流中出现错误原因的数据信息;根据错误返回信息对异常节点进行断点续跑。本发明专利技术还涉及区块链技术,信息可存储于区块链节点中。本发明专利技术不仅提高了工作流恢复效率,降低了处理异常节点的处理时间,保证了工作流整体的稳定性,还极大的降低了运维维护工作流运行的运维人员的投入。

【技术实现步骤摘要】
工作流断点续跑方法、装置、计算机设备及可读存储介质
本专利技术涉及软件监控
,尤其涉及一种工作流断点续跑方法、装置、计算机设备及可读存储介质。
技术介绍
工作流(Workflow),指"业务过程的部分或整体在计算机应用环境下的自动化"。是对工作流程及其各操作步骤之间业务规则的抽象、概括描述,是一种任务节点协作关系的关系图。当前的工作流是基于某一具体作业任务,通过具有任务节点的流程图所构建的计算机系统,其中,所述任务节点作为该流程图中某一具体部门或个人的抽象化体现,用于根据接收到的任务数据处理该流程图中一节点上的具体任务。当任务数据一旦出现错误,将会使任务节点生成具有失败信息,导致工作流断点,因此,需要工作人员排查并修复工作流断点位置的任务节点中的任务数据。然而,专利技术人意识到,如果工作流任务节点很多(上千或上万),调度的任务又分布在不同的作业执行集群,物理部署环境又比较复杂,当整个工作流运行了一段时间时断掉(因某种原因,导致一批节点失败),将需要运维人员花费大量时间重新拉起工作流,不仅需要花费大量人力保证工作流的运维工作本文档来自技高网...

【技术保护点】
1.一种工作流断点续跑方法,其特征在于,包括:/n响应于工作流运行时,获得所述工作流中任务节点的运行状态;/n巡检所述任务节点的运行状态,以识别所述工作流中是否具有出现异常的任务节点;/n若具有出现异常的任务节点,则将所述任务节点设为异常节点,并获取所述异常节点的错误返回信息,所述错误返回信息是反映所述异常节点在工作流中出现错误原因的数据信息;/n根据所述错误返回信息对所述异常节点进行断点续跑,所述断点续跑是获取所述异常节点对应的回执信息的操作。/n

【技术特征摘要】
1.一种工作流断点续跑方法,其特征在于,包括:
响应于工作流运行时,获得所述工作流中任务节点的运行状态;
巡检所述任务节点的运行状态,以识别所述工作流中是否具有出现异常的任务节点;
若具有出现异常的任务节点,则将所述任务节点设为异常节点,并获取所述异常节点的错误返回信息,所述错误返回信息是反映所述异常节点在工作流中出现错误原因的数据信息;
根据所述错误返回信息对所述异常节点进行断点续跑,所述断点续跑是获取所述异常节点对应的回执信息的操作。


2.根据权利要求1所述的工作流断点续跑方法,其特征在于,所述巡检所述任务节点的运行状态,以识别所述工作流中是否具有出现异常的任务节点的步骤,包括:
识别运行状态为失败状态的任务节点,并将所述任务节点设为出现异常的任务节点;
识别运行状态为执行状态的任务节点,并将所述任务节点设为待检测节点;判断从所述工作流的运行引擎根据所述待检测节点发送调度指令的时间,至当前时间之间的指令期间,是否超过预置的指令阈值;若是,则判定所述待检测节点为出现异常的任务节点;若否,则将所述待检测节点设为正常的任务节点。


3.根据权利要求1所述的工作流断点续跑方法,其特征在于,所述工作流包括运行引擎、调度链路和作业执行集群;
所述获取所述异常节点的错误返回信息的步骤,包括:
追踪运行引擎通过调度链路向作业执行集群发送的调度指令;计算在所述运行引擎至所述作业执行集群方向上,所述调度指令在所述调度链路中停留的触发时间;判断所述触发时间是否超过预置的触发阈值;若是,则生成内容为触发异常的错误返回信息;若否,则生成内容为触发正常的错误返回信息;
所述获取所述异常节点的错误返回信息的步骤,还包括:
追踪所述作业执行集群接收到的调度指令;计算所述调度指令在所述作业执行集群中停留的执行时间;判断所述执行时间是否超过预置的执行阈值;若是,则生成内容为执行异常的错误返回信息;若否,则生成内容为执行正常的错误返回信息;
所述获取所述异常节点的错误返回信息的步骤,还包括:
追踪所述作业执行集群通过所述调用链路向所述运行引擎发送的回执信息;计算在所述作业执行集群至所述运行引擎的方向上,所述回执信息在所述调度链路上停留的返回时间;判断所述返回时间是否超过预置的返回阈值;若是,则生成内容为返回异常的错误返回信息;若否,则生成内容为返回正常的错误返回信息。


4.根据权利要求1所述的工作流断点续跑方法,其特征在于,所述识别所述工作流中是否具有出现异常的任务节点之后,所述方法还包括:
若不具有出现异常的任务节点,则经过预置的等待期间后,再次巡检所述任务节点的运行状态。


5.根据权利要求1所述的工作流断点续跑方法,其特征在于,所述根据所述错误返回信息对所述异常节点进行断点续跑之前,所述方法还包括:
判断所述错误返回信息是否符合预置的重跑条件;
若不符...

【专利技术属性】
技术研发人员:杨真
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1