【技术实现步骤摘要】
任务异常处理方法、装置及任务异常处理系统
[0001]本专利技术涉及算法训练
,特别是涉及任务异常处理方法、装置及任务异常处理系统。
技术介绍
[0002]算法训练系统是通过对算法进行训练生成模型的后端系统。其中,上述算法可为CNN(Convolutional Neural Network,卷积神经网络)等机器学习算法。
[0003]对于算法训练系统而言,最重要的是保证训练任务的成功率,其中,训练任务是指:将特定格式的数据,通过算法程序处理,训练得到一个模型的过程。因此,如何在训练任务运行出现异常时对异常进行处理就显得极为重要。相关技术中,多采用人工处理的方式,即在训练任务运行出现异常后,需要通知工作人员手动对训练任务运行出现的异常进行处理,以恢复算法训练系统的正常运行。
[0004]然而,随着算法训练系统规模的扩大、目标训练任务的增多,使得在算法训练的过程中目标训练任务出现异常的频率也越来越高,仅通过人工处理的方式,效率较低。
技术实现思路
[0005]本专利技术实施例的目的在于提供任 ...
【技术保护点】
【技术特征摘要】
1.一种任务异常处理方法,其特征在于,所述方法包括:当检测到算法训练系统内目标训练任务运行出现异常时,获取造成所述目标训练任务运行出现异常的目标异常原因;判断是否存在预设的与所述目标异常原因对应的处理策略;若存在,则按照所述处理策略对所述目标训练任务运行出现的异常进行处理;若不存在,则输出针对所述目标训练任务的通知消息,并在接收到针对所述目标异常原因的配置操作时,存储所述配置操作所配置的与所述目标异常原因对应的处理策略。2.根据权利要求1所述的方法,其特征在于,在所述输出针对所述目标训练任务的通知消息之前,所述方法还包括:基于所述目标训练任务的训练数据,生成包含所述目标异常原因、且用例状态为未完成的测试用例;所述存储所述配置操作所配置的与所述目标异常原因对应的处理策略,包括:在所生成的测试用例中,设置所述配置操作所配置的与所述目标异常原因对应的处理策略,且将所生成的测试用例的用例状态设置为完成态。3.根据权利要求2所述的方法,其特征在于,所述判断是否存在预设的与所述目标异常原因对应的处理策略,包括判断是否存在包含所述目标异常原因、且状态为完成态的第一测试用例;若存在,则判定存在预设的与所述目标异常原因对应的处理策略;若不存在,则判定不存在预设的与所述目标异常原因对应的处理策略。4.根据权利要求3所述的方法,其特征在于,所述按照所述处理策略对所述目标训练任务运行出现的异常进行处理,包括:按照所述第一测试用例中的处理策略,对所述目标训练任务运行出现的异常进行处理。5.根据权利要求4所述的方法,其特征在于,每一测试用例中还包含:用于验证针对由所包含异常原因所造成异常的处理是否有效的验证数据;在所述按照所述第一测试用例中的处理策略,对所述目标训练任务运行出现的异常进行处理之后,所述方法还包括:基于所述第一测试用例中的验证数据,运行第一验证任务;其中,每一验证任务用于验证针对异常的处理是否有效;若所述第一验证任务运行正常,则确定所述目标训练任务运行出现的异常处理完成。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:若所述第一验证任务运行异常,则显示所述目标训练任务运行出现的异常,提示对所述目标训练任务运行出现的异常进行处理;在所述异常被处理之后,返回执行所述基于所述第一测试用例中的验证数据,运行第一验证任务的步骤,直至所述第一验证任务运行正常;在所述第一验证任务运行正常之后,若接收到针对所述目标异常...
【专利技术属性】
技术研发人员:兰明锦,唐苗,唐瑞,洪文杰,孙旭,潘开鑫,谢慧泓,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。