【技术实现步骤摘要】
报警信息处理方法、装置、设备、介质及产品
[0001]本公开涉及计算机
中的深度学习
、
云计算等领域,尤其涉及一种报警信息处理方法
、
装置
、
设备
、
介质及产品
。
技术介绍
[0002]深度学习系统是一种集深度学习框架
、
工具组件
、
开发套件和服务平台
、
基础模型库等产品为一体的开放平台
。
为了使深度学习系统提供优质的深度学习服务,需要对深度学习系统进行迭代更新
。
深度学习系统可以使用
commit(
更新信息
)
记录更新的内容,系统更新之后,需要对深度学习系统进行使用测试,以确保深度学习系统的正常运转
。
[0003]目前,深度学习系统的测试会产生大量的报警信息
。
面对大量的报警信息一般采用人工进行报警分析,得到令深度学习系统运行异常的
commit。
导致消耗大量人工成本,报警信息的分析效率较低
。
技术实现思路
[0004]本公开提供了一种用于报警信息处理方法
、
装置
、
设备
、
介质及产品
。
[0005]根据本公开的第一方面,提供了一种报警信息处理方法,包括:
[0006]确定与深度学习系统对应的目标报警信息;
[0007]基于预设多个报警原因 ...
【技术保护点】
【技术特征摘要】
1.
一种报警信息处理方法,包括:确定与深度学习系统对应的目标报警信息;基于预设多个报警原因,确定与所述目标报警信息对应的目标报警原因;根据所述深度学习系统的多个更新信息,对产生所述目标报警原因的更新信息进行定位,获得异常更新信息;输出所述异常更新信息
。2.
根据权利要求1所述的方法,其中,所述基于多个报警原因,确定与所述目标报警信息对应的目标报警原因,包括:确定所述深度学习系统中触发所述目标报警信息的目标更新信息;确定所述目标更新信息对应的更新对象为所述目标报警信息的报警触发对象;根据多个所述报警原因,确定与所述报警触发对象相匹配的报警原因为所述目标报警原因
。3.
根据权利要求2所述的方法,其中,所述确定所述深度学习系统中触发所述目标报警信息的目标更新信息,包括:确定所述深度学习系统所涉及的至少一个更新对象;获取在所述深度学习系统产生所述目标报警信息的异常测试任务,并获取所述异常测试任务在至少一个所述更新对象分别对应的第一更新信息;根据至少一个所述更新对象分别对应的第一更新信息,选择满足异常判定条件的第一更新信息为所述目标更新信息
。4.
根据权利要求3所述的方法,其中,所述根据至少一个所述更新对象分别对应的第一更新信息,选择满足异常判定条件的第一更新信息为所述目标更新信息,包括:获取在所述异常测试任务之前的正常测试任务,并获取所述正常测试任务在至少一个所述更新对象分别对应的第二更新信息;从至少一个所述更新对象中确定测试更新对象和除所述测试更新对象之外的其它更新对象;若根据所述其它更新对象对应的第二更新信息确定所述测试更新对象的第一更新信息满足所述异常判定条件,则确定所述测试更新对象对应的第一更新信息为所述目标更新信息
。5.
根据权利要求4所述的方法,其中,所述根据所述其它更新对象对应的第二更新信息确定所述测试更新对象的第一更新信息满足所述异常判定条件,包括:根据所述测试更新对象对应的第二更新信息和其它更新对象对应的第一更新信息,对所述深度学习系统进行重跑验证,获得第一验证结果;若所述第一验证结果为运行正常,则确定所述测试更新对象的第一更新信息满足所述异常判定条件;若所述第一验证结果为运行失败,则确定所述测试更新对象的第一更新信息不满足所述异常判定条件
。6.
根据权利要求4所述的方法,其中,所述根据所述其它更新对象对应的第二更新信息确定所述测试更新对象的第一更新信息满足所述异常判定条件,包括:若确定所述其它更新对象对应的第二更新信息与对应的第一更新信息相同,则确定所
述测试更新对象的第一更新信息满足所述异常判断条件
。7.
根据权利要求4‑6任一项所述的方法,其中,所述从至少一个所述更新对象中确定测试更新对象和除所述测试更新对象之外的其它更新对象之后,还包括:若根据所述其它更新对象对应的第二更新信息确定所述测试更新对象的第一更新信息不满足所述异常判定条件,则从至少一个所述更新对象中确定下一个测试更新对象,并返回确定除所述测试更新对象之外的其它更新对象继续执行
。8.
根据权利要求2‑7任一项所述的方法,其中,所述确定所述深度学习系统中触发所述目标报警信息的目标更新信息,包括:从所述深度学习系统中确定产生所述目标报警信息的测试任务;在确定所述测试任务所针对的计算模型处于稳定状态的情况下,则确定所述深度学习系统中触发所述目标报警信息的目标更新信息
。9.
根据权利要求2‑8任一项所述的方法,其中,所述根据多个所述报警原因,确定与所述报警触发对象相匹配的报警原因为所述目标报警原因,包括:根据多个所述报警原因分别关联的原因信息,确定原因信息中包含所述报警触发对象的报警原因为所述目标报警原因
。10.
根据权利要求1‑9任一项所述的方法,其中,所述根据所述深度学习系统的多个更新信息,对产生所述目标报警原因的更新信息进行定位,获得异常更新信息,包括:根据所述深度学习系统的多个更新信息,确定与所述目标报警原因存在报警关联的至少一个候选更新信息;从至少一个所述候选更新信息中确定产生所述目标报警原因的异常更新信息
。11.
根据权利要求
10
所述的方法,其中,所述根据所述深度学习系统的多个更新信息,确定与所述目标报警原因存在报警关联的至少一个候选更新信息,包括:确定所述深度学习系统的多个所述更新信息分别对应的更新对象;根据所述目标报警原因对应的报警触发对象,确定多个所述更新信息中更新对象与所述报警触发对象相同的至少一个同类更新信息;基于至少一个所述同类更新信息,确定与所述目标报警原因存在报警关联的至少一个候选更新信息
。12.
根据权利要求
11
所述的方法,其中,所述基于至少一个所述同类更新信息,确定与所述目标报警原因存在报警关联的至少一个候选更新信息,包括:将至少一个所述同类更新信息按照更新时间进行排序,获得排序后的至少一个同类更新信息;基于排序后的至少一个所述同类更新信息,确定位于最后一个同类更新信息之前且属于正常测试任务的初始更新信息;从排序后的至少一个所述同类更新信息中,确定位于所述初始更新信息和所述最后一个同类更新信息之间的中间更新信息;确定所述初始更新信息
、
所述中间更新信息和所述最后一个同类更新信息为至少一个所述候选更新信息
。13.
根据权利要求
10
‑
12
任一项所述的方法,其中,所述从至少一个所述候选更新信息中确定产生所述目标报警原因的异常更新信息,包括:
通过二分定位算法,从至少一个所述候选更新信息中确定产生所述目标报警原因的异常更新信息
。14.
根据权利要求
13
所述的方法,其中,所述通过二分定位算法,从至少一个所述候选更新信息中确定产生所述目标报警原因的异常更新信息,包括:基于至少一个所述候选更新信息,确定初始更新信息和末端更新信息;在所述初始更新信息和所述末端更新信息未相邻的情况下,通过所述二分定位算法更新所述初始更新信息和所述末端更新信息;在所述初始更新信息和所述末端更新信息相邻的情况下,确定所述初始更新信息为所述异常更新信息
。15.
根据权利要求
14
所述的方法,其中,所述通过所述二分定位算法更新所述初始更新信息和所述末端更新信息,包括:从至少一个所述候选更新信息中,确定位于所述初始更新信息和所述末端更新信息中间的中心更新信息;根据所述中心更新信息,对所述深度学习系统进行重跑验证,获得第二验证结果;若所述第二验证结果为运行正常,则确定所述中心更新信息的下一个更新信息为所述初始更新信息;若所述第二验证结果为运行失败,则确定所述中心更新信息为所述末端更新信息
。16.
根据权利要求1‑
15
任一项所述的方法,其中,所述确定与所述深度学习系统对应的目标报警信息,包括:获取所述深度学习系统测试产生的至少一个报警信息,并分别确定至少一个所述报警信息分别对应的分析顺序;按照至少一个所述报警信息分别对应的分析顺序,依次从至少一个所述报警信息中确定待分析的目标报警信息
。17.
根据权利要求
16
所述的方法,其中,所述分别确定至少一个所述报警信息分别对应的分析顺序,包括:按照至少一个所述报警信息分别对应的异常程度,将至少一个所述报警信息进行排序,获得至少一个所述报警信息分别对应的分析顺序
。18.
根据权利要求
17
所述的方法,还包括:根据所述报警信息的指标波动程度确定所述报警信息的异常程度,获得至少一个所述报警信息分别对应的异常程度;或者,根据所述报警信息的报警频率确定所述报警信息的异常程度,获得至少一个所述报警信息分别对应的异常程度
。19.
一种报警信息处理装置,包括:确定单元,用于确定与所述深度学习系统对应的目标报警信息;选择单元,用于基于多个报警原因,选择与所述目标报警信息对应的目标报警原因;定位单元,用于根据所述深度学习系统的多个更新信息,对产生所述目标报警原因的更新信息进行定位,获得异常更新信息;输...
【专利技术属性】
技术研发人员:郭立新,
申请(专利权)人:百度国际科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。