机器学习框架中流的监控方法及其相关产品技术

技术编号:43858404 阅读:17 留言:0更新日期:2024-12-31 18:47
本公开涉及一种机器学习框架中流的监控方法及其相关产品,其中该相关产品包括监控机器学习框架中流的设备和计算机可读存储介质。该设备可以包括在组合处理装置的计算处理装置中,该计算处理装置可以包括一个或多个数据处理装置。前述的组合处理装置还可以包括接口装置和其他处理装置。所述计算处理装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与设备和其他处理装置连接,用于存储该设备和其他处理装置的数据。通过本公开的方案,可以在不影响业务生产环境的效率的同时,实现对机器学习框架中各种流的轻量级的以及有效的监控。

【技术实现步骤摘要】

本公开一般地涉及计算机领域。更具体地,本公开涉及一种机器学习框架中流的监控方法、执行前述监控方法的设备及计算机可读存储介质。


技术介绍

1、机器学习框架(例如pytorch框架等)中的训练或者推理等业务通常是基于多流(stream)机制实现的,在实际的训练/推理等业务中,性能优化场景往往需要通过分析机器学习框架中的多流。然而,相关技术需要借助一些“重型”工具才能完成流监控,这些工具在具体使用过程中不仅会产生大量的额外时间开销,并且由于其性能问题和使用方式的影响,这些工具不能在生产环境中默认开启,仅支持小规模的调试与分析等业务,无法适用于大规模的业务生成环境,大大影响业务生产环境的效率。


技术实现思路

1、鉴于上述
技术介绍
部分所提及的技术问题,本公开提出一种机器学习框架中流的监控的方案。利用本公开的技术方案,可以在不影响业务生产环境的效率的同时,实现对机器学习框架中各种流的轻量级的以及有效的监控。

2、在第一方面中,本公开提供了一种机器学习框架中流的监控方法,包括:基于所述机器学习框架所支持的目标接本文档来自技高网...

【技术保护点】

1.一种机器学习框架中流的监控方法,其特征在于,包括:

2.根据权利要求1所述的监控方法,其特征在于,其中所述目标接口包括第一自定义接口或者默认接口,基于所述机器学习框架所支持的目标接口获取所述机器学习框架中待监控的目标流包括:

3.根据权利要求2所述的监控方法,其特征在于,基于所述第一自定义接口获取所述非显式创建的通信流包括:

4.根据权利要求3所述的监控方法,其特征在于,基于所述第一自定义接口获取与指定设备索引相关的通信流列表包括:

5.根据权利要求4所述的监控方法,其特征在于,其中所述map类对象包括表示设备索引的外层关键字、表示通信...

【技术特征摘要】

1.一种机器学习框架中流的监控方法,其特征在于,包括:

2.根据权利要求1所述的监控方法,其特征在于,其中所述目标接口包括第一自定义接口或者默认接口,基于所述机器学习框架所支持的目标接口获取所述机器学习框架中待监控的目标流包括:

3.根据权利要求2所述的监控方法,其特征在于,基于所述第一自定义接口获取所述非显式创建的通信流包括:

4.根据权利要求3所述的监控方法,其特征在于,基于所述第一自定义接口获取与指定设备索引相关的通信流列表包括:

5.根据权利要求4所述的监控方法,其特征在于,其中所述map类对象包括表示设备索引的外层关键字、表示通信域的标识的内层关键字以及表示通信流的内层值。

6.根据权利要求4所述的监控方法,其特征在于,其中所述全局变量中还保存有待销毁的通信流,所述监控方法还包括:

7.根据权利要求1~6中任意一项所述的监控方法,其特征在于,对所述目标流进行插桩处理,以得到关于所述目标流的插桩信息包括...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:寒武纪昆山信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1