一种细粒度多维度的大规模机器学习性能分析方法技术

技术编号：34961249 阅读：18 留言：0更新日期：2022-09-17 12:40

本发明专利技术公开了计算机技术领域的一种细粒度多维度的大规模机器学习性能分析方法，基于Colossal

全部详细技术资料下载

【技术实现步骤摘要】
一种细粒度多维度的大规模机器学习性能分析方法

[0001]本专利技术涉及计算机
，具体为一种细粒度多维度的大规模机器学习性能分析方法。

技术介绍

[0002]性能分析工具在大型软件工程中，主要用于静态分析软件运行时的各项指标，比如程序的时空复杂度、函数的调用栈、程序活动运行的开销等。不同的性能分析工具有不同的适应功能，例如有许多工具都可以用来监控Linux的运行状态。
[0003]·
vmstat
‑‑
虚拟内存统计；
[0004]·
iostat
‑‑
用于报告中央处理器统计信息；
[0005]·
dstat
‑‑
系统监控工具；
[0006]·
iotop
‑‑
LINUX进程实时监控工具；
[0007]·
pidstat
‑‑
监控系统资源情况；
[0008]目前在机器学习领域，性能分析工具被广泛运用在监控内存用量、训练各部分的程序耗时占比、硬件信息等。其中，较为出名的有PyTorch的性能分析工具。由于深度学习耗时长，逻辑流复杂、算子种类较多等特点，使得针对深度学习的性能分析比起上述单一分析某个功能的性能分析，所采集到的数据维度更多。而为了能够直观地展示这些的数据，TensorFlow团队推出了适用于机器学习性能分析的可视化工具Tensorboard，目前已经成为了事实上机器学习领域可视化的工具的标准。而另一主流深度学习框架PyTorch...

【技术保护点】

【技术特征摘要】
1.一种细粒度多维度的大规模机器学习性能分析方法，基于Colossal
‑
AI Profiler和Colossal
‑
AI Gemini内存策略管理工具一起实现，其使用的流程和PyTorchProfiler类似，Colossal
‑
AIProfiler被设计为一个上下文管理器，能够通过with语句很快完成开启和关闭，其特征在于，包括如下步骤：S1：将对应包导入，然后使用with语句初始化整个性能分析过程，在初始化过程中可以定制化施行本次性能分析的选项；S2：如果选择追踪不同状态的Tensor，那么将开启StatefulTensorMemoryProfilerExtention；S3：Colossal
‑
AI.gemini.GeminiMemoryManager是所有标记向量的管理器，而内存状态追踪器就是利用它来进行数据的收集；S4：在收集到数据后，该内存用量性能分析工具可以将收集到的数据以特定的json格式，输出到指定的路径中。2.根据权利要求1所述的一种细粒度多维度的大规模机器学习性能分析方法，其特征在于：所述步骤S1中在初始化过程中可以定制化施行本次性能分析的选项包括a.需要进行分析的设备，内存和显存；b.本次性能分析所采用的策略，用户可以自定义性能分析的策略来排除性能分析进程或者模型初始化事件对于训练过程中内存占用的影响；c.辅助信...

【专利技术属性】
技术研发人员：柳泓鑫，黄海晨，方佳瑞，李升桂，卞正达，李永彬，刘育良，麦思琪，
申请(专利权)人：北京潞晨科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人