【技术实现步骤摘要】
性能分析方法、装置、存储介质及程序产品
[0001]本公开涉及人工智能领域,尤其涉及一种性能分析方法、装置、存储介质及程序产品。
技术介绍
[0002]近年来,基于深度学习的人工智能应用落地正在如火如荼的展开。人工智能应用通常需要使用图形处理器(graphics processing unit,GPU)运行,而想要高性能的运行这些应用,就需要对图形处理器的软件栈进行深度调优。软件栈主要包括多个层次:驱动层,计算层,框架层,模型层,应用层。通常,这些层次是串行的调用关系,一旦某个层次性能较差,就会影响到软件栈整体的性能。那么就需要从不同的层次对软件栈的性能进行分析,从而找到软件栈性能瓶颈,然后针对性地调优,以提高人工智能应用的运行效果。
[0003]目前业界已有的分析工具基本都是从模型层或者驱动层进行分析,支持的层次较少,不能有效的找到软件栈性能瓶颈。
技术实现思路
[0004]有鉴于此,本公开提出了一种性能分析方法、装置、存储介质及程序产品,根据本公开实施例的性能分析方法,通过获取对应于软件栈的多种层次的性能原始数据并进行分析,实现从软件栈的不同层次定位性能瓶颈,提高性能分析效果。
[0005]根据本公开的一方面,提供了一种性能分析方法,所述方法包括:分别获取第一模型在目标图形处理器和基准图形处理器上运行时的性能原始数据,所述目标图形处理器的软件栈和所述基准图形处理器的软件栈具有相同的多个层次,所述性能原始数据包括与所述多个层次对应的多种类型的数据,每个层次对应至少一个类型;分析所述性 ...
【技术保护点】
【技术特征摘要】
1.一种性能分析方法,其特征在于,所述方法包括:分别获取第一模型在目标图形处理器和基准图形处理器上运行时的性能原始数据,所述目标图形处理器的软件栈和所述基准图形处理器的软件栈具有相同的多个层次,所述性能原始数据包括与所述多个层次对应的多种类型的数据,每个层次对应至少一个类型;分析所述性能原始数据,分别得到所述第一模型在所述目标图形处理器和所述基准图形处理器上运行时的性能展示数据,所述性能展示数据包括算子执行耗时、算子调用次数和显卡利用率中的至少一种;根据所述目标图形处理器和所述基准图形处理器的硬件性能比对参数,以及所述性能原始数据、所述性能展示数据中的至少一个,确定所述第一模型在所述目标图形处理器和所述基准图形处理器上运行时,所述目标图形处理器的软件栈与所述基准图形处理器的软件栈的性能差距。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:展示所述性能展示数据和所述性能差距,并接收反馈信息,所述反馈信息指示至少一种优化所述目标图形处理器的软件栈的方式;根据所述反馈信息优化所述目标图形处理器的软件栈;重新执行分别获取第一模型在目标图形处理器和基准图形处理器上运行时的性能原始数据及之后的步骤。3.根据权利要求1或2所述的方法,其特征在于,所述第一模型是计算密集类型时,所述目标图形处理器和所述基准图形处理器的硬件性能对比参数包括计算性能对比参数,所述方法还包括:从预设的计算任务库中选择计算密集类型的第一计算任务;按照所述基准图形处理器的软件栈的配置方式,对所述目标图形处理器的软件栈进行相同的配置;分别获取所述第一计算任务在所述目标图形处理器和所述基准图形处理器上运行的耗时,根据所述耗时,确定所述目标图形处理器和所述基准图形处理器的软件栈的效率;根据所述目标图形处理器的理论算力和所述目标图形处理器的软件栈的效率得到所述目标图形处理器的实测性能参数;根据所述基准图形处理器的理论算力和所述基准图形处理器的软件栈的效率得到所述基准图形处理器的实测性能参数;根据所述目标图形处理器的实测性能参数和所述基准图形处理器的实测性能参数得到所述目标图形处理器和所述基准图形处理器的计算性能对比参数。4.根据权利要求1或2所述的方法,其特征在于,所述第一模型是输入输出密集类型时,所述目标图形处理器和所述基准图形处理器的硬件性能对比参数包括带宽对比参数,所述方法还包括:从预设的计算任务库中选择输入输出密集类型的第二计算任务;按照所述基准图形处理器的软件栈的配置方式,对所述目标图形处理器的软件栈进行相同的配置;分别获取所述第二计算任务在所述目标图形处理器和所述基准图形处理器上运行的耗时,根据所述耗时,确定所述目标图形处理器和所述基准图形处理器的实测带宽参数;
根据所述目标图形处理器的实测带宽参数和所述基准图形处理器的实测带宽参数得到所述目标图形处理器和所述基准图形处理器的带宽对比参数。5.根据权利要求1
‑
4中任一项所述的方法,其特征在于,所述多个层次包括计算层、框架层和模型层,所述性能原始数据包括的第一类型数据是所述模型层对应的模型端到端性能数据,第二类型数据是所述模型层对应的模型不同运行阶段性能数据,第三类型数据是所述框架层对应的痕迹数据,第四类型数据是所述计算层对应的核函数数据,所述不同运行阶段包括预处理阶段、内存到显存的数据传输阶段、推理阶段、显存到内存的数据传输阶段、后处理阶段。6.根据权利要求5所述的方法,其特征在于,所述第一模型的参数包括批尺寸,所述模型端到端性能数据包括吞吐量,所述分别获取第一模型在目标图形处理器和基准图形处理器上运行时的性能原始数据,包括:分别获取所述第一模型在所述目标图形处理器和所述基准图形处理器上运行的耗时;根据所述第一模型在所述目标图形处理器上运行的耗时与所述批尺寸的比值,得到所述第一模型在所述目标图形处理器上运行的吞...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:摩尔线程智能科技北京有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。