一种分析GPU性能的方法、装置及计算机存储介质制造方法及图纸

技术编号：32862122 阅读：21 留言：0更新日期：2022-03-30 19:45

本发明专利技术实施例公开了一种分析GPU性能的方法、装置及计算机存储介质；该方法可以包括：获取目标程序在设定环境下运行所得到指令列表、需启动的线程数量及每个线程对所述指令列表中的每个指令的执行结果；通过待分析GPU性能模型中的模拟调度器根据所述需启动的线程数量启动所述待分析GPU性能模型中的线程模拟器；每个线程模拟器均遍历所述指令列表中的每个指令，并在遍历过程中根据每个指令的指令执行控制值执行指令，以计量执行被遍历指令的时长；当所述指令列表中的所有指令均遍历完毕，获取所有线程模拟器执行所述指令列表中的所有指令的总执行时长。有指令的总执行时长。有指令的总执行时长。

全部详细技术资料下载

【技术实现步骤摘要】
一种分析GPU性能的方法、装置及计算机存储介质

[0001]本专利技术实施例涉及图形处理器（GPU，Graphics Processing Unit）
，尤其涉及一种分析GPU性能的方法、装置及计算机存储介质。

技术介绍

[0002]在GPU性能统计中，每周期指令数（IPC，Instructions Per Cycle）是一项比较重要的GPU性能指标，其代表GPU在每个时钟周期内总共能处理多少条指令；通常情况下，可以根据线程执行时间以及系统的主频进行计算来获得IPC。
[0003]在对GPU进行性能统计过程中，通常需要对GPU性能进行建模。具体来说，通常采用两种方式对GPU的性能进行建模：其一是仿真建模，比如使用软件模拟构建GPU的仿真模型，并根据仿真模型进行真实的执行过程以获取GPU真实性能数据；其二是分析建模，比如通过构建一定的映射函数（也可称之为分析模型）分析处理GPU的输入，从而计算得出相应性能结果。
[0004]对于仿真建模方式来说，虽然能够真实的模拟硬件执行过程，并且获取真实的仿真数据；但是，由于仿真模型需要模拟真实GPU的执行，所以运行效率低下，如果需要对GPU架构进行调整，那么就需要针对架构调整后的GPU重建仿真模型，因此，采用仿真建模的方式进行GPU性能统计，存在可扩展性相对较差，开发周期长的缺陷。对于分析建模方式来说，分析模型由于不用仿真指令的真实运行过程，只需要针对输入指令信息进行建模分析运算就可得到性能结果数据，所以采用分析建模方式进行GPU性能统计的运行效率非常高，结构...

【技术保护点】

【技术特征摘要】
1.一种分析GPU性能的方法，其特征在于，所述方法包括：获取目标程序在设定环境下运行所得到指令列表、需启动的线程数量及每个线程对所述指令列表中的每个指令的执行结果；其中，所述执行结果包括对每个指令的指令执行控制值；通过待分析GPU性能模型中的模拟调度器根据所述需启动的线程数量启动所述待分析GPU性能模型中的线程模拟器；每个线程模拟器均遍历所述指令列表中的每个指令，并在遍历过程中根据每个指令的指令执行控制值以及指令类型执行当前被遍历指令，以计量执行所述当前被遍历指令的时长；当所述指令列表中的所有指令均遍历完毕，获取所有线程模拟器执行所述指令列表中的所有指令的总执行时长。2.根据权利要求1所述的方法，其特征在于，所述获取目标程序在设定环境下运行所得到指令列表、需启动的线程数量及每个线程对所述指令列表中的每个指令的执行结果，包括：通过真实环境或者仿真环境运行所述目标程序，并在运行过程中获取所述目标程序的指令列表、所需启动的线程数量、每个线程执行每个指令的执行结果；其中，所述执行结果包括操作数寄存器值以及指令执行控制值。3.根据权利要求1所述的方法，其特征在于，所述每个线程模拟器均遍历所述指令列表中的每个指令，并在遍历过程中根据每个指令的指令执行控制值以及指令类型执行当前被遍历指令，以计量执行所述当前被遍历指令的时长，包括：对于每个所述线程模拟器，判断所述当前被遍历指令的执行结果中指令执行控制值是否表示执行所述当前被遍历指令；相应于所述指令执行控制值表示不执行所述当前被遍历指令，将执行固定的NOP指令的时长作为执行所述当前被遍历指令的时长；相应于所述指令执行控制值表示执行所述当前被遍历指令，确定所述当前被遍历指令的指令类型；相应于所述当前被遍历指令的指令类型为访存指令，按照执行访存指令的方式计量执行所述当前被遍历指令的时长；相应于所述当前被遍历指令的指令类型为算数逻辑指令，将执行算数逻辑指令的固定时长作为执行所述当前被遍历指令的时长。4.根据权利要求3所述的方法，其特征在于，所述按照执行访存指令的方式计量执行所述当前被遍历指令的时长，包括：根据所述当前被遍历指令的执行结果中的操作数寄存器值所对应的访存地址，按照设定的Cache访问分析模型计量执行所述当前被遍历指令的时长。5.根据权利要求3所述的方法，其特征在于，所述方法还包括：对于每个所述线程模拟器，在遍历过程中，判断所述当前被遍历指令是否为所述指令列表中的结束指令：若不是，则判断所述当前被遍历指令的执行结果中指...

【专利技术属性】
技术研发人员：齐航空，张竞丹，李亮，
申请(专利权)人：西安芯瞳半导体技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人