【技术实现步骤摘要】
针对GPU计算核进行性能统计分析的方法、装置及介质
[0001]本专利技术实施例涉及图形处理器(GPU,Graphics Processing Unit)
,尤其涉及一种针对GPU计算核进行性能统计分析的方法、装置及介质。
技术介绍
[0002]GPU通常采用单指令多线程(SIMT,Single Instruction Multiple Threads)的方式执行大规模的并行计算,也就是说,每取一条指令(或称计算任务)然后调度多个线程并行执行,其中所有的线程均执行相同的指令列表,而不同的线程各自处理不同数据。
[0003]在对GPU进行性能统计过程中,通常需要对GPU性能进行建模。具体来说,通常采用两种方式对GPU的性能进行建模:其一是仿真建模,比如使用软件模拟构建GPU的仿真模型,并根据仿真模型进行真实的执行过程以获取GPU真实性能数据;其二是分析建模,比如通过构建一定的映射函数(也可称之为分析模型)分析处理GPU的输入,从而计算得出相应性能结果。
[0004]目前常规采用分析建模方式对GPU进行性能 ...
【技术保护点】
【技术特征摘要】
1.一种针对GPU计算核进行性能统计分析的方法,其特征在于,所述方法包括:根据执行计算任务的调度顺序对被调度的调度单元进行排序;针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间;将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的GPU执行所述计算任务所需的总体时间。2.根据权利要求1所述的方法,其特征在于,所述根据执行计算任务的调度顺序对被调度的调度单元进行排序,包括:根据执行计算任务的调度顺序为每个被调度的调度单元进行标识;将每个被调度的调度单元对应的标识以及执行时间按照所述调度顺序填写入一队列。3.根据权利要求2所述的方法,其特征在于,所述针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间,包括:将所述待分析的GPU中用于执行所述计算任务的每个处理核的执行总时间初始化为零;从所述队列中读取第i个被调度的调度单元对应的标识以及执行时间,其中,1≤i≤N
‑
1,N为所有被调度的调度单元数量;从所有处理核中选择执行总时间最少的处理核;根据所述第i个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间;读取第i+1个被调度的调度单元对应的标识以及执行时间,以及从所有处理核中选择执行总时间最少的处理核,并根据所述第i+1个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间,直至所有被调度的调度单元从所述队列中读取完毕。4.根据权利要求3所述的方法,其特征在于,所述将所述待分析的GPU中用于执行所述计算任务的每个处理核的执行总时间初始化为零,包括:构建一长度为M的全零数组;其中,M表示所述待分析的GPU中用于执行所述计算任务的处理核数量;数组中的各元素对应的编号与处理核的标识对应且数组中的各元素表示对应处理核的执行总时间。5.根据权利要求2或3所述的方法,其特征在于,所述队列满足先入先出FIFO规则。6.根据权利要求1所述的方法,其特征在于,所述被调度的调度单元包括被调度的线程...
【专利技术属性】
技术研发人员:齐航空,张竞丹,李亮,
申请(专利权)人:西安芯瞳半导体技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。