一种统一染色阵列高效能动态平衡运行方法技术

技术编号:27876913 阅读:11 留言:0更新日期:2021-03-31 00:55
本发明专利技术涉及一种统一染色阵列高效能动态平衡运行方法。本发明专利技术包括以下步骤:1)场景特征提取;由主机读取绘图场景并记录场景特征;2)配置切换必要性分析;通过计算评估是否需要动态调整染色内核开启数量;3)分析调度开销;4)分析驱动开销;5)运行高效能平衡策略;6)配置染色阵列运行模式。本发明专利技术在满足统一染色阵列功性能的前提下降低计算资源的占用数,从而到达动态降低GPU功耗的目的。

【技术实现步骤摘要】
一种统一染色阵列高效能动态平衡运行方法
本专利技术属于计算机图形领域,尤其涉及一种统一染色阵列高效能动态平衡运行方法。
技术介绍
统一染色阵列是GPU的重要组成部分,其算力直接影响GPU的算力。在GPU设计之初通常将统一染色阵列的流水线上级任务调度单元和下级染色器输出控制单元的数据传输位宽设计为较统一染色阵列满负载运行时的算力稍大,以保证芯片物理面积占用最多的计算单元作为性能瓶颈。但当染色阵列需处理的场景任务相对简单时,全部计算核心的算力峰值如果大于数据传输位宽,则计算资源不能得到充分利用,此时如果关闭一定数量的计算核以降低功耗,就可以达到统一染色阵列高效能动态平衡的效果。但目前未发现此类技术。
技术实现思路
本专利技术为解决
技术介绍
中存在的上述技术问题,而提供统一染色阵列高效能动态平衡运行方法,实现了GPU功性能满足需求的情况下能耗降低。本专利技术的技术解决方案是:本专利技术为一种统一染色阵列高效能动态平衡运行方法,其特殊之处在与:该方法包括以下步骤:1)场景特征提取;由主机读取绘图场景并记录场景特征;2)配置切换必要性分析;通过计算评估是否需要动态调整染色内核开启数量;3)分析调度开销;4)分析驱动开销;5)运行高效能平衡策略;6)配置染色阵列运行模式。优选的,步骤1)中,在读取绘图场景的前一阶段,初始化一段存储区域用于记录场景特征,以避免特征参数为上一场景遗留而导致场景特征描述错误,该步骤的结果输出直接影响开销的计算。优选的,步骤1)中场景特征包括使能开关、模式配置、染色任务数量,为步骤2)配置切换必要性分析、步骤3)分析调度开销、步骤4)分析驱动开销提供必要的数据输入。优选的,步骤2)具体包括以下步骤:2.1)由步骤1)输入的场景特征数据按照一定的函数关系η′f(x,y,z...)计算驱动开销的预估值η′,其中,函数关系f(x,y,z...)为多元线性方程,自变量x,y,z...为步骤1)中统计的使能信息与任务数量,权重系数由染色驱动在设计和测试之初测试与分析得到;η′不一定精确,但能在一定程度上反映场景绘制的复杂程度、染色任务量和染色驱动完成绘制所需的时钟周期数;2.2)计算δmax=Nmax*τmax+ωmax,其中τmax和ωmax为事先实测任务调度单元组装调度全部属性所需时钟周期与染色器输出控制单元搬运全部属性所需时钟周期数,Nmax为染色核的总数量;2.3)若预估值η′大于δmax则跳转至步骤5);若预估值η小于δmax则进行步骤3)与步骤4)。仅当任务数量达到一定程度且驱动开销的预估值η′大于δmax时,直接跳转至步骤5)。优选的,步骤3)具体为:分析步骤1)采集的数据,重点关注各使能开关与模式参数配置,当某一功能使能开时,通过分析其模式配置便能求得任务调度单元与染色器输出控制单元需要调度、组装与搬运的属性数量,以此得知该绘图场景下任务调度单元为一个染色核调度所需周期数τ和染色器输出控制单元搬运一个染色核的输出数据所需周期数ω。优选的,步骤4)具体为:分析步骤1)采集的数据,重点关注各使能开关,当某一功能使能开时,通过分析得知驱动执行路径并能预估一个相对准确的驱动执行周期数T。优选的,步骤5)的高效能平衡策略是:一般情况下,δmax小于染色驱动执行一次的时钟周期数T,但当绘制场景较为简单时,δmax大于T,则即便任务调度单元与染色器输出控制单元以峰值速度组装和搬运数据,仍不能使染色阵列的全部计算核心同时工作,即造成了计算资源的浪费,此时应动态关闭部分计算核,降低芯片功率。优选的,步骤5)的具体步骤如下:5.1)接收来自步骤2)、步骤3)或步骤4)的输入;5.2)若输入来自步骤2),说明计算复杂度高,则控制染色阵列控制模块配置全部计算核心开启;5.3)若输入来自步骤3)、步骤4),则计算其中N为效能平衡时染色核数量,T由步骤4)输入,τ和ω由步骤3)输入;进入步骤6)。优选的,步骤6)具体为:根据步骤5)中N可知需要开启的染色内核数,于是动态关闭不需要的计算资源,达到统一染色阵列高效能动态平衡的目的。本专利技术针对GPU的统一染色阵列,在满足功性能的前提下降低芯片功耗,从场景出发,结合分析任务调度模块与染色器输出控制模块的任务处理能力,满足统一染色阵列功性能的前提下降低计算资源的占用数,从而到达动态降低GPU功耗的目的。因此本专利技术具有以下优点:1)主机对是否运行统一染色阵列高效能动态平衡评估系统进行预估,通过极小的时间代价预估后续计算和染色阵列计算核心数配置改变等操作的必要性;2)动态调整染色内核开启数量,不影响芯片的功能和性能的前提下降低系统功耗。附图说明图1为本专利技术的方法流程图。具体实施方式下面结合附图和具体实施例对本专利技术的技术方案做进一步详细描述。参见图1,本专利技术具体实施例中的统一染色阵列高效能动态平衡运行方法,该方法包括以下步骤:1)场景特征提取;由主机读取绘图场景并记录场景特征;在读取绘图场景的前一阶段,初始化一段存储区域用于记录场景特征,以避免特征参数为上一场景遗留而导致场景特征描述错误,该步骤的结果输出直接影响开销的计算;场景特征包括使能开关、模式配置、染色任务数量,为步骤2)配置切换必要性分析、步骤3)分析调度开销、步骤4)分析驱动开销提供必要的数据输入。2)配置切换必要性分析;通过计算评估是否需要动态调整染色内核开启数量;2.1)由步骤1)输入的场景特征数据按照一定的函数关系η′f(x,y,z...)计算驱动开销的预估值η′,其中,函数关系f(x,y,z...)为多元线性方程,自变量x,y,z...为步骤1)中统计的使能信息与任务数量,权重系数由染色驱动在设计和测试之初测试与分析得到;η′不一定精确,但能在一定程度上反映场景绘制的复杂程度、染色任务量和染色驱动完成绘制所需的时钟周期数。2.2)计算δmax=Nmax*τmax+ωmax,其中τmax和ωmax为事先实测任务调度单元组装调度全部属性所需时钟周期与染色器输出控制单元搬运全部属性所需时钟周期数,Nmax为染色核的总数量;2.3)若预估值η′大于δmax则跳转至步骤5);若预估值η小于δmax则进行步骤3)与步骤4)。总的来说,仅当任务数量达到一定程度且驱动开销的预估值η′大于δmax时,直接跳转至步骤5)。3)分析调度开销;分析步骤1)采集的数据,重点关注各使能开关与模式参数配置,当某一功能使能开时,通过分析其模式配置便能求得任务调度单元与染色器输出控制单元需要调度、组装与搬运的属性数量,以此得知该绘图场景下任务调度单元为一个染色核调度所需周期数τ和染色器输出控制单元搬运一个染色核的输出数据所需周期数ω。4)分析驱动开销;分析步骤1)采集的数据,重点关注各使能开关,当某一功能使能开时,通过分析得知驱动执行路径本文档来自技高网...

【技术保护点】
1.一种统一染色阵列高效能动态平衡运行方法,其特征在与:该方法包括以下步骤:/n1)场景特征提取;由主机读取绘图场景并记录场景特征;/n2)配置切换必要性分析;通过计算评估是否需要动态调整染色内核开启数量;/n3)分析调度开销;/n4)分析驱动开销;/n5)运行高效能平衡策略;/n6)配置染色阵列运行模式。/n

【技术特征摘要】
1.一种统一染色阵列高效能动态平衡运行方法,其特征在与:该方法包括以下步骤:
1)场景特征提取;由主机读取绘图场景并记录场景特征;
2)配置切换必要性分析;通过计算评估是否需要动态调整染色内核开启数量;
3)分析调度开销;
4)分析驱动开销;
5)运行高效能平衡策略;
6)配置染色阵列运行模式。


2.根据权利要求1所述的统一染色阵列高效能动态平衡运行方法,其特征在于:所述步骤1)中,在读取绘图场景的前一阶段,初始化一段存储区域用于记录场景特征。


3.根据权利要求1所述的统一染色阵列高效能动态平衡运行方法,其特征在于:所述步骤1)中场景特征包括使能开关、模式配置、染色任务数量。


4.根据权利要求1所述的统一染色阵列高效能动态平衡运行方法,其特征在于:所述步骤2)具体包括以下步骤:
2.1)由步骤1)输入的场景特征数据按照一定的函数关系η′f(x,y,z...)计算驱动开销的预估值η′,其中,函数关系f(x,y,z...)为多元线性方程,自变量x,y,z...为步骤1)中统计的使能信息与任务数量,权重系数由染色驱动在设计和测试之初测试与分析得到;η′不一定精确,但能在一定程度上反映场景绘制的复杂程度、染色任务量和染色驱动完成绘制所需的时钟周期数;
2.2)计算δmax=Nmax*τmax+ωmax,其中τmax和ωmax为事先实测任务调度单元组装调度全部属性所需时钟周期与染色器输出控制单元搬运全部属性所需时钟周期数,Nmax为染色核的总数量;
2.3)若预估值η′大于δmax则跳转至步骤5);若预估值η小于δmax则进行步骤3)与步骤4)。


5.根据权利要求4所述的统一染色阵列高效能动态平衡运行方...

【专利技术属性】
技术研发人员:田泽马城城刘红红纪楠秦翔张兴雷
申请(专利权)人:西安翔腾微电子科技有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1