当前位置: 首页 > 专利查询>吉林大学专利>正文

一种面向SLAM的GPU功耗控制方法技术

技术编号:36263787 阅读:11 留言:0更新日期:2023-01-07 10:02
一种面向SLAM的GPU功耗控制策略,涉及计算机体系结构领域,为降低面向SLAM的GPU的能耗。本方法包括:建立GPU性能与功耗模型,选取关键的配置参数对运行SLAM的GPU进行设计空间探索,得到每个相对应的配置之下SLAM每个内核的能量消耗以及运行时间,将设计空间探索的中所有配置的运行时间与基准配置下的运行时间进行对比,在两者运行时间差值小于所设定的阈值的所有配置中选择一个能源消耗最少的作为最终运行的配置的同时将额外的配置使用电源门控技术将其关闭,同时使用DVFS对应用电源门控所导致的运行时间增加进行中和。这样可以同时减少GPU运行SLAM的时间和功耗。时减少GPU运行SLAM的时间和功耗。时减少GPU运行SLAM的时间和功耗。

【技术实现步骤摘要】
一种面向SLAM的GPU功耗控制方法


[0001]本专利技术涉及计算机体系结构领域,具体涉及一种面向SLAM的GPU功耗控制策略。

技术介绍

[0002]同步定位与建图(SLAM)是许多嵌入式领域的核心组件,例如机器人、增强和虚拟现实。由于SLAM对计算资源的高要求,通常使用通用图形处理单元(GPGPU)作为其处理引擎。同时,嵌入式系统通常具有严格的功率约束。因此,如何提供SLAM所需的性能,同时仍满足功率限制,是GPGPU设计者面临的一个巨大挑战。
[0003]由于运行SLAM的GPU在很多情况下其配置使用是不完全的,即某些配置的某些部分在SLAM内核运行的过程中会有相对长时间的空闲,而空闲的部分在运行时也会产生相应的功耗,现阶段并没有相关技术能够很好的解决这个相应的功耗,因此将电源门控应用在此之上,即在某些配置不需要在调小后基本不影响性能的情况下通过电源门控使其某些部分处于关闭状态以大幅度的减少能量消耗。同时,由于电源门控会导致性能上会有小幅度下降,动态电压频率调整(DVFS)也被应用以中和性能的下降。

技术实现思路

[0004]本专利技术提供一种面向SLAM的GPU功耗控制方法,以降低面向SLAM的GPU的能耗。
[0005]一种面向SLAM的GPU功耗控制方法,该方法由以下步骤实现:
[0006]步骤一、设计空间探索,根据所述空间探索在仿真器上建立GPU功耗性能模型,通过所述模型选择设计空间探索关键设备的参数和DVFS频率;
[0007]步骤二、在步骤一所述的设计空间探索关键设备上设置电源门控,并在所述仿真器中设置电源门控管理器,用于控制电源门控的状态;
[0008]步骤三、根据步骤一选择的空间探索关键设备的参数在所述仿真器上进行空间设计空间探索,获得所有配置下SLAM的运行时间和功耗;
[0009]步骤四、选取设计空间探索基准,采用最优配置搜索算法搜索到最优配置和最优频率;
[0010]步骤五、采用步骤四获得的最优配置和最优频率对电源门控的状态以及DVFS进行调整。
[0011]本专利技术的有益效果:本专利技术所述的控制方法,通过电源门控的应用,在某些配置不需要高能耗时通过电源门控使其某些部分处于关闭状态以大幅度的减少能量消耗。同时,由于电源门控会导致性能上会有小幅度下降,采用动态电压频率调整(DVFS)以中和性能的下降。
附图说明
[0012]图1为本专利技术所述的一种面向SLAM的GPU功耗控制方法的流程图;
[0013]图2为本专利技术所述的一种面向SLAM的GPU功耗控制方法中最优配置搜索算法的流
程图;
[0014]图3为GPU中电源门控管理器的原理框图。
具体实施方式
[0015]结合图1至图3说明本实施方式,一种面向SLAM的GPU功耗控制方法,该方法由以下步骤实现:
[0016]步骤1:设计空间探索,然后在设计空间探索的基础上,在GPU仿真器的上建立面向AR/VR的GPU,Nvidia Jetson Xavier NX的模型,并进行设计空间探索得到相应的功耗性能模型。
[0017]本实施方式中,选取例如GPU的流式多处理器计算单元(SM)数量,流式处理器(SP)数量等关键设备的参数作为设计空间探索的配置;
[0018]步骤2:在所述关键设备上添加电源门控,同时对GPU的主频率进行选择,以中间频率为基准、固定的频率差为挡位,选取以基准频率为中心的、差距为固定挡位的频率作为频率的DVFS参数;
[0019]本实施方式中,电源门控需要架构级支持,因此在其中设置了一个电源门控管理器的硬件单元,即:电源门控管理器控制步骤1所述的关键设备电源门控的开启与关闭。具体添加方式可见图3。通过电源门控管理器来控制SM、SP、寄存器文件、一级指令缓存、一级数据缓存和二级缓存的开启关闭操作。由于GPU通常只有少量的SM,因此可以用电源门控对每个SM进行控制,即每个SM使用一个休眠晶体管;GPU有许多SP,因此SM的控制是以组为粒度进行控制的,例如16个SP被一个休眠晶体管控制;同样的,寄存器文件也是以这种方式来进行控制,例如将16K的寄存器连接到同一个休眠晶体管上,以一个晶体管来控制16K的寄存器的开启和关闭;对于缓存,则只改变通道的数量,这意味着每条通道都由一个休眠晶体管来进行控制。
[0020]步骤3:根据步骤1所选取的关键设备的参数在所建立的仿真器上进行设计空间探索并记录下所有kernel的运行时间和功耗;
[0021]步骤4:将所有配置最高的GPU作为设计空间探索的基准配置。根据基准配置下SLAM各个kernel的运行时间和功耗建立的最优配置搜索算法与设计空间探索中所有配置所对应的各个kernel的运行时间与功耗进行比较搜索到最优的配置,即:根据基准配置所对应的运行时间与设定的阈值,选取设计空间探索中运行时间小于阈值的最小功耗所对应的配置作为最优配置。之后再根据最优配置搜索算法得到DVFS调节频率,选取DVFS调节频率附近的两个DVFS参数作为准最优频率,在GPU最优配置的基础上通过GPU片内调节将GPU频率调节至准最优频率,选取其中功耗
×
运行时间最小的作为最优频率。具体过程如图2所示;
[0022]步骤A、设定基准运行时间t1、功耗与探测的配置传入仿真器,将最小功耗W1暂定为基准功耗,最优配置暂定为基准配置;
[0023]步骤B、设计空间探索运行时间t2、功耗W2、探测的配置传入仿真器;
[0024]步骤C、判断t2与t1差是否小于阈值;如果是,执行步骤D;否则,执行步骤G;
[0025]步骤D、判断W2是否小于W1,如果是,执行步骤E;否则,执行步骤G;
[0026]步骤E、将W1替换为W2,最优配置替换为设计空间探索配置;执行步骤F;
[0027]步骤F、判断设计空间探索配置是否全部遍历,如果是,执行步骤H,否则,执行步骤B;
[0028]步骤G、选取下一个设计空间探索信息,执行步骤F;
[0029]步骤H、以最优配置指导电源门控的开启关闭,并在基准频率的基础上乘比率μ
c

m
以获得DVFS调节频率,选择DVFS参数中与DVFS调节频率附近的两个频率作为准最优频率;
[0030]步骤I、通过片内调节对最优配置GPU进行DVFS调节频率至准最优频率,选取准最优频率中功耗
×
运行时间最小的作为最优频率。
[0031]本实施方式中,通过选取设计空间探索的最大配置为基准配置,过长的运行时间是无法容忍的,因此根据其基准配置的运行时间设置相应的阈值,如可容忍5%以内的运行时间增加。并在此基础上选择能耗最小的配置作为最优配置。
[0032]然后通过最优配置搜索算法搜索到各个kernel的最优频率。即:选取设计空间探索的中间配置为基准硬件配置H,其对应的运行时间为L
H
。控制其他配置不变,选取SM、SP、一级指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向SLAM的GPU功耗控制方法,其特征是:该方法由以下步骤实现:步骤一、设计空间探索,根据所述空间探索在仿真器上建立GPU功耗性能模型,通过所述模型选择设计空间探索关键设备的参数和DVFS频率;步骤二、在步骤一所述的设计空间探索关键设备上设置电源门控,并在所述仿真器中设置电源门控管理器,用于控制电源门控的状态;步骤三、根据步骤一选择的空间探索关键设备的参数在所述仿真器上进行空间设计空间探索,获得所有配置下SLAM的运行时间和功耗;步骤四、选取设计空间探索基准,采用最优配置搜索算法搜索到最优配置和最优频率;步骤五、采用步骤四获得的最优配置和最优频率对电源门控的状态以及DVFS进行调整。2.根据权利要求1所述的一种面向SLAM的GPU功耗控制方法,其特征在于:步骤一中,所述设计空间探索,具体为选择GPU的流式多处理器计算单元数量和流式处理器数量作为...

【专利技术属性】
技术研发人员:阎凯歌马祝俊谭婧炜佳
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1