【技术实现步骤摘要】
一种应用于自动驾驶的NUCA架构硬件性能优化方法、系统及介质
[0001]本专利技术属于自动驾驶领域,尤其涉及一种应用于自动驾驶的NUCA架构硬件性能优化方法、系统及介质。
技术介绍
[0002]目前,在自动驾驶中单芯片上可以集成多个处理器核即多核处理器,通过聚合芯片上的多个处理器核的计算能力来提高应用程序执行性能。多核处理器采用共享存储结构,片上cache种类主要有:私有cache、片上共享cache、片间共享cache。典型的cache结构:片内共享最后一级cache(LLC),片间共享内存。缓存cache大小及速度缓存是用来存储一些常用或即将用到的数据或指令,其结构和大小对CPU或GPU速度的影响非常大,当需要相应的数据和指令时候直接从缓存中读取的话会比访问内存甚至硬盘要快得多,能大幅度提升处理器的处理速度。NUCA架构在数据集较小时,处理器核在本地cache足够容纳数据集,故处理器核只使用本地cache;当数据集较大时,本地的cache放不下的数据就可以放到其相邻或者更外围的共享cache中。
[0003]通 ...
【技术保护点】
【技术特征摘要】
1.一种应用于自动驾驶的NUCA架构硬件性能优化方法,其特征在于,所述应用于自动驾驶的NUCA架构硬件性能优化方法包括:利用广度优先算法由近向远查找访问外围的共享cache,当访问到空闲地址则直接存入数据,否则利用队列的先进先出特征回顾一遍相邻点,继续访问下一层的空闲地址,直至访问到空闲地址或访问外围的cache到一定层数阈值时,停止继续访问。2.如权利要求1所述应用于自动驾驶的NUCA架构硬件性能优化方法,其特征在于,所述利用广度优先算法由近向远查找访问外围的共享cache的具体过程为:自动驾驶系统从外界采集的数据进入一处理器核的cache中,先访问core本地cache是否有空闲地址,有则直接存入,否则利用广度优先算法先查找最近的,然后次近的,依次向外对相邻的处理器核访问,若相邻的处理器核cache存在空闲地址则存入。3.如权利要求1所述应用于自动驾驶的NUCA架构硬件性能优化方法,其特征在于,所述利用队列的先进先出特征回顾一遍相邻点的具体过程为:依据队列的先进先出特征把刚访问的相邻的处理器核cache按顺序回顾一遍,若仍不存在空闲地址,则继续访问所述相邻的处理器核的外围的处理器核。4.如权利要求2所述应用于自动驾驶的NUCA架构硬件性能优化方法,其特征在于,所述广度优先算法通过片上网络对相邻的处理器核进行访问,所述片上网络的拓扑结构是由多个单元构成,每个单元包括Router、NetworkInterface、core以及cache。5.如权利要求1所述应用于自动驾驶的NUCA架构硬件性能优化方法,其特征在于,所述访问外围的c...
【专利技术属性】
技术研发人员:王海,胡强,郭宪章,黄乐天,
申请(专利权)人:电子科技大学长三角研究院湖州,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。