一种支持多档负载平衡的容量检测方法及装置制造方法及图纸

技术编号:34753556 阅读:26 留言:0更新日期:2022-08-31 18:50
本发明专利技术提供的一种支持多档负载平衡的容量检测方法及装置,涉及芯片技术,包括需求为线程束自由分发的无负载均衡第一预设需求时:获取各执行子单元含有波前所需孔大小的孔数量,并基于各所述孔数量获取总数量;当所述总数量大于等于线程束所含的总波前数,生成容量检测通过的通过信息;需求为每个线程束在各执行子单元上分发的波前数相差不超过1的中等负载均衡第二预设需求时:获取总波前数除以执行子单元数量后向下取整的容纳值;当所述总数量大于等于线程束所含的总波前数,且各执行子单元的容量大于等于所述容纳值,生成容量检测通过的通过信息。本发明专利技术可以较大程度地提高容量检测效率。检测效率。检测效率。

【技术实现步骤摘要】
一种支持多档负载平衡的容量检测方法及装置


[0001]本专利技术涉及芯片技术,尤其涉及一种支持多档负载平衡的容量检测方法及装置。

技术介绍

[0002]硬件能执行的最小任务单位,被定义成线程。参见图1,上层分解单元以线程束(多个线程,数目可变)为单位向下层分解单元件派发任务。1个计算单元通常包含4个执行子单元。1个线程束分解的所有波前(wavefront,通常包含64个线程),必须分发到同一个计算单元,但每个波前可以位于4个执行子单元的任何一个。为统一硬件规格,提高并行度,各执行子单元都能同时执行分发给自己的波前。将线程束拆解成合适的多个波前(通常1个线程束最多1024个线程,即最多拆解为16个波前),并将所有波前分发到合适的计算单元的执行子单元,即资源调度的核心功能。波前会占用执行子单元的资源,只有剩余资源满足新波前需求时,执行子单元才能接受新波前。参见图2,资源在一个执行子单元上用一维比特数组表达,共N格(slot),每项1比特,为1代表该格可用,为0代表已被占。连续的1被定义为孔(hole)。一个线程束内的每个波前都需要占用相同大小的孔,具体大小由配置确定,不同线程束的配置可能不同。
[0003]现有技术中,参见图3和4,容量检测为输入每个波前需要的孔大小,及各执行子单元上待分发的波前数,各执行子单元输出通过与否的结果。
[0004]然而,现有技术中的容量检测针对无负载平衡需求和中等负载平衡需求不够灵活,检测效率较低。

技术实现思路

[0005]本专利技术实施例提供一种支持多档负载平衡的容量检测方法及装置,可以提高容量检测效率。
[0006]本专利技术实施例的第一方面,提供一种支持多档负载平衡的容量检测方法,包括:需求为线程束自由分发的无负载均衡第一预设需求时:获取各执行子单元含有波前所需孔大小的孔数量,并基于各所述孔数量获取总数量;当所述总数量大于等于线程束所含的总波前数,生成容量检测通过的通过信息;需求为每个线程束在各执行子单元上分发的波前数相差不超过1的中等负载均衡第二预设需求时:获取总波前数除以执行子单元数量后向下取整的容纳值;当所述总数量大于等于线程束所含的总波前数,且各执行子单元的容量大于等于所述容纳值,生成容量检测通过的通过信息。
[0007]可选地,在第一方面的一种可能实现方式中,所述获取各执行子单元含有波前所需孔大小的孔数量,包括:对波前进行检测处理,获取输入所述波前所需孔大小;
根据所述孔大小,获取各执行子单元含有所述孔大小的孔数量。
[0008]可选地,在第一方面的一种可能实现方式中,所述基于各所述孔数量获取总数量,包括:对各执行子单元的所述孔数量进行求和处理,获取总数量。
[0009]可选地,在第一方面的一种可能实现方式中,所述获取总波前数除以执行子单元数量后向下取整的容纳值,包括:获取总波前数,对所述总波前数除以执行子单元数量处理,获取中间值;若所述中间值不是整数,对所述中间值向下取整生成所述容纳值。
[0010]可选地,在第一方面的一种可能实现方式中,还包括:需求为每个线程束在各执行子单元上均匀分发的完全负载均衡的第三预设需求时:获取各执行子单元上待分发的波前数;当各所述执行子单元含有波前所需孔大小的孔数量大于等于对应的待分发的波前数,生成容量检测通过的通过信息。
[0011]可选地,在第一方面的一种可能实现方式中,还包括:接收用户的输入需求,确定所述输入需求为所述第一预设需求、所述第二预设需求和所述第三预设需求中的一个。
[0012]本专利技术实施例的第二方面,提供一种支持多档负载平衡的容量检测装置,包括:第一模块,用于需求为线程束自由分发的无负载均衡第一预设需求时:获取各执行子单元含有波前所需孔大小的孔数量,并基于各所述孔数量获取总数量;当所述总数量大于等于线程束所含的总波前数,生成容量检测通过的通过信息;第二模块,用于需求为每个线程束在各执行子单元上分发的波前数相差不超过1的中等负载均衡第二预设需求时:获取总波前数除以执行子单元数量后向下取整的容纳值;当所述总数量大于等于线程束所含的总波前数,且各执行子单元的容量大于等于所述容纳值,生成容量检测通过的通过信息。
[0013]可选地,在第二方面的一种可能实现方式中,所述第一模块中获取各执行子单元含有波前所需孔大小的孔数量,包括:对波前进行检测处理,获取输入所述波前所需孔大小;根据所述孔大小,获取各执行子单元含有所述孔大小的孔数量。
[0014]本专利技术实施例的第三方面,提供一种支持多档负载平衡的容量检测设备,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行本专利技术第一方面及第一方面各种可能涉及的所述方法。
[0015]本专利技术实施例的第四方面,提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本专利技术第一方面及第一方面各种可能涉及的所述方法。
[0016]本专利技术提供的一种支持多档负载平衡的容量检测方法及装置,在无负载均衡和中等负载均衡的需求下,相对于传统的容量检测方法,无需判断每个线程束在各执行子单元
上是否可以均匀分发的完全负载,可以较大程度地提高容量检测效率。
附图说明
[0017]图1为
技术介绍
用于体现总体硬件架构的示意图。
[0018]图2为
技术介绍
用于体现孔的示意图。
[0019]图3为
技术介绍
用于体现现有技术容量检测的示意图。
[0020]图4为
技术介绍
用于体现完全负载平衡的示意图。
[0021]图5为本实施例用于体现无负载平衡自由分发的示意图。
[0022]图6为本实施例用于体现容量检测的示意图。
[0023]图7为本实施例用于体现中等负载平衡自由分发的示意图。
[0024]图8是本专利技术实施例提供的一种支持多档负载平衡的容量检测装置。
[0025]图9是本专利技术实施例提供的一种支持多档负载平衡的容量检测设备的硬件结构示意图。
具体实施方式
[0026]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
[0028]应当理解,在本专利技术的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本专利技术实施例的实施过程构成任何限定。
[0029]应当本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种支持多档负载平衡的容量检测方法,其特征在于,包括:需求为线程束自由分发的无负载均衡第一预设需求时:获取各执行子单元含有波前所需孔大小的孔数量,并基于各所述孔数量获取总数量;当所述总数量大于等于线程束所含的总波前数,生成容量检测通过的通过信息;需求为每个线程束在各执行子单元上分发的波前数相差不超过1的中等负载均衡第二预设需求时:获取总波前数除以执行子单元数量后向下取整的容纳值;当所述总数量大于等于线程束所含的总波前数,且各执行子单元的容量大于等于所述容纳值,生成容量检测通过的通过信息。2.根据权利要求1所述的方法,其特征在于,所述获取各执行子单元含有波前所需孔大小的孔数量,包括:对波前进行检测处理,获取输入所述波前所需孔大小;根据所述孔大小,获取各执行子单元含有所述孔大小的孔数量。3.根据权利要求1或2所述的方法,其特征在于,所述基于各所述孔数量获取总数量,包括:对各执行子单元的所述孔数量进行求和处理,获取总数量。4.根据权利要求1所述的方法,其特征在于,所述获取总波前数除以执行子单元数量后向下取整的容纳值,包括:获取总波前数,对所述总波前数除以执行子单元数量处理,获取中间值;若所述中间值不是整数,对所述中间值向下取整生成所述容纳值。5.根据权利要求1所述的方法,其特征在于,还包括:需求为每个线程束在各执行子单元上均匀分发的完全负载均衡的第三预设需求时:获取各执行子单元上待分发的波前数;当各所述执行子单元含有波前所需孔大小的孔数量大于等于对应的待分...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:沐曦集成电路上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1