【技术实现步骤摘要】
一种处理器、多线程合并方法及电子设备
[0001]本申请属于计算机
,具体涉及一种处理器、多线程合并方法及电子设备。
技术介绍
[0002]当前SIMT(Single Instruction Multiple Thread,单指令多线程)处理器中,多个线程并行执行访存操作时,有可能存在并行的多个线程的访问地址指向同一块空间(这里的“一块空间”指内存子系统中的基本操作单元,通常为缓存行(Cache Line))中的不同数据或同一数据。针对这一现象通常会进行合并访存操作,以减少访存的次数,节省带宽和功耗。
[0003]当前常见的合并实现方式主要为对多线程进行全比较,将访问地址指向同一缓存行的线程进行合并。而全比较方式在线程较多情况下,需要较多比较逻辑电路,例如,16个线程的全比较需要120个比较逻辑电路,使得芯片的面积、功耗等均不理想。
技术实现思路
[0004]鉴于此,本申请的目的在于提供一种处理器、多线程合并方法及电子设备,以改善全比较方式需要较多比较逻辑电路,导致芯片的面积、功耗均不理想的问题 ...
【技术保护点】
【技术特征摘要】
1.一种处理器,其特征在于,包括:N个分离处理单元,与N个线程组一一对应,每个所述分离处理单元,用于对对应的线程组内的线程进行合并,得到合并后的剩余线程,N为大于等于2的正整数,每个线程组中的线程数大于等于2;重联接处理单元,与每个所述分离处理单元均连接,所述重联接处理单元,用于将所述N个分离处理单元中任意一个分离处理单元输出的剩余线程与剩余N
‑
1个分离处理单元输出的剩余线程进行线程合并,得到合并后的剩余线程。2.根据权利要求1所述的处理器,其特征在于,若每个所述分离处理单元输出的线程数不为最大剩余线程数时,所述处理器还包括:临时存储单元,用于临时存储线程;聚合处理单元,与所述重联接处理单元、所述临时存储单元均连接,所述聚合处理单元,用于将所述重联接处理单元输出的线程与临时存储单元中存储的线程进行合并,并将合并后的线程存储在所述临时存储单元中。3.根据权利要求2所述的处理器,其特征在于,所述临时存储单元所支持存储的线程数被配置为C,所述聚合处理单元包括B*C个比较逻辑电路,B为所述重联接处理单元输出的线程数。4.根据权利要求1所述的处理器,其特征在于,每个所述分离处理单元输出的线程数被配置为A,A的取值为1至最大剩余线程数之间的整数。5.根据权利要求1所述的处理器,其特征在于,所述重联接处理单元输出的线程数被配置为B,B 的取值为1至N*A之间的整数,A为每个所述分离处理单元输出的线程数,A的取值为1至最大剩余线程数之间的整数。6.根据权利要求1所述的处理器,其特征在于,所述处理器还包括:内核;所述内核,用于将并行执行的多个线程分成N个线程组,并将每个线程组下发到对应的分离处理单元。7.一种多线程合并方法,其特征在于,包括:在N个线程组中的每个线程组内对访问对象指向同一对象的线程进...
【专利技术属性】
技术研发人员:牛剑锋,李晶晶,
申请(专利权)人:上海登临科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。