【技术实现步骤摘要】
SIMT指令处理方法及装置
[0001]本专利技术涉及计算机
,具体涉及一种SIMT指令处理方法及装置。
技术介绍
[0002]在并行运算中,单指令多线程(single instruction multiple threads,SIMT)结构和同步多线程(simultaneous mutlithreading,SMT)相比具有更大的灵活性和更高的效率,可以通过大量的线程并行运行达到更高的吞吐率,因此,SIMT架构被广泛使用于高性能处理器中。
[0003]在并行模型中,存在大量的只对基地址等单一线程进行操作的标量运算,如何提高指令的处理效率是待解决问题。
技术实现思路
[0004]本专利技术实施例提供一种SIMT指令处理方法及装置,用于提高处理效率。
[0005]第一方面提供一种SIMT指令处理装置,包括标量处理单元和向量处理单元,其中:
[0006]所述标量处理单元,用于根据标量类型的SIMT指令,进行标量运算;
[0007]所述向量处理单元,用于根据向量类型的SIMT指 ...
【技术保护点】
【技术特征摘要】
1.一种单指令多线程SIMT指令处理装置,其特征在于,包括标量处理单元和向量处理单元,其中:所述标量处理单元,用于根据标量类型的SIMT指令,进行标量运算;所述向量处理单元,用于根据向量类型的SIMT指令,进行向量运算。2.根据权利要求1所述的装置,其特征在于,所述装置还包括用于存储标量数据的标量寄存器组和用于存储向量数据的向量寄存器组,其中:所述标量寄存器组分别耦合所述标量处理单元和所述向量处理单元,所述向量寄存器组耦合所述向量处理单元。3.根据权利要求2所述的装置,其特征在于,所述装置还包括交换crossbar模块,包括多个crossbar,其中:所述标量处理单元通过所述crossbar模块与所述标量寄存器组连接;所述向量处理单元通过所述crossbar模块分别与所述标量寄存器组和所述向量寄存器组连接。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述装置还包括控制单元,其中:所述控制单元分别耦合所述标量处理单元和所述向量处理单元;所述控制单元,用于确定所述SIMT指令的指令类型,并基于所述SIMT指令的指令类型,向所述标量处理单元或所述向量处理单元发送所述SIMT指令。5.根据权利要求4所述的装置,其特征在于,所述控制单元,用于根据所述SIMT指令携带的目的地址,确定所述SIMT指令的指令类型。6.根据权利要求1
‑
5任一项所述的装置,其特征在于,所述装置还包括标量调度单元和向量调度单元,其中:所述标量调度单元耦合所述标量处理单元,所述向量调度单元耦合所述向量处理单元;所述标量调度单元,用于将标量类型的SIMT指令调度至所述标量处理单元;所述向量调度单元,用于将向量类型的SIMT指令调度至所述向量处理单元。7.根据权利要求1
‑
6任一项所述的装置,其特征在于,在多个线程并行执行同一任务的情况下,所述多个线程对应相同的基地址且对应不同的偏移地址,所述标量处理单元用于对所述基地址的数据进行运算,得到第一运算结果,所述向量处理单元用于对所述偏移地址的数据进行运算,得到第二运算结果。8.根据权利要求2
‑
7...
【专利技术属性】
技术研发人员:周俊,王文强,夏晓旭,
申请(专利权)人:上海阵量智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。