An embodiment of the present invention proposes a device that pushes a core into a queue by a device end, comprising a memory access unit and a command string processor. The memory access unit is coupled to a command string processor and a video memory, and contains an entity execution thread recognition buffer. The video memory contains a ring buffer. The memory access unit configures a space in the ring buffer for the first hardware execution thread whose core is the first instruction of the command string processor, and stores the basic outline data of the first hardware execution thread into the entity execution thread recognition. The basic outline data includes the execution thread identifier, the tail address of the space and the ready flag, which indicates that the first hardware execution thread contains many first commands that are not ready.
【技术实现步骤摘要】
由装置端推核心入队列的装置本申请为申请日为2015年12月4日、申请号为201510885446.1的专利技术名称为“由装置端推核心入队列的装置”的申请案的分案申请。
本专利技术涉及一种图形处理单元技术,特别是一种由装置端推核心入队列的装置。
技术介绍
主端(CPU端)将一个核心推入队列,用以驱动装置端执行。传统上,核心执行结束,装置端返还控制权给主端。接着,主端将另一个待执行的核心推入队列。然而,这需要消耗额外成本并降低效能。因此,本专利技术提出一种由装置端(GPU端)推核心入队列的装置,用以解决以上缺点。
技术实现思路
本专利技术的实施例提出一种由装置端推核心入队列的装置,包含存储器存取单元、命令串处理器、执行单元(EU,ExecutionUnit)及固定流水线单元(FFU,FixedFunctionUnit)。命令串处理器耦接于存储器存取单元,用以从存储器存取单元接收第一命令时,执行环形缓存器中的命令。执行单元根据核心(kernel)的指令(instruction)指示存储器存取单元为硬件执行线程在环形缓存器中配置空间,然后写入硬件执行线程包含的多个第二命令至环形缓存器中的空间。本专利技术的实施例提出一种由装置端推核心入队列的装置,包含存储器存取单元及命令处理器。存储器存取单元耦接于命令串处理器及视讯存储器,包含实体执行线程识别缓存器。视讯存储器包含环形缓存器。存储器存取单元根据执行单元(EU)发出的指令为核心的硬件执行线程在环形缓存器中配置空间,以及将硬件执行线程的基本轮廓数据储存至实体执行线程识别缓存器。基本轮廓数据包含执行线程识别码、配置空间的尾地 ...
【技术保护点】
1.一种由装置端推核心入队列的装置,包含:一命令串处理器;以及一存储器存取单元,耦接于上述命令串处理器及一视讯存储器,包含一实体执行线程识别缓存器,其中,上述视讯存储器包含一环形缓存器,上述存储器存取单元根据上述命令串处理器的一第一指令为一核心的一第一硬件执行线程在上述环形缓存器中配置一空间,将上述第一硬件执行线程的一基本轮廓数据储存至上述实体执行线程识别缓存器,上述基本轮廓数据包含一执行线程识别码、上述空间的一尾地址及一就绪旗标,上述就绪旗标指出上述第一硬件执行线程包含的多个第一命令尚未就绪。
【技术特征摘要】
1.一种由装置端推核心入队列的装置,包含:一命令串处理器;以及一存储器存取单元,耦接于上述命令串处理器及一视讯存储器,包含一实体执行线程识别缓存器,其中,上述视讯存储器包含一环形缓存器,上述存储器存取单元根据上述命令串处理器的一第一指令为一核心的一第一硬件执行线程在上述环形缓存器中配置一空间,将上述第一硬件执行线程的一基本轮廓数据储存至上述实体执行线程识别缓存器,上述基本轮廓数据包含一执行线程识别码、上述空间的一尾地址及一就绪旗标,上述就绪旗标指出上述第一硬件执行线程包含的多个第一命令尚未就绪。2.如权利要求1所述的由装置端推核心入队列的装置,其中,上述存储器存取单元更判断是否需要从上述环形缓存器的一首地址开始配置上述空间;若是,从上述环形缓存器的上述首地址开始配置上述空间给上述第一硬件执行线程;以及,否则,从上述实体执行线程识别缓存器的最后一个硬件执行线程的尾地址的下一个地址开始配置上述空间给上述第一硬件执行线程。3.如权利要求2所述的由装置端推核心入队列的装置,其中,上述存储器存取单元更判断上述实体执行线程识别缓存器的最后一个硬件执行线程的尾地址是否等于或超过上述环形缓存器的尾地址;若是,判断需要从上述环形缓存...
【专利技术属性】
技术研发人员:武凤霞,洪洲,沈恬,王渊峰,
申请(专利权)人:上海兆芯集成电路有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。