并行管道中的发散分支的硬件和软件解决方案制造技术

技术编号：12357738 阅读：67 留言：0更新日期：2015-11-20 13:25

一种用于在处理器内部的硬件并行执行道上有效地处理指令的系统和方法。响应于已识别的循环内部的给定发散点，编译器将所述已识别的循环内部的指令布置到超长指令字(VLIW)中。至少一个VLIW包括由所述给定发散点和对应汇聚点之间的不同基本块混合的指令。所述编译器生成代码，其中当被执行时，所述代码在运行时将给定的VLIW内部的指令分配给目标处理器内部的多个并行执行道。所述目标处理器包括单指令多数据(SIMD)微型体系结构。对给定的道的分配是基于运行时在所述给定分散点处针对所述给定的道发现的分支方向。所述目标处理器包括用于存储指示的矢量寄存器，所述指示指示了已提取的VLIW内部的哪个给定指令用于相关联的道来执行。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】背景
本公开涉及计算系统，并且更具体地说，涉及在处理器内部的硬件并行执行道上有效地处理指令。背景任务的并行化被用来增加计算机系统的吞吐量。为此，编译器可从程序代码中提取并行化的任务以在系统硬件上并行执行。为了增加在硬件上的并行执行，处理器可包括多个并行执行道，如单指令多数据（SIMD)微型体系结构。与单道微型体系结构或通用微型体系结构相比，这种类型的微型体系结构可以为特定的软件应用程序提供更高的指令吞吐量。受益于SHffi微型体系结构的任务的一些实例包括视频图形渲染、加密和垃圾回收。在许多情况下，特定的软件应用程序具有数据并行性，其中每个工作项目的执行或并行函数调用在自身内部是数据相关的。例如，第一工作项目可数据独立于第二工作项目，并且第一工作项目和第二工作项目中的每一个被同时安排在SHffi微型体系结构内部的单独并行执行道上。然而，在第一工作项目和第二工作项目中的每一个内部执行的指令量可以是数据相关的。实施为分支指令的条件测试可针对第一工作项目通过，但是针对取决于每个工作项目的数据的第二工作项目未通过。由于第二工作项目在第一工作项目继续其正在进行的执行时停止执行并且等待，并行执行的效率可能被降低。当只有少数工作项目由于已通过测试而继续执行，而大部分工作项目由于未通过测试而空闲时，低效率增长。实施方案概述本专利技术涵盖用于在处理器内部的硬件并行执行道上有效地处理指令的系统和方法。在各种实施方案中，后端编译器检查软件应用程序的程序指令以布置指令并且生成代码来在目标处理器上目有效地处理指令。目标处理器可...

【技术保护点】
一种非暂时性计算机可读存储介质，其存储被配置用于由计算机系统的至少一个处理器执行的至少一个程序，其中所述至少一个程序包括可执行来进行以下操作的指令：识别多个程序指令内部的循环和对应的基本块；并且响应于已识别的循环内部的给定发散点，将所述已识别的循环内部的多个指令布置到多个超长指令字(VLIW)中，其中至少一个VLIW包括由所述给定发散点和对应汇聚点之间的不同基本块混合的指令。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：雷扎·亚兹达尼，
申请(专利权)人：超威半导体公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人