当前位置: 首页 > 专利查询>清华大学专利>正文

一种动态可重构阵列处理器的构令流工作方法技术

技术编号:6971118 阅读:278 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种动态可重构阵列处理器的构令流工作方法,可重构处理器单元通过配置流控制数据流的传输、计算和存储,配置流和数据流具有并发性;将数据流分为可重构处理器单元级别、可重构单元阵列级别和可重构核心级别三级;将可重构处理器单元中的配置信息分为配置信息第零层、第一层和第二层共三层。本发明专利技术的一种动态可重构阵列处理器的构令流工作方法,以抽象的分层配置为依据,利用数据流和配置流的并发性来达到节省时间的目的,有效提高了动态可重构处理器的性能。

【技术实现步骤摘要】

本专利技术涉及动态可重构处理器
,特别是涉及。
技术介绍
动态可重构处理器是一种新型的处理器构架,其结合了软件的灵活性和硬件的高效性,和传统单核微处理器相比,不仅可以改变控制流,还可以改变数据通路,具有高性能、 低功耗、灵活性好、扩展性好的优点,尤其适合于处理计算密集型的算法,例如媒体处理、模式识别、基带处理等。因此动态可重构处理器也成为目前处理器结构的一个重要发展方向, 如欧洲微电子中心(IMEC)的ADRES处理器和惠普(HP)的CHESS处理器,前者由紧耦合的超长指令字(Very Long Instruction Word,VLIW)处理器内核和粗颗粒度并行矩阵计算的可重构硬件构成,后者由大量可重构算术计算单元阵列构成。基于构令流工作模式的动态可重构阵列处理器的核心一般为一个二维的可重构算术逻辑单元(ALU)阵列,该结构是并行计算以提高处理能力的基础。同时,可重构算术逻辑单元间必须拥有较为灵活的互联结构以保证运算通用性,这种可配置的互联结构使得动态可重构处理器可以改变数据流,实现了对数据流的高速并行处理,相对于传统单核、少核处理器大大的提升了计算性能。动态可重构阵列处理器可基于构令流利用抽象的分层配置实现配置流(Configuration Stream)控制数据的传输、计算和存储,因此,需要本领域技术人员迫切解决的一个技术问题就是如何能够创新的提出有一种有效措施以克服现有技术存在的缺陷,有效提高动态可重构阵列处理器。
技术实现思路
本专利技术所要解决的技术问题是提供,以抽象的分层配置为依据,利用数据流和配置流的并发性来达到节省时间的目的,有效提高了动态可重构处理器的性能。为了解决上述问题,本专利技术公开了,所述方法包括可重构处理器单元通过配置流控制数据流的传输、计算和存储,配置流和数据流具有并发性;将数据流分为可重构处理器单元级别、可重构单元阵列级别和可重构核心级别三级;将可重构处理器单元中的配置信息分为配置信息第零层、第一层和第二层共三层。进一步地,所述可重构处理器单元包括配置信息接口模块、配置流控制器、数据流控制模块和计算控制模块。进一步地,所述配置信息接口模块完成配置信息的初始化。进一步地,所述配置流控制器实现配置流的控制。进一步地,数据流控制模块和计算控制模块完成数据流的传输、计算和存储。与现有技术相比,本专利技术具有以下优点本专利技术提供,对于包含多个RCA的 RPU而言,利用LCGM可实现CL0、CL1和CL2三层配置流并行处理,抽象的分层配置,增加了配置带宽,抽象的分层配置使RPU中的RPU level.RCA level和Core level三级数据流间的数据传输更加灵活、高效,多个RCA并行处理提高了数据的计算能力,配置流和数据流的并发性提高了数据的传输效率和计算能力,进而提高了动态可重构处理器的性能。附图说明图1是本专利技术具体实施方式中所述的的流程图;图2是本专利技术具体实施方式中所述的Reconfigurable Processing Unit(RPU)框图;图3是本专利技术具体实施方式中所述的数据流(Data Stream)框图;图4是本专利技术具体实施方式中所述的配置流框图(Context Flow Controller框图);图5是本专利技术具体实施方式中所述的配置信息的层次关系及存储位置的示意图;图6是本专利技术具体实施方式中所述的实现H. 264标准中P 16x16宏块类型的色度 cb帧间预测的构令流工作模式框图。具体实施例方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参照图1,示出了本专利技术的流程图, 具体包括步骤S101,可重构处理器单元通过配置流控制数据流的传输、计算和存储,配置流和数据流具有并发性;步骤S102,将数据流分为可重构处理器单元级别、可重构单元阵列级别和可重构核心级别三级;步骤S103,将可重构处理器单元中的配置信息分为配置信息第零层、第一层和第■~ 层 ^^^■层。可重构处理器单元RPU (Reconfigurable Processing unit)通过配置流控制数据流的传输、计算和存储,配置流和数据流具有并发性,RPU框图请详见图2,具体的,所述可重构处理器单元包括配置信息接口模块、配置流控制器、数据流控制模块和计算控制模块,其中配置信息接口模块Configuration Interface(CI)完成配置信息的初始化、配置流控制器Context Flow Controller实现配置流的控制,数据流控制模块Data Flow Controller和计算控制模块Computing Controller完成数据流的传输、计算和存储,通过多个RPU并行处理可提高动态可重构阵列处理器的性能,Exchange Interface(EI)可用来4进行RPU间的数据交换。RPU中的数据流可分为可重构处理器单元级别RPU level、可重构单元阵列级别 RCA(Reconfigurable cell array) level和可重构核心级别Core level三级,数据流框图详见图3,各级功能如下1)RPU 包含了 REDL、REDS、REDA、RIDL、MB 和 RCA 等部分,在 RPU 内通过多个 RCA 并行处理来提高RPU的性能,各部分的功能如下①REDL 将RPU的数据传输给RCA ; ②REDS 将RCA的数据传输给RPU ;③REDA 仲裁 REDL 和 REDS 的 EMI (External Memory Interface)访问请求,优先完成REDS,EMI为外部存储器提供读写接口 ;④RIDL和MB 实现RCA/Core间的数据交换;2) RCA包含了 CEDL、CIDL、CDS和Core等部分,各部分的功能如下①CEDL 实现RCA内的数据传输或将RCA的数据传输给Core ;②CIDL 将RCA的数据传输给Core ;③⑶S 实现Core内的数据传输、将Core的数据传输给RCA、或将Core的数据传输给RPU ;3) Core负责RC(Reconfigurable cell)阵列的数据输入、core计算和结果输出。RPU中的配置信息分为配置信息第零层CL0、配置信息第一层CLl和配置信息第二层CL2三层,CLl和CL2配置信息以某种文件格式存在,RPU每次执行新的算法(如H. 264) 前需要先通过CI初始化RPU内部存储器GCGM(存储CLl层的配置信息,每套配置信息称为 context group, CLl层配置信息可包含多套context group)、GCCM(存储CL2层的配置信息,每套配置信息称为core context,CL2层配置信息可包含多套core context),CLO层的配置信息由主控ARM产生,通过CI实现对RPU的配置,配置流框图详见图4,配置信息的层次关系及存储位置详见图5。各层配置信息功能如下DCLO层配置信息用于控制RPU和RCA之间的数据流传输,并指定了要调用的 context group在整个CLl配置信息中的索引,CLO配置信息包含包头、配置字、REDL配置信息和REDS配置信息等部分,各部分的功能如下①包头标识了 CLO配置信息对应的RCA的本文档来自技高网...

【技术保护点】
1.一种动态可重构阵列处理器的构令流工作方法,其特征在于,所述方法包括:可重构处理器单元通过配置流控制数据流的传输、计算和存储,配置流和数据流具有并发性;将数据流分为可重构处理器单元级别、可重构单元阵列级别和可重构核心级别三级;将可重构处理器单元中的配置信息分为配置信息第零层、第一层和第二层共三层。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘雷波朱敏王延升朱建峰杨军曹鹏时龙兴尹首一魏少军
申请(专利权)人:清华大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1