当前位置: 首页 > 专利查询>浙江大学专利>正文

基于网络的自适应可重构处理单元阵列系统加速的方法技术方案

技术编号:3859169 阅读:171 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于网络的自适应可重构处理单元阵列系统加速的方法。是通过通用处理器和可重构设备组成的计算节点,组成一个自适应可重构处理单元网络。要执行的程序被划分成可以独立运行的任务的集合,任务集合中的每一个任务通过自适应可重构处理单元网络进行分发,找到合适的计算资源执行,并利用可重构设备的高效和灵活的特性,进行重构,使可重构设备的功能满足不同任务的需要。在自适应可重构处理单元网络的作用下,基于网络的自适应可重构处理单元阵列系统会根据网络上节点的情况,对任务进行智能分配,优先将任务分配到其他计算资源处于空闲的节点,从而减少程序的执行时间,提高可重构设备的利用率,达到程序加速的目的。

【技术实现步骤摘要】

本专利技术涉及多核
和可重构
,特别是涉及一种基于网络通信 的可重构多核加速程序执行的实现方法。
技术介绍
随着计算机制造工艺水平的不断提高,超大规模集成电路技术取得长足进 步,多核技术已经成为现行主流的处理器技术。但是随着处理器核的数量的不 断增多,如何提高这些核的利用率成为了一个难题。由于一般应用程序的并行度不髙,通常认为处理器通用核的数目超过16个 后,增加通用处理核的数目就难以带来性能的提升。在异构多核处理器中,可以集成一些为特别任务专门定制的专用核,从而能 达到定制应用的高性能,但是这种定制异构多核处理器只有在运行所面向的应 用时才能获得好的性能,否则性能不通用处理核更低。可重构技术的出现,使得通用处理器集成基于FPGA的可重构核提供了另一 种解决方案。在保留通用处理器适应多数应用的高灵活性的同时,获得了专用 处理器的高性能和高效率。同时,可重构核可以通过重配置来支持各种不同类 型的应用,从而能更加灵活地应用于各种不同的程序。但是一个孤立节点没有足够的能力和灵活性去处理有些应用程序。可重构资源不足当应用程序所需要的可重构资源超过了一个孤立节点所 拥有的,在这种情况下,应用程序的一些请求必需被挂起,直到被占用的可重 构资源被释放并且重新配置后才能继续进行,这样一来便降低了性能和效率。可重构资源的浪费当应用程序不适合可重构设备,那么节点的可重构资源 就被闲置浪费。频繁重配置的高代价当应用程序频繁地调用的功能模块不能在可重构设备 上同时提供,这需要频繁地将可重构设备上的功能模块进行切换,导致频繁的 重配置,从而使得性能和效率下降。 专利
技术实现思路
本专利技术的目的在于提供一种基于网络的自适应可重构处理单元阵列加速方法。本专利技术解决其技术问题采用的技术方案如下1) 原始程序的任务划分系统将一个程序分割为能独立运行的任务的集合;2) 搭建基于宏网络的自适应可重构处理单元阵列基于网络的自适应可重构处理单元阵列由n个节点组成,ne [1, 2, 3...), 每个节点有0-4个通过以太网直接相连接的邻居节点,每个节点由两部分组成, 第一部分是一台通用计算机,第二部分是可重构设备NetFPGA;根据要在可重构设备上执行的任务,初始化可重构设备; 3)任务的分发对于任何一个基于宏网络的自适应可重构处理单元阵列中的节点来说,自 己为本地节点,其余节点为远程节点;任务的分发,就是将程序中的任务集合中的任务分发给本地节点的计算资 源和远程节点的计算资源;4) 可重构设备功能的改变对于n个节点中任意一个节点的可重构设备来说,如果可重构设备资源空 闲,并且分配到的任务所需要的逻辑功能模块是当前自己不具备的,那么可重 构设备需要重新配置功能模块;5) 任务的执行在任务分配之后执行任务,并在任务执行结束后返回执行结果。 所述的搭建基于网络的自适应可重构置处理单元阵列步骤如下1) 所搭建的自适应的可重构处理单元阵列是基于100Mb或1000Mb传输速 率的高速局域网络;2) 所搭建的自适应的可重构处理单元阵列由n个节点组成,ne [1, 2, 3...), 其中每一个节点由两部分组成,第一部分是一台通用计算机,第二部分是可重 构设备;3) 可重构设备NetFPGA具有4个以太网接口,所以一个节点的可重构设备 可以和最多四个其他的节点通过高速局域网络直接连接,进行通信,直接连接 的节点称为邻居节点,节点可以通过邻居节点和非邻居节点进行通信;4) 一个节点的两个部分通用计算机和可重构设备的连接方式是通过外设组 件互连标准PCI接口连接;5) 定制可重构设备上的控制模块S叩erBlock;6) 初始化可重构设备上的功能模块。 所述的可重构设备功能的改变步骤如下1) 在整个基于网络的自适应可重构处理单元阵列系统开始工作之前,根据 要在可重构设备上运行的任务,生成对可重构设备的配置本件;2) 在系统开始工作之后,随着任务的动态分配,当n个节点中任意一个节 点的可重构设备要运行的任务所要求的逻辑功能块在可重构设备上不具备,则 可重构设备向自己节点的主机发出重配置的请求;3) 在主机收到自己节点的可重构设备发送的重配置请求后,主机调用程序 重配置自己节点的可重构设备。所述的定制可重构设备上的控制模块S叩erBlock担任n个节点中任意一个 节点内部可重构设备和通用计算机的通信控制器的功能;担任n个节点中任意 一个节点的可重构设备与邻居节点可重构设备之间的通信控制器的功能;对于 在系统运行过程中,可重构设备所接收的任务分配进行管理,对任务进行处理, 并记录任务所处的状态。本专利技术与
技术介绍
相比,具有的有益的效果是本专利技术是基于网络通信的可重构多核加速程序执行的方法,其主要功能是 利用可重构设备加强通用处理器的计算能力,加速特定功能模块的执行。利用 网络的通讯,寻找网络上空闲的计算资源, 一方面能缓解计算资源不够的节点 的压力,另一方面又能提高整个网络上所有节点的资源利用率。(1) 自适应性系统会根据网络上节点的情况,对任务进行智能分配。繁 忙节点等待资源的任务会向空闲节点分配。(2) 高效性由于系统会根据网络上节点的情况进行任务的智能,所以能利用网络中空闲的资源,从而提高应用程序的性能和效率。经过实验的证明,系统能有效地提高性能。附图说明图1是本专利技术的一个实例的系统构成图。图2是由系统中的一个节点,由一台通用计算机和一块或多块可重构设备组 成,两个组成部分之间用PCI连接。图3是流程图,表明按照本专利技术的任务分发的流程。 具体实施例方式方法中涉及到相关的符号解释.-Cl:能在可重构设备上运行;C2:本地节点通用处理器空闲;C3:本地节点可重构设备空闲;C4:存在邻居节点可重构设备空闲;基于网络的自适应可重构处理单元阵列加速系统的具体实现流程如下。 第一步原始程序的任务化h系统将一个程序分割为可独立运行的任务的两个集合UM, {B}},集合A 表示不能够在可重构设备上运行的任务,集合B表示不能在可重构设备上运行 的任务。2:根据任务之间的依赖关系,生成任务间的依赖关系表。 第二步搭建基于网络的自适应可重配置处理单元阵列如图1所示,所搭建的自适应的可重构处理单元阵列是基于100Mb或1000Mb传输速率的高速局域网络。所搭建的自适应的可重构处理单元阵列由n个节点组成,nG [1, 2, 3...),其中每一个节点由两部分组成,第一部分是一台通用计算机,第二部分是可重 构设备。如图2所示, 一个节点的两个部分通用计算机和可重构设备的连接方式是 通过外设组件互连标准PCI接口连接。可重构设备NetFPGA具有4个以太网接口, 一个节点可以和最多四个其他 的节点通过高速局域网络直接连接,进行通信,直接连接的节点称为邻居节点, 节点可以通过邻居节点和非邻居节点进行通信。定制可重构设备上的控制模块SuperBlock,也就是编写逻辑功能模块,这 个逻辑功能模块负责节点内部可重构设备和通用计算机的通信,节点的可重构 设备与邻居节点可重构设备之间的通信,对于在系统运行过程中,可重构设备 所接收的任务分配进行管理,对任务进行处理,并记录任务所处的状态。这个 控制模块S叩erBlock是固定在可重构设备上的,在可重构设备进行重配置的时 候,这个控制模块本文档来自技高网
...

【技术保护点】
一种基于网络的自适应可重构处理单元阵列系统加速的方法,其特征在于: 1)原始程序的任务划分: 系统将一个程序分割为能独立运行的任务的集合; 2)搭建基于宏网络的自适应可重构处理单元阵列: 基于网络的自适应可重构处理单 元阵列由n个节点组成,n∈[1,2,3…),每个节点有0-4个通过以太网直接相连接的邻居节点,每个节点由两部分组成,第一部分是一台通用计算机,第二部分是可重构设备NetFPGA; 根据要在可重构设备上执行的任务,初始化可重构设备;   3)任务的分发: 对于任何一个基于宏网络的自适应可重构处理单元阵列中的节点来说,自己为本地节点,其余节点为远程节点; 任务的分发,就是将程序中的任务集合中的任务分发给本地节点的计算资源和远程节点的计算资源; 4)可重构 设备功能的改变: 对于n个节点中任意一个节点的可重构设备来说,如果可重构设备资源空闲,并且分配到的任务所需要的逻辑功能模块是当前自己不具备的,那么可重构设备需要重新配置功能模块; 5)任务的执行: 在任务分配之后执行任务, 并在任务执行结束后返回执行结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:胡威吴斌斌冯德贵王超曹满马建良陈度王罡施青松陈天洲
申请(专利权)人:浙江大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1