当前位置: 首页 > 专利查询>东南大学专利>正文

基于大规模粗粒度嵌入式可重构系统及其处理方法技术方案

技术编号:10305279 阅读:155 留言:0更新日期:2014-08-08 02:26
本发明专利技术公开了一种基于大规模粗粒度嵌入式可重构系统及其处理方法,其包括:系统总线、配置总线、嵌入式微处理器、数据存储器、可重构处理器、重构控制器、中断控制器和直接存储器访问控制器。该方法针对常用的矩阵求逆算法,在可重构处理器中设计了4个特殊的可重构阵列和一个片上数据传输单元,通过将矩阵求逆算法映射到包含多个基本运算的可重构阵列上,提高运算并行度,从而提升运算效率。同时,通过片上数据传输网络优化了阵列间的数据交换。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,其包括:系统总线、配置总线、嵌入式微处理器、数据存储器、可重构处理器、重构控制器、中断控制器和直接存储器访问控制器。该方法针对常用的矩阵求逆算法,在可重构处理器中设计了4个特殊的可重构阵列和一个片上数据传输单元,通过将矩阵求逆算法映射到包含多个基本运算的可重构阵列上,提高运算并行度,从而提升运算效率。同时,通过片上数据传输网络优化了阵列间的数据交换。【专利说明】
本专利技术涉及嵌入式可重构系统领域,尤其涉及一种应用于雷达、通信等领域的。
技术介绍
通用处理器和专用集成电路(ASIC) —直以来都是两种主要的计算模式。随着对计算效率的要求不断提高,一种兼顾通用处理器灵活性和专用集成电路高效性的可重构计算技术开始进入人们眼帘。可重构计算技术通过对运算单元的配置,能够将某一算法转换为数据流的形式,提高运算效率。这里提到的大规模粗粒度动态可重构处理器就是一种基于可重构计算技术的片上系统芯片。在雷达、数字通信、多媒体处理等应用场合中,矩阵求逆算法经常会被用到。如今对数据量和处理速度的要求日益增长,常用的方案已逐渐跟不上时代的需要,逐渐成为整个系统的性能瓶颈。矩阵求逆的实现通常使用数字信号处理芯片(DSP)和现场可编程门阵列(FPGA)两种芯片方案。其中数字信号处理芯片是通用处理器,在计算过程中需要先读取指令,然后取出数据进行相应的处理。相比较与可重构处理器,这样的过程不仅增加了读取指令的时间,而且无法进行并行计算,导致性能低下。现场可编程门阵列虽然同样拥有高效的运算速度,但缺乏灵活性,设计完成后无法继续完成其他算法的计算。目前国内外已设计多种可重构系统用于矩阵运算,能够有效地完成矩阵加减法、矩阵乘法、三角矩阵求逆等运算,但是并没有针对矩阵求逆运算进行优化,在运算过程中将产生许多流水气泡,影响运算效率。同时,大部分已有的可重构系统只能完成4阶以下的矩阵运算,对于大规模矩阵只能通过矩阵分解来完成矩阵求逆运算,这将大大降低运算效率。本专利技术可以直接进行最高48阶矩阵求逆,提高并行度,并且合理规划数据流,减少流水气泡,加快运算速度。
技术实现思路
有鉴于此,本专利技术针对现有技术中的一种或多种不足,提出了一种,其能够通过配置操作实现不同算法的运算,还能够将矩阵求逆的运算转换为数据流,通过对流水线的优化和完善的数据预取操作,兼具高效性和灵活性,能显著提高高阶矩阵求逆的运算效率。本专利技术提出了一种基于大规模粗粒度嵌入式可重构系统,其包括:系统总线、配置总线、嵌入式微处理器、数据存储器、可重构处理器、重构控制器、中断控制器和直接存储器访问控制器;可重构处理器,用于映射高阶矩阵求逆数据,其中,所述高阶矩阵求逆数据是根据数据流图确定的流程和矩阵求逆输入数据不断更新的特点确定的,而所述数据流图是根据分析矩阵求逆,将其算法各步骤的运算转换得到的;直接存储器访问控制器,其将配置信息以及所需用到的初始数据存入相应数据存储器中;嵌入式微处理器,通过对其进行设置,启动所述重构控制器,将所述配置信息从所述配置总线发送到所述可重构处理器;可重构处理器,通过控制其任务的执行,当所述可重构处理器完成当前任务后,发送中断信号给所述嵌入式微处理器;系统总线,用于连接可重构系统中的各个功能部件,包括嵌入式微处理器、数据存储器、可重构处理器、重构控制器、中断控制器和直接存储器访问控制器,以构成一个完整的嵌入式可重构系统。系统总线对于所有连接到其上的功能部件,都支持双向的数据访问。通过系统总线,嵌入式微处理器可以访问并控制系统中各个功能部件的工作状态,或从数据存储器中读取所需的指令和数据信息;此外,可重构处理器和直接存储器访问控制器也可以通过系统总线访问数据存储器,读取或写入所需的数据信息;配置总线,用于可重构处理器和重构控制器;其中,重构控制器在嵌入式微处理器的控制下,动态生成配置信息,并将这些配置信息通过配置总线依次发送到可重构处理器,从而实现可重构处理器功能的动态配置。配置总线仅支持单向的数据传输功能,其中,重构控制器将配置信息单向写入到配置总线上,然后配置总线将这些配置信息单向地发送到可重构处理器;中断控制器,用于系统中各个功能部件之间的系统同步设置;其中,中断输入源包括直接存储器访问控制器和可重构处理器。当直接存储器访存控制器完成一次数据搬运时,将通过中断控制器向嵌入式微处理器发起一次中断请求,以完成后续的功能;当可重构处理器完成一套或多套配置所对应的计算任务时,也将通过中断控制器向嵌入式微处理器发起一次中断请求,以通知嵌入式微处理器启动重构控制器,发出下一套或多套的配置信息;数据存储器,用于存储本系统运行过程中所需的指令和数据信息。优选地,所述可重构处理器由4个可重构阵列、I个片上数据传输单元、4个可重构阵列配置寄存器、I个片上数据传输单元配置寄存器堆、I个配置信息访问接口、I个外存访问接口构成;4个可重构阵列间通过一个共享的所述片上数据传输单元实现运算过程中中间结果的存储和传递;所述可重构阵列配置寄存器堆的编号为可重构阵列配置寄存器堆#0-#3,分别用于对应可重构阵列#0-#3的功能配置;所述片上数据传输单元配置寄存器堆用于片上数据传输单元的功能配置。优选地,所述可重构阵列包括由8个除法器构成的1*8 —维除法阵列,48个基本运算单元构成的6*8 二维乘加基本计算阵列,其包括15个加法器、I个乘法器和I个累加器构成的倒三角累加阵列;除法阵列包含的8个除法器为流水关系。优选地,所述基本运算阵列包含的6*8个基本运算单元可实现乘法运算、移位加减法、逻辑运算;其包括:分成6行的倒三角累加阵列,第一行有8个加法器,第二行有4个加法器,第三行有2个加法器,第四行有I个加法器,第五行有I个累加器,第六行有I个乘法器;所述除法阵列与所述基本运算阵列间通过两组寄存器分两个周期节拍完成两个阵列间的数据传递;所述基本运算阵列最后四行的基本运算单元与倒三角累加阵列直接相连,完成这两个阵列间的数据传递;所述基本运算阵列中的每个基本运算单元都附带一个寄存器,用于暂存下一步计算所需的数据。优选地,所述片上数据传输单元包括4个共享存储单元,I个外存访问接口和I个控制模块;其中,所述共享存储单元用于存储所述4个可重构阵列计算时共同使用到的数据;所述外存访问接口用于实现共用存储模块与外部存储器之间的数据交互;所述控制模块用于控制所述4个可重构阵列对所述4个共享存储单元的读写,以及所述外存访问接口对所述外部存储器的访问。优选地,矩阵求逆可分为LU分解、三角矩阵求逆、矩阵相乘三个步骤,每个步骤都有对应的映射方式#阶矩阵的LU分解采取高斯消元法,需要进行(1+2+…+ (N-1))次消元运算,一次消元运算即除法阵列从向量a、b获得除数、被除数完成除法运算,二维乘加运算阵列将除法阵列得到的结果与向量a中每一个元素相乘,然后后将得到的新向量与向量b相减,得到最终结果;N阶三角矩阵的求逆需要进行(1+2+…+ (N-1))次运算,一次运算包括一次向量乘法运算和一次乘法预算,一次运算即二维乘加运算阵列将向量a、b的所有元素两两相乘,然后倒三角累加阵列完成累加计算并与当前行的对角线元素相乘,得到最终结果;N阶矩阵相乘需要完成N*N次向量乘法,一次向量乘法本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410241289.html" title="基于大规模粗粒度嵌入式可重构系统及其处理方法原文来自X技术">基于大规模粗粒度嵌入式可重构系统及其处理方法</a>

【技术保护点】
一种基于大规模粗粒度嵌入式可重构系统,其包括:系统总线、嵌入式微处理器、数据存储器、可重构处理器、重构控制器、中断控制器和直接存储器访问控制器;可重构处理器,用于映射高阶矩阵求逆数据,其中,所述高阶矩阵求逆数据是根据数据流图确定的流程和矩阵求逆输入数据不断更新的特点确定的,而所述数据流图是根据分析矩阵求逆,将其算法各步骤的运算转换得到的;直接存储器访问控制器,其将配置信息以及所需用到的初始数据存入相应数据存储器中;嵌入式处理器,通过对其进行设置,启动所述重构控制器,将所述配置信息从所述配置总线发送到所述可重构处理器;可重构处理器,通过控制其任务的执行,当所述可重构处理器完成当前任务后,发送中断信号给所述嵌入式微处理器;中断控制器,用于系统中各个功能部件之间的系统同步设置。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘波朱婉瑜刘杨曹鹏汪芮合杨苗苗
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1