一种可扩展向量运算簇制造技术

技术编号：5310143 阅读：219 留言：0更新日期：2012-04-11 18:40

一种可扩展向量运算簇，包括向量处理阵列、支持压缩指令的向量译码器、用于存放多种数据类型的局部向量寄存器文件／累加器以及支持行列访问的矩阵寄存器文件，所述向量处理阵列包括２～６４个同构向量处理单元，所述每个向量处理单元拥有独立的局部向量寄存器文件／累加器并共享矩阵寄存器；所述局部向量寄存器文件／累加器和矩阵寄存器文件提供指令操作的数据来源和目的。本发明专利技术具有原理简单、适用范围广、处理效果好、能够有效支持最前沿各类数字信号处理算法等优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术主要涉及到执行大规模并行数据处理的数字信号处理器领域，特指一种可扩展向量运算簇，即一种支持向量压缩指令、内部集成紧耦合扩展功能单元、且向量宽度可配置的可扩展向量运算簇。
技术介绍
当前快速发展的无线通信、视频图像、雷达信号处理应用中，算法对微处理器的性能要求越来越高。针对算法程序中大量数据的并行性，当前数字信号处理器结构在灵活性、功耗和性能方面采取不同的折中策略，提出了各种解决方案。如流处理器，阵列处理器，向量处理器等。单指令流多数据流(SIMD)流处理器的代表Imagine，内部包含了 8个算术簇，具有较强的计算能力，但在SIMD簇数目、功能部件类型设置、数据通路等方面，未针对数字信号处理领域进行专门优化，且包含了大量对浮点运算的支持，功耗显得过高。阵列处理器集成了大量运算阵列，同样提供了强大的运算潜力，但在算法并行分解，算法映射和数据流优化上难度较大。向量处理器集成向量运算簇，以SIMD 的方式在每始终周期同时对多组源操作数进行处理，能够在低频下提供强的运算能力，缺点是增加向量运算簇的宽度，使得处理器中的数据流数目增多，能够利用硬件资源实现大的数据处理量。但若并行性不足够大，小宽度的向量操作会导致硬件利用率低。另，针对数字信号处理算法中涉及的各类运算，除基础运算外，涉及各类复杂运算类型，诸如复数运算，矩阵运算，除法运算，高精度浮点运算等，若用基础运算结构支持，需反复占用大量的处理器资源，且编码长度较大，需使用通用指令的较长序列计算特定任务的必要结果。为此，对于运算结构，已有研究广泛采用了集成专用增强型指令集合，...

【技术保护点】
一种可扩展向量运算簇，其特征在于：包括向量处理阵列（１０１）、支持压缩指令的向量译码器（１０４）、用于存放多种数据类型的局部向量寄存器文件／累加器（１０５）以及支持行列访问的矩阵寄存器文件（１０６），所述向量处理阵列（１０１）包括２～６４个同构向量处理单元（１０３），所述每个向量处理单元（１０３）拥有独立的局部向量寄存器文件／累加器（１０５）并共享矩阵寄存器文件（１０６）；所述局部向量寄存器文件／累加器（１０５）和矩阵寄存器文件（１０６）提供指令操作的数据来源和目的。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈书明，杨惠，万江华，刘衡竹，郭阳，孙永节，刘宗林，龚国辉，鲁建壮，许邦建，刘蓬侠，
申请(专利权)人：中国人民解放军国防科学技术大学，
类型：发明
国别省市：43

全部详细技术资料下载我是这个专利的主人