支持复数运算和子字并行的６４位定浮点乘法器制造技术

技术编号：3984667 阅读：245 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种支持复数运算和子字并行的６４位定浮点乘法器，该乘法器由四个３２位乘法器组合而成，其中每个３２位乘法器均包含一个作为输出的“进位”串和一个作为输出的“和”串，四个３２位乘法器共包含四个“进位”串和四个“和”串，该四个“进位”串和该四个“和”串通过一个８－２压缩器进行压缩，得到一个新的“进位”串和一个新的“和”串，然后求和作为该乘法器的输出。利用本发明专利技术，降低了关键通路延时，减小了运算资源开销。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及高性能数字信号处理器
，尤其涉及一种支持复数运算和子字并行(Single Instruction Multiple Data, SIMD)的 64 位定浮点乘法器。
技术介绍
在数字信号处理算法中(如FFT，FIR滤波，矩阵矢量点积等)，乘法运算均占据很大的比例。因此，对乘法器的算法和结构进行优化设计，成为提高处理器性能的关键。不同的数字信号处理领域对乘法运算有不同的需求，在通信处理领域，多采用8 位或者16位的定点数据；在影像和雷达信号处理领域，多采用单精度浮点甚至双精度浮点数据。同时，大量数字信号处理算法，如FFT等，均需要进行复数运算。为了保证数字信号处理器在不同处理领域的适用性，需要乘法器能够支持不同数据长度的定点运算、单精度和双精度的浮点运算以及复数运算。对于不同数据长度的运算，如果统一采用定长数据表示方式，则对于任何精度的运算过程，处理器的运算能力都受到最大精度运算能力的限制。因此，人们研究出了大量的增加操作并行性的硬件结构，以增加对低精度运算的并行操作支持。这些技术的共同特点是，将多个低精度操作数打包成一个整字送到运算单元进行并行的多个低精度的同质运算，使运算单元既能支持高精度的整字运算又能增加低精度计算的并行性。这种并行性增强方式，对取指令发送以及数据寄存器的维护没有任何影响，是在不改变体系结构的前提下最有效的增加处理器运算能力的方式，目前业界将这种并行性增强方式称为子字并行结构。复数乘法运算，需要完成四个乘法运算和2个加法运算，普通的数字信号处理器可能需要6个时钟周期才能完成复数乘法。然而如果乘...

【技术保护点】
一种支持复数运算和子字并行的６４位定浮点乘法器，其特征在于，该乘法器由四个３２位乘法器组合而成，其中每个３２位乘法器均包含一个作为输出的“进位”串和一个作为输出的“和”串，四个３２位乘法器共包含四个“进位”串和四个“和”串，该四个“进位”串和该四个“和”串通过一个８－２压缩器进行压缩，得到一个新的“进位”串和一个新的“和”串，然后求和作为该乘法器的输出。

【技术特征摘要】

【专利技术属性】
技术研发人员：王东琳，张志伟，尹志刚，林啸，谢少林，闫寒，薛晓军，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人