一种嵌入式并行计算系统及采用其的并行计算方法技术方案

技术编号:12308483 阅读:91 留言:0更新日期:2015-11-11 17:35
本发明专利技术公开了一种嵌入式并行计算系统及采用其的并行计算方法,所述系统包括一个数据输入模块、多个完全相同的机箱和一个数据输出模块;每一个所述机箱包括两个交换模块、多个计算模块、一个底板和一个电源管理模块;每一个所述交换模块包括一个光纤转换器、一个SRIO交换芯片和一个GbE交换芯片,每一个所述计算模块包括两片多核DSP、一个SRIO交换芯片和一个FPGA。通过本发明专利技术,能够提供一种运算能力强、高可靠、模块化、可扩展、小型化、低功耗、高带宽的嵌入式并行计算系统,并且该系统能够自动均衡分配计算资源,并提供标准的并行计算程序接口。

【技术实现步骤摘要】

本专利技术涉及数据处理
,具体涉及。
技术介绍
目前,在嵌入式计算领域,尤其是空间星船载计算系统方面,多采用FPGA加单片单核DSP的结构,其单位时间的运算能力较低,很难满足数据量日益增大,算法复杂度日益提尚的需求。在一些通信或雷达领域,有些系统采用多个单核DSP协同处理的结构,但在每个DSP上运行不同的任务,采取任务流水的方式处理数据。这样,对于每一个项目需要根据需求重新划分任务,并且很难将多个不同的任务负载均衡,会导致木桶效应而浪费计算资源。传统的采用任务流水的多DSP系统,一旦某一个DSP出现故障,将导致整个系统的瘫痪。而传统的并行计算系统多采用基于以太网的大型机群系统,体积庞大,功耗高,通信带宽低,很难应用到嵌入式领域。
技术实现思路
本专利技术所要解决的技术问题是提供,能够解决现有技术存在的问题。本专利技术提供了如下方案:基于本专利技术的一个方面,提供了一种嵌入式并行计算系统,所述系统包括一个数据输入模块、多个完全相同的机箱和一个数据输出模块;每一个所述机箱包括两个交换模块、多个计算模块、一个底板和一个电源管理模块;每一个所述交换模块包括一个光纤转换器、一个SR1交换芯片和一个GbE交换芯片,每一个所述计算模块包括两片多核DSP、一个SR1交换芯片和一个FPGA ;每一个所述交换模块中的SR1交换芯片均与每一个所述计算模块中的SR1交换芯片相连,每一个所述交换模块中的GbE交换芯片分别与每一个计算模块中的多核DSP相连,每一个所述交换模块中的GbE交换芯片还与电源管理模块相连,每一个所述交换模块中的光纤转换器与其它机箱或数据输入模块或数据输出模块相连;外部输入接口通过所述数据输入模块向Master输入待处理数据,由Master将所述待处理数据平均分配给可用的slave,每一个slave接收到相应的待处理数据,按照slave的内核数将所述相应的待处理数据平均分配给该slave的内核以便由对应的内核进行相应的执行,且将执行结果返回给Master,由Master将所有slave返回的执行结果合并,并通过数据输出模块经外部输出接口输出,其中,Masetr为所有DSP中的一个,其它的DSP均为slave。基于本专利技术的另一个方面,提供了一种并行计算方法,所述方法包括:S1、外部输入接口通过所述数据输入模块向Master输入待处理数据;S2、Master将所述待处理数据平均分配给可用的slave,每一个slave接收到相应的待处理数据,按照该slave的内核数将所述相应的待处理数据平均分配给该slave的内核以便由对应的内核进行相应的执行,且将执行结果返回给Master ;S3、Master将所有slave返回的执行结果合并,并通过数据输出模块经外部输出接口输出;其中,Masetr为所有DSP中的一个,其它的DSP均为slave。本专利技术提供的,根据待处理数据的运算量选择机箱的数量以及每一个机箱内计算模块的数量,提高整个系统的计算效率,可扩展性强;每个机箱内部包括2个交换模块,可用于组成双星型SIRO网络,可进行内部高速的数据传输,双星型网络不仅提高了通信带宽,而且还增加了冗余度,一旦其中的一个交换模块失效,则双星型SR1网络变为单星型SR1网络可以继续工作;采用多个DSP进行数据的并行计算,提高了数据计算的效率,且每一个DSP计算相同数据量的数据,避免了木桶效应的发生,且每一个DSP为多核DSP,运算能力强;另外,对于失效的DSP,将其断电,降低功耗。【附图说明】图1为本专利技术实施例一的一种嵌入式并行计算系统示意图;图2为本专利技术实施例一中每一个机箱的内部结构示意图;图3为本专利技术实施例二的一种并行计算方法流程图;图4本专利技术实施例二中确定Master的过程流程图。【具体实施方式】以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。实施例一、一种嵌入式并行计算系统。以下结合图1和图2对本实施例提供的系统进行详细说明。参见图1,本实施例提供的所述系统包括一个数据输入模块、多个完全相同的机箱和一个数据输出模块。另外,参见图2,每一个所述机箱包括两个交换模块、多个计算模块、一个底板和一个电源管理模块;每一个所述交换模块包括一个光纤转换器、一个SR1(Serial Rapid I/O)交换芯片和一GbE(Gigabit Ethernet,千兆以太网)交换芯片,每一个所述计算模块包括两片多核DSP(Digital Signal Processing,数字信号处理)、一个SR1交换芯片和一个FPGA (Field Programmable Gate Array,现场可编程逻辑门阵列)。每一个所述交换模块中的SR1交换芯片均与每一个所述计算模块中的SR1交换芯片相连,每一个所述交换模块中的GbE交换芯片分别与每一个计算模块中的多核DSP相连,每一个所述交换模块中的GbE交换芯片还与电源管理模块相连,每一个所述交换模块中的光纤转换器与其它机箱或数据输入模块或数据输出模块相连。具体的,每一个所述交换模块中的SR1交换芯片分别通过I路SR1经过机箱底板与每一个计算模块中的SR1交换芯片相连,所述交换模块中的SR1交换芯片通过2路SR1经过光纤转换器与上行的其它机箱或数据输入模块相连,另通过2路SR1经过光纤转换器与下行的其它机箱或数据输出模块相连。每一个所述交换模块中的GbE交换芯片通过2路GbE与每一个计算模块中的2片DSP相连,另通过I路GbE连接到其它机箱,且通过I路GbE连接到所述电源管理模块。每一个计算模块中的2片DSP均通过一路SR1与该计算模块中的SR1交换芯片相连;所述数据输入模块与所有机箱内的所有DSP中的Master通过SR1接口相连,所述数据输出模块与所述Master通过SR1接口相连。需要说明的是,每一个机箱内设置2个交换模块,用于组成双星型SR1网络,可进行内部高速的数据传输,双星型网络不仅提高了通信带宽,而且还增加了冗余度,一旦其中的一个交换模块失效,则双星型SR1网络变为单星型SR1网络可以继续工作。GbE交换芯片主要用于内部事务管理(比如,所有DSP的心跳判断、计算模块管理、电源管理和主机自动切换等)的总线。每一个计算模块中的FPGA,主要用于DSP的上电顺序管理和外围逻辑的管理。采用本实施例提供的系统进行数据计算的过程为:外部输入接口通过所述数据输入模块向Master输入待处理数据,由Master将所述待处理数据平均分配给可用的slave,每一个slave接收到相应的待处理数据,按照slave的内核数将所述相应的待处理数据平均分配给该slave的内核以便由对应的内核进行相应的执行,且将执行结果返回给Master,由Master将所有slave返回的执行结果合并,并通过数据输出模块经外部输出接口输出,其中,Masetr为所有DSP中的一个,其它的DSP均为slave。其中,所述机箱的数量以及每一个机箱内的计算模块的数量均根据待处理数据的运算量确定,即根据具体的应用需求,选择采用至少I个最多8个机箱互联构成高性能并行计算系统(超过8个机箱会导致并行计算的效率降低,因此采用合适数量的机箱)。每个机箱在包括8个计算模块时的计算能力可达到定点/浮点分别为本文档来自技高网...

【技术保护点】
一种嵌入式并行计算系统,其特征在于,所述系统包括一个数据输入模块、多个完全相同的机箱和一个数据输出模块;每一个所述机箱包括两个交换模块、多个计算模块、一个底板和一个电源管理模块;每一个所述交换模块包括一个光纤转换器、一个SRIO交换芯片和一个GbE交换芯片,每一个所述计算模块包括两片多核DSP、一个SRIO交换芯片和一个FPGA;每一个所述交换模块中的SRIO交换芯片均与每一个所述计算模块中的SRIO交换芯片相连,每一个所述交换模块中的GbE交换芯片分别与每一个计算模块中的多核DSP相连,每一个所述交换模块中的GbE交换芯片还与电源管理模块相连,每一个所述交换模块中的光纤转换器与其它机箱或数据输入模块或数据输出模块相连;外部输入接口通过所述数据输入模块向Master输入待处理数据,由Master将所述待处理数据平均分配给可用的slave,每一个slave接收到相应的待处理数据,按照slave的内核数将所述相应的待处理数据平均分配给该slave的内核以便由对应的内核进行相应的执行,且将执行结果返回给Master,由Master将所有slave返回的执行结果合并,并通过数据输出模块经外部输出接口输出,其中,Masetr为所有DSP中的一个,其它的DSP均为slave。...

【技术特征摘要】

【专利技术属性】
技术研发人员:徐明道栾丽林巍刁奇宋磊刘建文
申请(专利权)人:山东华宇航天空间技术有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1