一种算法加速的软硬件协同设计方法技术

技术编号：4935022 阅读：226 留言：0更新日期：2012-04-11 18:40

本发明专利技术是一种算法加速的软硬件协同设计方法，该方法有六个步骤：步骤一：算法和软件静态分析；步骤二：使用软件分析工具对软件运行进行动态实测分析，获得软件运行基本数据图；步骤三：结合系统要求、算法分析和软件实测分析数据，作出多核硬件系统的总体结构和功能设计；步骤四：用合适的建模工具（ＲＭＬ）描述系统整体；步骤五：在步骤二基础上构造函数过程抽象图Ｇ↓［ＣＧ］（包含运行时间参数的函数调用图），以此为对象讨论软件在这种多核系统中的分布；步骤六：按步骤五所得方案进行原型系统的软硬件实现，对实现的结果进行评估。该方法具有良好兼容性，适应于多核片上系统（ＳＯＣ）设计的迫切要求，促进多核设计工具的完善。它有很好的实用价值和应用前景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种设计方法，尤其涉及。它是基于硬件原型演化的网络安全RSA算法，属于集成电路、片上系统(SOC)、嵌入式系统设计
(二)
技术介绍
软硬件协同设计不仅是一种设计技术，同时也是一种新的设计方法学，其核心问题是协调软件子系统和硬件子系统。软硬件协同设计的定义至今仍没有完全一致的表述，主要有以下几种大卫.W .弗兰克(David W.Franke)与马丁 ■ K .帕维斯(Martin K. Purvis ) 认为软硬件协同设计是一种在设计过程的最初阶段就将软件与硬件两个方面结合起来考虑，以获得设计的灵活性与功能的有效分配的一种设计方法，有时简称为协同设计。乔瓦尼.德米切(Giovanni De Micheli)认为软硬件协同设计是指通综上所述，可以认为软硬件协同设计是一种在设计的最初阶段就将软件与硬件两方面结合起来权衡功能的分配，在软件与硬件的并行设计过程中实现软硬件的交互，以满足系统的功能与性能要求的设计方法。片上系统(SOC)设计技术始于20世纪90年代中期，它是一种系统级的设计技术。关于片上系统(SOC)目前还没有统一的定义，部分专家认为片上系统(SOC)是一种复杂的集成电路，它将终端产品的主要功能单元完全集成在单个芯片或芯片组中。通常片上系统(SOC)包括一个可编程处理器、片上存储器和硬件实现的加速功能单元，片上系统(SOC)作为一个系统需要直接与外部世界打交道，因此它一般还包括模拟部件以及数模混合部件，未来它还可能会将光微电子机械系统(0/MEMS )部件集成在一起；有的专家则将片上系统 (SOC...

【技术保护点】
一种算法加速的软硬件协同设计方法，其特征在于：该方法具体步骤如下：　步骤一：算法和软件静态分析；算法数学原理可用Ｍａｔｌａｂ等软件实现验证，然后转化为Ｃ语言等可运行语言在ｐｃ机或专用目标硬件平台即嵌入式设备上实现；　步骤二：使用软件分析工具对软件运行进行动态实测分析，获得软件运行基本数据图，该步骤需要的软件工具有生成函数调用图的ＩＢＭ公司Ｒａｔｉｏｎａｌ套件中的ｑｕａｎｔｉｆｙ软件；生成函数运行时间和访问次数的ｐｒｏｆｉｌｅ剖析软件，如Ｗｉｎｄｏｗｓ环境Ｖｉｓｕａｌ　Ｃ下的ＶＣ　ｐｒｏｆｉｌｅ、Ｌｉｎｕｘ环境下的ＧＤＢ以及相应嵌入式开发环境下的剖析工具；　步骤三：结合系统要求、算法分析和软件实测分析数据，作出多核硬件系统的总体结构和功能设计，该步骤要结合硬件设计经验，对系统功能进行粗粒度细化分割，对有必要独立的任务设计由单独的以处理器为中心模块担当，对这些模块分别用演化方法进行设计，再讨论接口基础上的信息交流，对具有信息安全特性的ＲＳＡ加速本设计来说，协处理模块具有独立的数据存储空间，与主处理器即ＭＰ内存空间实现硬件隔离，是防止主存空间非法地...

【技术特征摘要】
1、一种算法加速的软硬件协同设计方法，其特征在于该方法具体步骤如下步骤一算法和软件静态分析 id=icf0001 file=A2009100766930002C1.tif wi=2 he=5 top= 44 left = 91 img-content=drawing img-format=tif orientation=portrait inline=yes/>算法数学原理可用Matlab等软件实现验证，然后转化为C语言等可运行语言在pc机或专用目标硬件平台即嵌入式设备上实现；步骤二使用软件分析工具对软件运行进行动态实测分析，获得软件运行基本数据图 id=icf0002 file=A2009100766930002C2.tif wi=2 he=2 top= 78 left = 42 img-content=drawing img-format=tif orientation=portrait inline=yes/>该步骤需要的软件工具有生成函数调用图的IBM公司Rational套件中的quantify软件；生成函数运行时间和访问次数的profile剖析软件，如Windows环境Visual C下的VC profile、Linux环境下的GDB以及相应嵌入式开发环境下的剖析工具；步骤三结合系统要求、算法分析和软件实测分析数据，作出多核硬件系统的总体结构和功能设计 id=icf0003 file=A2009100766930002C3.tif wi=2 he=3 top= 117 left = 73 img-content=drawing img-format=tif orientation=portrait inline=yes/>该步骤要结合硬件设计经验，对系统功能进行粗粒度细化分割，对有必要独立的任务设计由单独的以处理器为中心模块担当 id=icf0004 file=A2009100766930002C4.tif wi=2 he=1 top= 126 left = 178 img-content=drawing img-format=tif orientation=portrait inline=yes/>对这些模块分别用演化方法进行设计，再讨论接口基础上的信息交流 id=icf0005 file=A2009100766930002C5.tif wi=2 he=2 top= 134 left = 163 img-content=drawing img-format=tif orientation=portrait inline=yes/>对具有信息安全特性的RSA加速本设计来说，协处理模块具有独立的数据存储空间，与主处理器即MP内存空间实现硬件隔离，是防止主存空间非法地址操作导致敏感信息泄漏的根本性措施，所以只用设计一个专属的CPM协处理模块；步骤四用建模工具描述系统整体，该步骤推荐采用对软件元素进行硬件化扩展的统一建模语言即UML；任一计算系统都必然具有通用的硬件处理平台，软硬件协同主要是指的软件与替代软件功能的专用硬件模块之间的交互协同，对应到统一建模语言UML中也就是首要在对象图这一层进行讨论和设计 id=icf0006 file=A2009100766930002C6.tif wi=1 he=2 top= 191 left = 175 img-content=drawing img-format=tif orientation=portrait inline=yes/>至于类图class diagram，类是面向对象理论的精华，其核心是用软件的数据结构对物理实体进行抽象和封装，以实现可继承性；步骤五在步骤二基础上构造函数过程抽象图GCG，包含运行时间参数的函数调用图，以此为对象讨论软件在这种多核系统中的分布；把所研究程序段中所有函数抽象为GCG中一个个执行的节点，F即是所研究程序段中所有这种函数节点的集合，V是运行期中所有被访问的全局变量的集合，E是GCG中代表函数直接调用的单向边的集合，E′是GCG中代表某函数访问某间接前驱函数数据结构的单向边的集合，E″是GCG中代表函数访问全局变量过程单向边的集合，所以可得GCG其元素集合为(F+V，E+E′+E″)；对每一个v∈F，cycM(v)和cycC(v)分别代表函数在主处理器M和协处理模块CPM上执行的周期数，count(v)代表v被调用的次数；通信调用过程实际的处理器耗用周期，通过传输的字节长度乘上一个经验参数α获得；对每个e∈(E∪E′)，传输的字节数为<maths id=math0001 num=0001 ><math><![CDATA[ <mrow><mi>wt</mi><mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo></mrow><mo>=</mo><msubsup> <mi>Σ</mi> <mrow><mi>i</mi><mo>=</mo><mn>0</mn> </mrow> <mrow><mi>i</mi><mo>=</mo><msub> <mi>e</mi> <mi>N</mi></msub> </mrow></msubsup><msub> <mi>ac</mi> <mi>i</mi></msub><mo>*</mo><msub> <mi>sz</mi> <mi>i</mi></msub><mo>,</mo> </mrow>]]></math> id=icf0007 file=A2009100766930003C1.tif wi=13 he=4 top= 53 left = 153 img-content=drawing img-format=tif orientation=portrait inline=yes/></maths>其中eN＝在e上被复制参数的个数，aci＝参数i的访问次数，szi＝参数i的长度；对每个e(n，q)∈(E″)，传输的字节数为wt(e)＝ace(n)*sz(n)，其中ace(n)＝全局变量n的访问次数，sz(n)＝n的字节长度，然后，构造一个数组sol[i]，下标i对应GCG中相应标号节点(F或V)，数组元素soli取值范围为0或者1，如果该节点在主处理器(MP)进行运算对数组元素soli赋值为0，如果该节点在CPM运算对数组元素soli赋值为1；因此，数组sol[i]的一个二进制排列组合，即可看作对此段程序在两个处理器间的一种分布方案的对应；设fnM为分配在主处理器(MP)上处理的函数的集合，fnC为分配在协处理模块CPM上处理的函数的集合，gM为分配在主处理器MP上全局变量的集合，由此得出处理方案时间消耗函数为solcost＝MPcost+CPMcost+E cost+E′cost+E″cost。其中，MPcost＝∑i(cycM(v)*count(v))，<maths id=math0002 num=0002 ><math><![CDATA[ <mrow><mo>&ForAll;</mo><mi>v</mi><mo>&Element;</mo><msub> <mi>fn</mi> <mi>M</mi></msub><mo>;</mo> </mrow>]]></math> id=icf0008 file=A2009100766930003C3.tif wi=17 he=4 top= 148 left = 106 img-content=drawing img-format=tif orientation=portrait inline=yes/></ma...

【专利技术属性】
技术研发人员：王翔，左可，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人