一种基于数据流分析的访存合并优化方法技术

技术编号：2843193 阅读：203 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种基于数据流分析的访存合并优化方法，通过对全局访存指令的访存信息进行数据流分析，将地址相邻或者相近的两个或多个访存指令合并为一条多字节的访存指令。合并后的访存数据存放在寄存器或局部存储器中，原先的访存指令被替换为对寄存器或局部存储器的直接访问。由于该方法通过编译时的静态程序分析方法来优化程序，因此不需要占用额外的存储空间，也不需要硬件支持，实现代价小。通过该方法，可以减少程序中访存指令的数目，减少程序运行时对主存储器的访问次数和访问带宽，从而减少访存时间，提高了程序性能。该方法可应用于通用处理器以及嵌入式处理器体系结构。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及通用及嵌入式编译的访存优化
，是。
技术介绍
在计算机技术中，计算机处理器的速度增长远远高于存储器访问速度的增长，而计算机处理器的速度也远远高于存储器的访问速度，因此，在计算机运行过程中，处理器花费大量时间等待访存数据，这使得访存操作日益成为计算机性能的瓶颈。与访存相关的优化技术是一类重要的编译优化技术，该技术通过各种方法减少访存的延迟，提高访存带宽的利用率。访存优化技术在硬件上主要采用多级缓存的方法减少访存延迟，而实现线程级的轻量级切换的多线程技术也有助于隐藏各个线程访存的延迟。访存优化技术在软件上主要采用数据预取、软件控制的数据缓存、数据映射、访存合并等技术来减少访存延迟。在嵌入式处理器上，存储器往往分为多个存储层次，硬件上没有数据缓存，数据在各个存储层次间的分配需要程序员自己指定，这样做显然不利于访存优化的实现。因此，软件的访存优化技术在嵌入式处理器上尤为重要。对嵌入式处理器的详细说明请参见参考文献1.。访存合并技术是访存优化技术在软件上的一种应用，访存合并技术最先在参考文献2.中提出，它针对通用处理器的64位访存指令，通过循环展开，将同一循环相邻几个迭代中对数组元素的窄访存指令合并为一条双字的(64位)宽访存指令，从而减少了总的访存延迟。在合并的同时，它需要对访存指令做一些安全性和合并代价的检查，保证合并操作不会改变程序的语义并且能够提高程序性能。在必要时，它还提供了运行时的数据对齐和别名检查。该方法的不足在于它仅仅针对程序循环中对数组元素的递增或递减式访问，数据访问的宽度也受限于64位的指令宽度；它缺乏对整个程序的访问操作...

【技术保护点】
一种基于数据流分析的访存合并优化方法，包括以下步骤：１）、利用编译器收集整个程序的访存操作信息，将所得信息存入一个映射表；２）、由编译器对程序中的所有基本块构造支配图和后支配图；３）、对程序中的所有读操作做反向数据流分析，更新基本块的输入数据集和输出数据集；４）、对程序中的所有写操作，进行正向数据流分析，更新基本块的输入数据集和输出数据集；５）、根据步骤３）和步骤４）所得到的基本块的输入数据集和输出数据集，对每一个访存操作，判断该访存操作所在基本块的输入数据集合中的访存操作是否可与该访存操作合并，并为输入数据集中所有可以与当前访存操作做合并的访存操作建立一个集合；６）、判断用于保存可合并的访存操作的集合是否为空，若为空，则跳转到步骤１０），否则，执行下一步；　　７）、对步骤５）所得集合中的所有元素，分别计算各个元素对应的访存操作与当前访存操作之间的合并密度；８）、从步骤７）所得到的结果中，选择合并密度最大的访存操作，将该访存操作与当前访存操作进行合并，生成新的访存操作；９）、判断 ...

【技术特征摘要】

【专利技术属性】
技术研发人员：刘弢，吴承勇，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人