面向SPM存储层次的数据缓存实现方法技术

技术编号：27527862 阅读：25 留言：0更新日期：2021-03-03 10:58

本发明专利技术公开一种面向SPM存储层次的数据缓存实现方法，包括以下步骤：S1、建立数据缓存的编程描述；S2、编译器分析编译指示，确定循环分块参数LoopBlockKey；S3、编译器根据S2中获得的循环分块参数，计算每一个循环块的计算、访存开销与数据传送开销的比值，得到并行隐藏参数Hkey；S4、根据S3得到的并行隐藏参数，反馈修正，得到最终的循环分块参数；S5、根据循环分块参数和并行隐藏参数，选择循环重构策略进行循环重构。本发明专利技术有效提升了编译器的上下文分析精确度和应用的访存效率，且可以做到计算与不同存储层次间的数据传送并行进行，有效利用处理器的各个存储层次，更进一步提升程序性能。更进一步提升程序性能。更进一步提升程序性能。

全部详细技术资料下载

【技术实现步骤摘要】
面向SPM存储层次的数据缓存实现方法

[0001]本专利技术涉及一种面向SPM存储层次的数据缓存实现方法，属于计算机

技术介绍

[0002]随着微处理器架构的发展，多核和众核成为微处理器设计的主要方向。受到面积和功耗的限制，众核处理器倾向于将片上SRAM组织成SPM这种软件管理的非cache结构。这种需要软件管理存储层次的特点给用户编程带来了很大的挑战，用户在编写应用时，不仅需要进行多级多层次的并行规划，还需要考虑数据在不同存储层次的布局、缓冲和传送。
[0003]众核处理器支持多级多层次并行，存储架构复杂，编程困难，为了解决众核处理器的编程问题，学术界和业界都展开了大量深入的研究，提出了多种解决方案。主要包括：1）以OpenCL语言为代表的支持显式异构编程的并行语言。OpenCL提供了丰富的语言扩展，支持多种存储层次上的数据，支持不同存储层次间显式的数据传送。OpenCL丰富的语言支持是编制灵活高效应用的利器，也是制约OpenCL用户的主要因素。作为提供丰富API支持显式并行的语言，OpenCL应用性能的获得主要依靠用户显式说明的数据布局和数据传送，以及用户确定的并行方式。这就要求OpenCL用户不仅需要具备丰富的专业应用知识，而且对众核处理器的体系结构有深入的了解。2）以OpenMP、OpenAcc语言为代表的支持隐式并行的编程语言。使用这一类语言编程，用户不需要进行显示的存储管理，只需要用编译指示指明并行区间和并行方式。这一类应用的性能在很大程度上依赖于编译系统的优化。编译系统编译优化的前提是...

【技术保护点】

【技术特征摘要】
1.一种面向SPM存储层次的数据缓存实现方法，其特征在于：包括以下步骤：S1、建立数据缓存的编程描述：即在循环前，添加编译指示，用于说明循环中需要进行访存优化的数据集和用于访存优化的SPM缓存区的信息；S2、编译器分析S1中的编译指示，确定循环分块参数LoopBlockKey：即解析S1中的编译指示，得到SPM缓存区的总大小和需要进行访存优化的数据集，确定每一次批量传送的数据量，根据该数据量确定可以确保数据访问均集中在SPM缓冲中的循环迭代次数，将该循环迭代次数作为循环分块参数LoopBlockKey；S3、编译器根据S2中获得的循环分块参数LoopBlockKey，计算每一个循环块的计算、访存开销与数据传送开销的比值，得到并行隐藏参数Hkey，具体步骤如下：S31、根据循环分块参数LoopBlockKey，获得循环分块后每一个循环块包含的迭代次数It，It=LoopBlockKey；S32、计算每一次迭代的计算开销Tc；扫描循环中的所有语句，获取每一条语句中每一次计算的计算类型，根据计算类型得到该次计算的计算开销值，将循环中所有计算的计算开销值累加，得到每一次迭代的计算开销Tc；S33、计算每一次迭代的访存开销Tm；扫描循环中的所有访存操作，根据S2中确定的需要访存优化的数据集判断该次访存操作是否可以进行访存优化，如果可以，则每一次迭代该访存操作的访存开销为访问SPM缓冲空间的开销，否则，该访存操作的访存开销为相应的存储层次的访存开销，将循环中所有访存操作的访存开销累加，得到每一次迭代的访存开销Tm；S34、计算每一个循环块的数据传送开销Tt；根据S1中的编译指示说明的可以进行访存优化的数据集，获得需要进行数据传送的次数n，通过循环分块参数LoopBlockKey得到第i次数据传送的数据量Tsizei=LoopBlockKey*TypeSizei，其中，TypeSizei是第i次数据传送的数...

【专利技术属性】
技术研发人员：方燕飞，文延华，李雁冰，杨小川，王敬宇，何王全，
申请(专利权)人：无锡江南计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人