【技术实现步骤摘要】
提高存算一体化系统性能的静态计算划分方法
[0001]本专利技术属于计算机
,更具体地,本专利技术涉及一种提高存算一体化系统性能的静态计算划分方法。
技术介绍
[0002]随着大数据、深度学习、人工智能等新兴领域的蓬勃发展,应用的数据集不断增大,信息处理逐渐由传统的“计算密集型”向“访存密集型”转移。近十年来,随着硅基电子器件逼近物理极限,摩尔定律濒临失效,中央处理器(central processing unit,CPU)的性能难以高速、持续地提升。同时,传统存储器件无法兼具“高速度”与“高密度”的特点,导致现有以计算为核心的冯
·
诺依曼结构严重依赖层次化存储结构以获得系统性能与存储容量的折中。而大数据时代下离散化、随机化的数据访问致使层次化存储的效率断崖式下降甚至濒临失效,数据频繁在处理器和多级存储间搬运,产生了带宽受限、计算效率下降、计算能效低下等一系列问题。传统冯
·
诺依曼结构计算机正遭受严峻挑战,难以满足智能社会对计算的需求。
[0003]为了缓解甚至打破存储墙,目前主要的技术路线是彻底打破冯
·
诺依曼结构中“存算分离”的固有思想,从底层架构进行突破,对计算机体系结构进行重新设计,这一技术路线被称为存算一体化体系结构(processing
‑
in
‑
memory,PIM)。存算一体化体系结构的主要思想是在存内集成计算单元,利用存内的超高带宽和低访问延迟,实现近数据计算。近年来,3D堆叠内存、硅通孔技术(t ...
【技术保护点】
【技术特征摘要】
1.一种提高存算一体化系统性能的静态计算划分方法,其特征在于,所述方法包括如下步骤:S1、将程序划分成若干基本块,将程序转化为程序的注释调用图,注释调用图中的节点即对应于程序中的基本块;S2、将注释调用图中的各节点v划分至内计算单元或片上处理器,形成程序的多个划分方案,输出执行时间最短的程序划分方案。2.如权利要求1所述提高存算一体化系统性能的静态计算划分方法,其特征在于,注释调用图的生成方法具体如下:S11、使用LLVM中间层对将高级程序语言进行抽象为汇编语言,后对会汇编语言进行插桩形成程序的执行流程图;S12、基于Lengauer
‑
Tarjan算法生成执行流程图的后序支配树;S13、基于后序支配树间各基本块间的支配关系,形成注释调用图的控制依赖边,添加数据依赖边、添加边和节点的属性后,形成注释调用图。3.如权利要求2所述提高存算一体化系统性能的静态计算划分方法,其特征在于,控制依赖边的生成过程具体如下:S131、检测程序的执行流程图中是否存在环,若存在,则执行步骤S133,再执行步骤S132,若不存在,则直接执行步骤S132;S132、遍历后序支配树边集E2中的所有边e2,在执行流程的边集E1删除与边e2相同的边,形成注释调用图的控制依赖边;S133、环中所有节点都依赖于头节点,以此提取控制相关。4.如权利要求1所述提高存算一体化系统性能的静态计算划分方法,其特征在于,程序划分方案的执行时间计算公式具体如下:T
all
=T
CPU
+T
PIM
+T
M
其中,T
CPU
为在片上处理器的执行总时间,T
PIM
为在存内计算单元的执行总时间,T
M
为片上处理器与存内计算单元间的数据传输总时间。5.如权利要求5所述提高存算一体化系统性能的静态计算划分方法,其特征在于,T
CPU
、T
PIM
、T
M
的计算公式具体如下:的计算公式具体如下:的计算公式具体如下:的计算公式具体如下:其中,表示点集S中全部基本块在片上处理器的执行总时间表示;表示点集T中全部基本块在存内计算单元上执行的总...
【专利技术属性】
技术研发人员:薛洪宇,徐晟,陈紫阳,赵发鹏,王赛,陈付龙,
申请(专利权)人:安徽师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。