【技术实现步骤摘要】
流式高速缓存存储器中的数据行的混合分配
[0001]各种实施例总体上涉及计算机存储器架构,并且更具体地,涉及流式高速缓存存储器中的数据行的混合分配
。
技术介绍
[0002]除其他外,计算系统通常包括一个或更多个处理单元,例如中央处理单元
(CPU)
和
/
或图形处理单元
(GPU)
,以及一个或更多个存储器系统
。
处理单元执行用户模式软件应用程序,该应用程序提交和启动计算任务,其在处理单元中所包括的一个或更多个计算引擎上执行
。
处理单元包括多层存储器系统,以在从存储器加载数据和将数据存储到存储器时提高性能
。
[0003]多层存储器系统包括相对较大且性能相对较低的系统存储器,用于存储用户模式软件应用程序中包括的大量程序指令以及用户模式软件应用程序在执行期间随时间访问的数据
。
此外,多层存储器系统包括相对较小且性能相对较高的高速缓存存储器,用于存储用户模式软件应用程序当前或即将访问的那些程序指令和数据
。
通常,高速缓存存储器可以组织为一组高速缓存行,其中每个高速缓存行包含数十或数百字节的数据
。
当数据加载到高速缓存中时,高速缓存控制器分配一个或更多个高速缓存行,然后从系统存储器中加载数据并将数据存储在高速缓存行中
。
高速缓存控制器在使用时或就在使用之前将来自系统存储器的指令和数据加载到高速缓存存储器中
。
结果,与较低性能 ...
【技术保护点】
【技术特征摘要】
1.
一种用于管理计算系统中的高速缓存存储器的计算机实现的方法,所述方法包括:检测第一高速缓存行分配请求以分配第一逻辑扇区;确定所述第一高速缓存行分配请求可与第二高速缓存行分配请求组合以分配第二逻辑扇区;以及将与所述第一逻辑扇区相关联的第一数据存储在所述高速缓存存储器的第一高速缓存行的第一物理扇区中,其中与所述第二逻辑扇区相关联的第二数据被存储在所述第一高速缓存行的第二物理扇区中
。2.
如权利要求1所述的计算机实现的方法,其中确定所述第一高速缓存行分配请求可与所述第二高速缓存行分配请求组合包括:确定所述第一逻辑扇区和所述第二逻辑扇区不重叠
。3.
如权利要求1所述的计算机实现的方法,其中确定所述第一高速缓存行分配请求可与所述第二高速缓存行分配请求组合包括:确定所述第一逻辑扇区和所述第二逻辑扇区在所述第一高速缓存行中重叠;以及确定所述第一逻辑扇区可以被移动到不与所述第二逻辑扇区重叠
。4.
如权利要求1所述的计算机实现的方法,还包括确定所述第一高速缓存行分配请求是瞬态高速缓存行分配请求
。5.
如权利要求1所述的计算机实现的方法,其中所述第一逻辑扇区是经由与所述高速缓存存储器相关联的第一标签组分配的,并且所述第二逻辑扇区是经由与所述高速缓存存储器相关联的第二标签组分配的
。6.
如权利要求1所述的计算机实现的方法,其中:所述第一高速缓存行分配请求和所述第二高速缓存行分配请求与作为一组波前而被执行的线程束指令相关联;所述第一逻辑扇区是经由包括在所述一组波前中的第一波前分配的;以及所述第二逻辑扇区是经由包括在所述一组波前中的第二波前分配的
。7.
如权利要求1所述的计算机实现的方法,还包括并发地访问所述第一物理扇区和所述第二物理扇区不会导致存储器数据组冲突
。8.
如权利要求1所述的计算机实现的方法,其中所述第一高速缓存行包括
128
字节,并且所述第一物理扇区包括
32
字节
。9.
如权利要求1所述的计算机实现的方法,其中所述第一高速缓存行包括四个物理扇区,所述四个物理扇区包括所述第一物理扇区和所述第二物理扇区
。10.
如权利要求1所述的计算机实现的方法,其中所述高速缓存存储器包括一级
L1
高速缓存
、1.5
级
L1.5
高速缓存或二级
L2
高速缓存
。11.
如权利要求1所述的计算机实现的方法,其中所述第一高速缓存行分配请...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。