一种支持分区并发访问的软硬件协同存储器组织方法及装置制造方法及图纸

技术编号:35654168 阅读:11 留言:0更新日期:2022-11-19 16:50
本发明专利技术提供一种支持分区并发访问的软硬件协同存储器组织方法及装置方法及装置,属于存储器设计技术领域。该方法包括如下步骤:S1:将存储器基于预设区分方式从逻辑上划分为地址连续的多个可独立访问的存储体;S2:获取来自多个计算单元/请求源发送的多个请求信息,基于请求信息和逻辑划分模式匹配对应的存储体,将每个请求信息分别发送至对应的存储体;S3:接收对应的计算单元/请求源的请求信息,基于请求信息和逻辑划分模式获取该计算单元/请求源相匹配的存储体,将该存储体的访存请求数据发送至对应的计算单元/请求源。本发明专利技术只需配备开销较小的存储访问模块和数据选择模块即可实现高并行度的访问处理,设计复杂度低,实现开销小。实现开销小。实现开销小。

【技术实现步骤摘要】
一种支持分区并发访问的软硬件协同存储器组织方法及装置


[0001]本专利技术涉及存储器设计
,具体而言,涉及一种支持分区并发访问的软硬件协同存储器组织方法及装置。

技术介绍

[0002]随着科学技术的发展和应用需求的激增,处理器需要面向不同应用领域的高性能需求。在片上集成大量的计算单元成为当前提高单芯片计算性能的主要方式,科学计算和人工智能领域均涌现出了各种集成上千个计算单元的高性能处理器或加速器。比如NVIDIA最新的A100加速器集成了6912个CUDA计算核,AMD的MI100集成了7680个计算核心。这些处理器或加速器提供了高度并行的高性能算力,但是也对访存提出了更高的要求:高度并行的计算单元会产生高并行度的访存,对访存的需求急剧增大,访存瓶颈日益加剧。提升片上存储器的可访存并行度是解决这一挑战的方法之一。
[0003]目前的高性能处理器设计中可以提供大容量的片上存储器以提高数据访问的时间局部性和空间局部性,但是却无法解决存储器访问的高并行度问题。现有的技术方案基本上分为三种:1)单端口存储器设计:常见的存储器设计为单端口存储器,同一时间只能允许一个访存请求执行;2)多端口存储器设计:存储器设计为多端口,例如多个读写端口的存储器。多个计算单元/请求源可以通过多端口同时访问该存储器;3)多存储器设计:设计多个存储器,配备多套访问管理部件。多个计算单元/请求源可以同时访问各自对应的存储器。
[0004]现有存储器的设计虽然可以解决部分并发访问的问题,但是也存在着一定的缺点:1)单端口存储器设计:单端口存储器设计方法在同一时间只能允许一个访存请求执行,无法满足多个计算单元/请求源的高并行度访问需求,多个计算单元/请求源只能串行访问存储器,性能低,应用程序执行延迟大;2)多端口存储器设计:多端口存储器设计虽然可以解决一定的并行度问题,但是多端口的实现导致存储器开销较大,并且需要程序员或者后端实现保证多端口对同一访存地址访问的读写一致性问题,增加了设计和实现复杂性;3)多存储器设计:多个存储器的设计可以从根本上解决高并行度的问题,但是需要配备多套存储管理部件,开销大,增加了设计和实现的复杂性。同时,这种设计方法数据交互性差,程序员需要明确不同数据所在的存储器,增加了编程的复杂性。

技术实现思路

[0005]为了解决上述问题,本申请实施例提供了一种支持分区并发访问的软硬件协同存储器组织方法及装置。
[0006]第一方面,本申请实时例提供了一种支持分区并发访问的软硬件协同存储器组织方法,包括如下步骤:S1:将存储器基于预设区分方式从逻辑上划分为地址连续的多个可独立访问的存储体;S2:获取来自多个计算单元/请求源发送的多个请求信息,基于请求信息和逻辑划分模式匹配对应的存储体,将每个请求信息分别发送至对应的存储体;S3:接收对应的计算单元/请求源的请求信息,基于请求信息和逻辑划分模式获取该计算单元/请求源相匹配的存储体,将该存储体的访存请求数据发送至对应的计算单元/请求源。
[0007]优选的,步骤S1中具体包括:步骤S11A和步骤S11B两个中的一个;其中S11A:获取存储器上多个连续的访存地址,基于访存地址的高位对多个访存地址分别进行区分;S11B:在存储器上不同区域设置与访存请求带有的标识相匹配的划分标识,基于划分标识对存储器的不同区域进行区分;以及S12:根据区分情况将存储器划分为多个可独立访问的存储体。
[0008]优选的,步骤S2中具体包括:S21:设置多个解析单元;S22:接收来自多个计算单元/请求源发送的多个请求信息,将多个请求信息分别发送至每个解析单元;S23:获取存储器的区分方式,并将区分方式发送至每个解析单元;S24:每个解析单元分别对每个请求信息进行解析并根据区分方式对解析后的请求信息与每个存储体的匹配关系进行判断,如果请求信息和目标存储体判断成功则将该请求信息发送至对应的存储体。
[0009]优选的,步骤S3中具体包括:S31:设置多个选择单元;S32:接收多个来自计算单元/请求源发送的多个请求信息,分别将每个计算单元/请求源的请求信息发送至唯一对应的选择单元;S33:每个选择单元从该计算单元/请求源的请求信息中选择出逻辑划分模式关键信息并根据逻辑划分模式关键信息对该计算单元/请求源与每个存储体的匹配关系进行判断,如果计算单元/请求源与目标存储体判断成功则将该存储体内的访存请求数据发送至对应的计算单元/请求源。
[0010]第二方面,本申请实施例提供了一种支持分区并发访问的软硬件协同存储器组织装置,包括逻辑划分模块,用以将存储器从逻辑上划分为地址连续的多个可独立访问的存储体;存储访问模块,用以获取来自多个计算单元/请求源发送的多个请求信息,基于请求信息和逻辑划分模式匹配对应的存储体,将每个请求信息分别发送至对应的存储体;数据选择模块,接收对应的计算单元/请求源的请求信息,基于请求信息和逻辑划
分模式获取每个存储体匹配的计算单元/请求源,将每个存储体的访存请求数据发送至对应的计算单元/请求源。
[0011]优选的,所述逻辑划分模块包括地址获取单元、标识设置单元两个中的一个以及划分单元;其中地址获取单元,用以获取存储器上多个连续的访存地址,基于访存地址的高位对多个访存地址分别进行区分;标识设置单元,用以在存储器上不同区域设置与访存请求带有的标识相匹配的划分标识,基于划分标识对存储器的不同区域进行区分;划分单元,用以根据区分情况将存储器划分为多个可独立访问的存储体。
[0012]优选的,所述存储访问模块包括多个解析单元;第一信息接收单元,用以接收来自多个计算单元/请求源发送的多个请求信息,将多个请求信息分别发送至每个解析单元;区分获取单元,用以获取存储器的区分方式,并将区分方式发送至每个解析单元;每个解析单元分别对每个请求信息进行解析并根据区分方式对解析后的请求信息与每个存储体的匹配关系进行判断,如果请求信息和目标存储体判断成功则将该请求信息发送至对应的存储体。
[0013]优选的,所述数据选择模块包括多个选择单元;第二信息接收单元,用以接收多个来自计算单元/请求源发送的多个请求信息,分别将每个计算单元/请求源的请求信息发送至唯一对应的选择单元;每个选择单元从该计算单元/请求源的请求信息中选择出逻辑划分模式关键信息并根据逻辑划分模式关键信息对该计算单元/请求源与每个存储体的匹配关系进行判断,如果计算单元/请求源与目标存储体判断成功则将该存储体内的访存请求数据发送至对应的计算单元/请求源。
[0014]第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法的步骤。
[0015]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法的步骤。
[0016]本专利技术的有益效果为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种支持分区并发访问的软硬件协同存储器组织方法,其特征在于,包括如下步骤:S1:将存储器基于预设区分方式从逻辑上划分为地址连续的多个可独立访问的存储体;S2:获取来自多个计算单元/请求源发送的多个请求信息,基于请求信息和逻辑划分模式匹配对应的存储体,将每个请求信息分别发送至对应的存储体;S3:接收对应的计算单元/请求源的请求信息,基于请求信息和逻辑划分模式获取该计算单元/请求源相匹配的存储体,将该存储体的访存请求数据发送至对应的计算单元/请求源。2.如权利要求1所述的一种支持分区并发访问的软硬件协同存储器组织方法,其特征在于,步骤S1中具体包括:步骤S11A和步骤S11B两个中的一个;其中S11A:获取存储器上多个连续的访存地址,基于访存地址的高位对多个访存地址分别进行区分;S11B:在存储器上不同区域设置与访存请求带有的标识相匹配的划分标识,基于划分标识对存储器的不同区域进行区分;以及S12:根据区分情况将存储器划分为多个可独立访问的存储体。3.如权利要求1所述的一种支持分区并发访问的软硬件协同存储器组织方法,其特征在于,步骤S2中具体包括:S21:设置多个解析单元;S22:接收来自多个计算单元/请求源发送的多个请求信息,将多个请求信息分别发送至每个解析单元;S23:获取存储器的区分方式,并将区分方式发送至每个解析单元;S24:每个解析单元分别对每个请求信息进行解析并根据区分方式对解析后的请求信息与每个存储体的匹配关系进行判断,如果请求信息和目标存储体判断成功则将该请求信息发送至对应的存储体。4.如权利要求3所述的一种支持分区并发访问的软硬件协同存储器组织方法,其特征在于,步骤S3中具体包括:S31:设置多个选择单元;S32:接收多个来自计算单元/请求源发送的多个请求信息,分别将每个计算单元/请求源的请求信息发送至唯一对应的选择单元;S33:每个选择单元从该计算单元/请求源的请求信息中选择出逻辑划分模式关键信息并根据逻辑划分模式关键信息对该计算单元/请求源与每个存储体的匹配关系进行判断,如果计算单元/请求源与目标存储体判断成功则将该存储体内的访存请求数据发送至对应的计算单元/请求源。5.一种支持分区并发访问的软硬件协同存储器组织装置,其特征在于:包括逻辑划分模块,用以将存储器从逻辑上划分为地址连续的多个可独立访问的存储体;存储访问模块,用以获取来自多个计算单元/请求源发送的多个请求信息,基于请...

【专利技术属性】
技术研发人员:陈芳园李宏亮赵冠一马亚楠过锋吕晖
申请(专利权)人:无锡江南计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1