一种利用内存带宽的内存应用方法、装置与计算设备制造方法及图纸

技术编号：33242710 阅读：17 留言：0更新日期：2022-04-27 17:47

本发明专利技术公开了一种利用内存带宽的内存应用方法、装置与计算设备。上述方法包括步骤：在NUMA架构的多内存节点系统中，当用户态程序待使用的内存数据的大小大于或者等于预设阈值时，将所述用户态程序待使用的内存数据划分为多个支持并行处理的数据块；至少基于与所述用户态程序待使用的内存数据所对应的内存节点的距离确定一个或者多个目标内存节点；将一个或者多个数据块保留在所述用户态程序所对应的内存节点，将剩余数据块分配至所述一个或者多个目标内存节点。本发明专利技术一并公开了相应的装置和计算设备。置和计算设备。置和计算设备。

全部详细技术资料下载

【技术实现步骤摘要】
一种利用内存带宽的内存应用方法、装置与计算设备

[0001]本专利技术涉及进程调度
，尤其是一种利用内存带宽的内存应用方法、装置与计算设备。

技术介绍

[0002]在内存带宽有限的场景，单进程的大数据量操作受限于内存访问速度，此时性能表现较差。在NUMA(非一致内存访问)架构的服务器上，NUMA系统节点(NODE)是由一组CPU以及本地内存组成，每个NODE都有自己的本地内存，每个NODE访问本地内存的延迟要低于访问其他NODE的远端内存。因此在linux系统上，进程倾向于在本地NODE上申请内存使用，此时虽然访问本地数据较快，但是当需求大量数据访问(如大数组运算)时，同一NODE上的内存带宽反而限制了性能。
[0003]如图1所示，在多NODE系统里，进程都是就近申请内存，因此当进程运行在NODE 0对应的CPU上，此时申请的大数组内存也都在NODE 0上，如果进行数组拷贝，此时主要的操作就是NODE 0上的内存访问，此时运算性能受内存带宽的影响，带宽越高，性能越好。在一些带宽有限的服务器设备上，此时性能表现较差，计算耗时较长。

技术实现思路

[0004]为此，本专利技术提供了一种利用内存带宽的内存应用方法、装置与计算设备，以力图解决或者至少缓解上面存在的至少一个问题。
[0005]根据本专利技术的一个方面，提供了一种利用内存带宽的内存应用方法，包括步骤：在NUMA架构的多内存节点系统中，当用户态程序待使用的内存数据的大小大于或者等于预设阈值时，将所述用户态程序待使用的内存数据...

【技术保护点】

【技术特征摘要】
1.一种利用内存带宽的内存应用方法，包括步骤：在NUMA架构的多内存节点系统中，当用户态程序待使用的内存数据的大小大于或者等于预设阈值时，将所述用户态程序待使用的内存数据划分为多个支持并行处理的数据块；至少基于与所述用户态程序待使用的内存数据所对应的内存节点的距离确定一个或者多个目标内存节点；将一个或者多个数据块保留在所述用户态程序所对应的内存节点，将剩余数据块分配至所述一个或者多个目标内存节点。2.如权利要求1所述的应用方法，其中，所述将所述用户态程序待使用的内存数据划分为多个支持并行处理的数据块的步骤包括：将所述用户态程序待使用的内存数据按照数组名或者指针名划分为多个支持并行处理的数据块。3.如权利要求1或2所述的应用方法，其中，所述至少基于与所述用户态程序待使用的内存数据所对应的内存节点的距离确定一个或者多个目标内存节点的步骤包括：在所述全部内存节点中，确定与所述用户态程序所对应的内存节点的距离小于或者等于距离阈值的内存节点作为候选节点，从所述候选节点中确定与划分的所述数据块数量相应的目标内存节点。4.如权利要求3所述的应用方法，其中，从所述候选节点中确定与划分的所述数据块数量相应的目标内存节点的步骤包括：在所述候选节点中，将其中内存容量大于或者等于预设容量阈值的一个或者多个确定为目标内存节点。5.如权利要求1或2所述的应用方法，其中，将一个或者多个数据块保留在所述用户态程序所对应的内存节点的步骤包括：将所述用户态程序最先使用的和/或等待使用的一个或者多个数据块保留在所述内存数据所在的内存节点；...

【专利技术属性】
技术研发人员：叶中玉，周鹏，胡翔，余昇锦，
申请(专利权)人：西安统信软件技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人