当前位置: 首页 > 专利查询>浙江大学专利>正文

神经元计算机节点负载均衡的方法、系统以及存储介质技术方案

技术编号:38422106 阅读:12 留言:0更新日期:2023-08-07 11:22
本申请涉及一种神经元计算机节点负载均衡的方法、神经元计算机系统以及存储介质。所述方法包括:各节点上处理器核心的资源占用状态,生成各所述节点的资源动态特征矩阵;基于所述资源动态特征矩阵,获取各节点上与待部署应用所需资源格式相匹配的放置方案,并计算各所述放置方案的适应值;基于所述适应值,获取各所述节点的最大适应值,并计算对应的可分配系数;基于所述可分配系数,确定所述待部署应用的部署节点。采用本方法能够及时评估各节点负载情况并根据节点负载情况进行负载均衡决策,解决了现有技术中因负载信息描述不足而导致的节点负载均衡决策困难的问题,提高了神经元计算机系统的资源利用率以及负载均衡的可靠性。靠性。靠性。

【技术实现步骤摘要】
神经元计算机节点负载均衡的方法、系统以及存储介质


[0001]本申请涉及神经元计算机
,特别是涉及一种神经元计算机节点负载均衡的方法、神经元计算机系统以及计算机存储介质。

技术介绍

[0002]在常见的分布式计算系统中,在负载均衡决策前会更新各节点的负载情况,负载均衡算法根据负载情况做出负载均衡决策,所有挂载在各个节点下的计算资源及负载情况均需保持信息同步。
[0003]然而,当计算资源为NPU(神经网络处理器)多核处理器阵列时,特别是在以微内核为NPU计算单元的神经元计算机系统中,神经网络应用的计算与指定NPU单元分布区域绑定,且应用所需NPU核心资源区域形状也存在相对物理位置上的限制,NPU核心阵列的负载区域信息、空闲区域信息都是负载决策的关键特征,这些特征决定着应用部署的可分配性和通讯网络可达性,而现有技术中,负载信息仅表示节点上NPU核心资源的占用与非占用状态,对于非占用资源空间存在的应用部署的多种放置可能难以获取最优的部署决策,使得节点的负载均衡过程决策困难,并带来复杂的负载信息处理过程。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够解决神经元计算机中负载信息描述不足导致的节点负载均衡决策困难问题的神经元计算机节点负载均衡的方法、神经元计算机系统以及计算机存储介质。
[0005]第一方面,本申请提供了一种神经元计算机节点负载均衡的方法,所述方法包括:
[0006]基于各节点上处理器核心的资源占用状态,生成各所述节点的资源动态特征矩阵;<br/>[0007]基于所述资源动态特征矩阵,获取各节点上与待部署应用所需资源格式相匹配的放置方案,并计算各所述放置方案的适应值;
[0008]基于所述适应值,获取各所述节点的最大适应值,并计算对应的可分配系数;
[0009]基于所述可分配系数,确定所述待部署应用的部署节点。
[0010]在其中一个实施例中,基于各节点上处理器核心的资源占用状态,生成各所述节点的资源动态特征矩阵包括:
[0011]获取所述节点上处理器核心的资源占用状态,其中,所述资源占用状态包括占用和空闲两种状态;
[0012]将所述资源占用状态抽象成二维矩阵,并提取对应的占用核心和空闲核心的分布特征;
[0013]基于所述分布特征,生成所述节点的资源动态特征矩阵。
[0014]在其中一个实施例中,所述资源动态特征矩阵包括与占用核心的间距、可达边界路径数以及空洞核心特征,其中,所述与占用核心的间距表示某一核心所处位置的空闲区
域大小,所述可达边界路径数表示某一核心直接访问外部网络的路径数目,所述空洞核心特征表示某一核心为空闲核心,且所述核心的相邻位置存在至少两个被占用的核心。
[0015]在其中一个实施例中,基于所述资源动态特征矩阵,获取各节点上与待部署应用所需资源格式相匹配的放置方案,并计算各所述放置方案的适应值包括:
[0016]基于所述待部署应用所需资源格式的形状,从各所述节点的资源动态特征矩阵中,确定相匹配的填充位置区域;
[0017]基于粒子群优化算法以及所述填充位置区域,确定所述粒子群优化算法中各搜索粒子的原始位置和原始速度,其中,各所述搜索粒子的原始位置与各所述放置方案的放置位置一一对应;
[0018]基于各所述搜索粒子的原始位置和原始速度以及各资源动态特征矩阵,计算每个所述节点下各所述放置方案的适应值。
[0019]在其中一个实施例中,基于各所述搜索粒子的原始位置和原始速度以及各资源动态特征矩阵,计算每个所述节点下各所述放置方案的适应值包括:
[0020]基于各所述搜索粒子的原始位置和原始速度,从各所述资源动态特征矩阵中获取对应的横向距离减少程度、纵向距离减少程度、可达边界路径数以及空洞核心特征;
[0021]基于所述横向距离减少程度、纵向距离减少程度、可达边界路径数以及空洞核心特征,利用所述负载均衡的经验系数,计算每个所述节点下各所述放置方案的适应值。
[0022]在其中一个实施例中,基于所述适应值,获取各所述节点的最大适应值,并计算对应的可分配系数包括:
[0023]基于粒子群优化算法,对所述粒子群优化算法中各搜索粒子的位置和速度进行更新;
[0024]基于所述适应值以及更新后的各所述搜索粒子的位置和速度,获取各所述节点的最大适应值,并计算对应的可分配系数。
[0025]在其中一个实施例中,基于所述适应值以及更新后的各所述搜索粒子的位置和速度,获取各所述节点的最大适应值,并计算对应的可分配系数包括:
[0026]基于所述适应值以及更新后的各所述搜索粒子的位置和速度,获取各所述节点的最大适应值;
[0027]基于所述最大适应值、各所述节点的剩余空闲核心数、所有所述节点的剩余核心空闲总数以及所述负载均衡的反馈经验系数,计算各所述节点对应的可分配系数。
[0028]在其中一个实施例中,所述方法还包括:
[0029]基于所述最大适应值对应的最优放置方案,获取所述待部署应用执行部署后所述部署节点的预测负载情况;
[0030]获取所述待部署应用执行部署后所述部署节点的实际负载情况;
[0031]基于所述预测负载情况以及实际负载情况,进行偏差计算,得到所述负载均衡的偏差信息,并将所述偏差信息反馈至所述负载均衡的反馈经验系数。
[0032]第二方面,本申请还提供了一种神经元计算机系统,所述系统包括神经网络多核处理器和待部署应用,所述神经网络多核处理器以微内核为负载均衡最小单元,挂载在所述神经元计算机系统各个节点下,用于执行上述第一方面的内容,对所述待部署应用执行部署任务。
[0033]第三方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的内容。
[0034]上述神经元计算机节点负载均衡的方法、神经元计算机系统以及计算机存储介质,通过各节点上处理器核心的资源占用状态,生成各所述节点的资源动态特征矩阵;基于所述资源动态特征矩阵,获取各节点上与待部署应用所需资源格式相匹配的放置方案,并计算各所述放置方案的适应值;基于所述适应值,获取各所述节点的最大适应值,并计算对应的可分配系数;基于所述可分配系数,确定所述待部署应用的部署节点,将神经元计算机各个节点上芯片的NPU核心阵列的多种负载信息进行融合,能够及时评估各节点负载情况并根据节点负载情况进行负载均衡决策,解决了现有技术中因负载信息描述不足而导致的节点负载均衡决策困难的问题,提高了资源利用率以及负载均衡的可靠性。
附图说明
[0035]图1为一个实施例中神经元计算机系统的应用环境图;
[0036]图2为一个实施例中神经元计算机节点负载均衡的方法的流程示意图;
[0037]图3为一个实施例中S202的具体步骤的流程示意图;
[0038]图4为一个实施例中S204的具体步骤的流程示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种神经元计算机节点负载均衡的方法,其特征在于,所述方法包括:基于各节点上处理器核心的资源占用状态,生成各所述节点的资源动态特征矩阵;基于所述资源动态特征矩阵,获取各节点上与待部署应用所需资源格式相匹配的放置方案,并计算各所述放置方案的适应值;基于所述适应值,获取各所述节点的最大适应值,并计算对应的可分配系数;基于所述可分配系数,确定所述待部署应用的部署节点。2.根据权利要求1所述神经元计算机节点负载均衡的方法,其特征在于,所述基于各节点上处理器核心的资源占用状态,生成各所述节点的资源动态特征矩阵包括:获取所述节点上处理器核心的资源占用状态,其中,所述资源占用状态包括占用和空闲两种状态;将所述资源占用状态抽象成二维矩阵,并提取对应的占用核心和空闲核心的分布特征;基于所述分布特征,生成所述节点的资源动态特征矩阵。3.根据权利要求2所述神经元计算机节点负载均衡的方法,其特征在于,所述资源动态特征矩阵包括与占用核心的间距、可达边界路径数以及空洞核心特征,其中,所述与占用核心的间距表示某一核心所处位置的空闲区域大小,所述可达边界路径数表示某一核心直接访问外部网络的路径数目,所述空洞核心特征表示某一核心为空闲核心,且所述核心的相邻位置存在至少两个被占用的核心。4.根据权利要求1所述神经元计算机节点负载均衡的方法,其特征在于,所述基于所述资源动态特征矩阵,获取各节点上与待部署应用所需资源格式相匹配的放置方案,并计算各所述放置方案的适应值包括:基于所述待部署应用所需资源格式的形状,从各所述节点的资源动态特征矩阵中,确定相匹配的填充位置区域;基于粒子群优化算法以及所述填充位置区域,确定所述粒子群优化算法中各搜索粒子的原始位置和原始速度,其中,各所述搜索粒子的原始位置与各所述放置方案的放置位置一一对应;基于各所述搜索粒子的原始位置和原始速度以及各资源动态特征矩阵,计算每个所述节点下各所述放置方案的适应值。5.根据权利要求4所述神经元计算机节点负载均衡的方法,其特征在于,所述基于各所述搜索粒子的原始位置和原始速度以及各资源动态特征矩阵,计算每个所述节点下各所述放置方案的适应值包...

【专利技术属性】
技术研发人员:黄雷邓水光王凤娟潘纲吕攀杨国青李莹
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1