System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种分布式文件系统及其通信方法、装置和客户端设备制造方法及图纸_技高网

一种分布式文件系统及其通信方法、装置和客户端设备制造方法及图纸

技术编号:42698205 阅读:16 留言:0更新日期:2024-09-13 11:54
本发明专利技术公开了一种分布式文件系统及其通信方法、装置和客户端设备,涉及高性能计算技术领域,该方法应用于客户端设备,包括:获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址;根据目标连接方式,确定客户端主备网协地址中的一个目标本端网协地址和服务端主备网协地址中的一个目标对端网协地址;利用目标本端网协地址和目标对端网协地址,建立客户端设备中目标本端网卡与服务端设备中目标对端网卡的通信链接,使本端服务与目标对端服务通过链接进行通信;本发明专利技术提高了不支持绑定的RoCE网卡的网卡聚合能力,并支持多网卡多模式的链接通信路径选择,从而能够选择最佳的网卡和链接通信路径,减少网卡资源浪费的情况。

【技术实现步骤摘要】

本专利技术涉及高性能计算,特别涉及一种分布式文件系统及其通信方法、装置和客户端设备


技术介绍

1、随着hpc(high performance computing,高性能计算)技术的不断发展和普及,存储系统也面临hpc场景的适配和迭代。例如,要求hpc存储系统支持高性能计算任务的数据存储和管理、大规模数据分析和挖掘的海量数据存储以及存储大规模的数据集和模型参数等,用来支持机器学习和深度学习任务和推理等各种场景。

2、目前,为了满足hpc存储系统的高性能要求,网络连接需要满足高带宽,低时延,业内常用的是使用rmda(remote direct memory access,远程直接内存访问)支持,rdma技术可以减少内存拷贝,降低数据传输的延迟和cpu负载。当前rdma常用的有infiniband(一种网络协议)、roce(rdma over converged ethernet,聚合以太网的rdma)、iwarp(一种网络协议)这三种网络协议;其中,infiniband需要配套的专用的网卡和交换机,配置成本比较高;iwarp的性能低于roce。基于成本和高性能的需求,第一选择是roce网卡。在使用roce网卡时,有一部分类型的roce网卡是不支持bonding(绑定)的,对于多网卡(如双网卡)场景,存在网卡资源的浪费的情况。因此,如何能够减少roce网卡的资源浪费的情况,是现今急需解决的问题。


技术实现思路

1、本专利技术的目的是提供一种分布式文件系统的通信方法、装置和客户端设备及分布式文件系统,以提高不支持绑定的roce网卡的网卡聚合能力,减少roce网卡的资源浪费的情况。

2、为解决上述技术问题,本专利技术提供一种分布式文件系统的通信方法,应用于客户端设备,包括:

3、获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址;其中,所述目标对端服务为分布式文件系统的服务端设备中所述本端服务所要通信的服务,所述客户端主备网协地址和所述服务端主备网协地址均包括一个主网协地址和备网协地址,所述主网协地址和所述备网协地址处于不同网卡,所述网卡为聚合以太网的远程直接内存访问网卡;所述客户端设备和所述服务端设备均包括n个所述网卡,n为大于或等于2的正整数,所述客户端设备和所述服务端设备中第i个网卡中的网协地址均属于第i个子网,i为大于0且小于或等于n的正整数;

4、根据目标连接方式,确定所述客户端主备网协地址中的一个目标本端网协地址和所述服务端主备网协地址中的一个目标对端网协地址;其中,所述目标连接方式为任一预设连接方式;

5、利用所述目标本端网协地址和所述目标对端网协地址,建立所述客户端设备中目标本端网卡与所述服务端设备中目标对端网卡的通信链接,使所述本端服务与所述目标对端服务通过所述链接进行通信。

6、在另一方面,所述预设连接方式包括子网模式、本端内存模式和本端内存+子网模式中的至少两项;

7、所述根据目标连接方式,确定所述客户端主备网协地址中的一个目标本端网协地址和所述服务端主备网协地址中的一个目标对端网协地址,包括:

8、在所述目标连接方式为所述子网模式时,将服务端主备网协地址中的主网协地址确定为所述目标对端网协地址,将所述客户端主备网协地址中第一目标子网中的网协地址确定为所述目标本端网协地址;其中,所述第一目标子网为所述目标对端网协地址所属的子网;

9、在所述目标连接方式为所述本端内存模式时,将所述客户端主备网协地址中的主网协地址确定为所述目标本端网协地址,将所述服务端主备网协地址中的主网协地址确定为所述目标对端网协地址;

10、在所述目标连接方式为所述本端内存+子网模式时,将所述客户端主备网协地址中的主网协地址确定为所述目标本端网协地址,将所述服务端主备网协地址中第二目标子网对应的目标网协地址确定为所述目标对端网协地址其中,所述第一目标子网为所述目标本端网协地址所属的子网,所述目标网协地址为所述服务端主备网协地址中的所述第二目标子网中的网协地址,与所述第二目标子网属于同一非统一内存访问的网协地址,或与所述第二目标子网连接到同一交换机的网协地址。

11、在另一方面,所述预设连接方式包括所述子网模式、所述本端内存模式、所述本端内存+子网模式和自适应模式时,所述根据目标连接方式,确定所述客户端主备网协地址中的一个目标本端网协地址和所述服务端主备网协地址中的一个目标对端网协地址,包括:

12、在所述目标连接方式为所述自适应模式时,根据记录的所述子网模式、所述本端内存模式和所述本端内存+子网模式各自对应的通信状态信息,选择当前连接方式;其中,所述通信状态信息包括通信时延,当前连接方式为所述子网模式、所述本端内存模式或所述本端内存+子网模式;

13、按照当前连接方式,确定所述目标本端网协地址和所述目标对端网协地址。

14、在另一方面,所述客户端主备网协地址中的备网协地址的数量为1时,所述获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址,包括:

15、根据硬件槽位信息,确定所述本端服务对应的最近非统一内存访问;

16、根据所述最近非统一内存访问,确定所述本端服务对应的客户端主网卡,并将所述客户端主网卡中的一个网协地址作为所述客户端主备网协地址中的主网协地址;

17、从剩余可用网卡中选择一个网卡作为所述本端服务对应的客户端备网卡,并将所述客户端备网卡中的一个网协地址作为所述客户端主备网协地址中的备网协地址。

18、在另一方面,所述客户端主备网协地址中的备网协地址的数量为1时,所述获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址,包括:

19、从可用网卡列表中选择第一余数对应的网卡作为所述本端服务对应的客户端主网卡,并将所述客户端主网卡中的一个网协地址作为所述客户端主备网协地址中的主网协地址;其中,所述第一余数为所述本端服务的服务编码除以可用网卡数的余数;

20、从所述可用网卡列表中选择第二余数对应的网卡作为所述本端服务对应的客户端备网卡,并将所述客户端备网卡中的一个网协地址作为所述客户端主备网协地址中的备网协地址;其中,所述第二余数为所述本端服务的服务编码加1的和除以可用网卡数的余数。

21、在另一方面,所述获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址,包括:

22、接收所述服务端设备通过监视器守护进程推送的所述目标对端服务的服务端主备网协地址。

23、在另一方面,所述利用所述目标本端网协地址和所述目标对端网协地址,建立所述客户端设备中目标本端网卡与所述服务端设备中目标对端网卡的通信链接之后,还包括:

24、检测到所述目标本端网卡与所述目标对端网卡之间的通信链接断开后,对利用所述目标本端网协地址和所述目标对端网协地址,对所述目标本端网卡与所述目标对端网卡之间的通信链接进行重连,获取重本文档来自技高网...

【技术保护点】

1.一种分布式文件系统的通信方法,其特征在于,应用于客户端设备,包括:

2.根据权利要求1所述的分布式文件系统的通信方法,其特征在于,所述预设连接方式包括子网模式、本端内存模式和本端内存+子网模式中的至少两项;

3.根据权利要求2所述的分布式文件系统的通信方法,其特征在于,所述预设连接方式包括所述子网模式、所述本端内存模式、所述本端内存+子网模式和自适应模式时,所述根据目标连接方式,确定所述客户端主备网协地址中的一个目标本端网协地址和所述服务端主备网协地址中的一个目标对端网协地址,包括:

4.根据权利要求1所述的分布式文件系统的通信方法,其特征在于,所述客户端主备网协地址中的备网协地址的数量为1时,所述获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址,包括:

5.根据权利要求1所述的分布式文件系统的通信方法,其特征在于,所述客户端主备网协地址中的备网协地址的数量为1时,所述获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址,包括:

6.根据权利要求1所述的分布式文件系统的通信方法,其特征在于,所述获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址,包括:

7.根据权利要求1至6任一项所述的分布式文件系统的通信方法,其特征在于,所述利用所述目标本端网协地址和所述目标对端网协地址,建立所述客户端设备中目标本端网卡与所述服务端设备中目标对端网卡的通信链接之后,还包括:

8.一种分布式文件系统的通信装置,其特征在于,应用于客户端设备,包括:

9.一种分布式文件系统的客户端设备,其特征在于,包括:

10.一种分布式文件系统,其特征在于,包括:服务器端设备和如权利要求9所述的分布式文件系统的客户端设备。

...

【技术特征摘要】

1.一种分布式文件系统的通信方法,其特征在于,应用于客户端设备,包括:

2.根据权利要求1所述的分布式文件系统的通信方法,其特征在于,所述预设连接方式包括子网模式、本端内存模式和本端内存+子网模式中的至少两项;

3.根据权利要求2所述的分布式文件系统的通信方法,其特征在于,所述预设连接方式包括所述子网模式、所述本端内存模式、所述本端内存+子网模式和自适应模式时,所述根据目标连接方式,确定所述客户端主备网协地址中的一个目标本端网协地址和所述服务端主备网协地址中的一个目标对端网协地址,包括:

4.根据权利要求1所述的分布式文件系统的通信方法,其特征在于,所述客户端主备网协地址中的备网协地址的数量为1时,所述获取本端服务的客户端主备网协地址和目标对端服务的服务端主备网协地址,包括:

5.根据权利要求1所述的分布式文件系统的通信方法,其...

【专利技术属性】
技术研发人员:王瑞瑞侯斌
申请(专利权)人:郑州浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1