System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种数据推理方法、装置、设备及存储介质。
技术介绍
1、近年来,以transformer结构为基础的神经网络模型发展迅速,并且在很多自然语言任务上都取得了显著的效果,与此同时,模型参数也有了数量级的飞跃。随着模型尺寸越来越大,模型推理和部署面临着极大挑战,模型难以在单个设备完成推理,这一现象引起了学术界和工业界对模型推理中并行性的关注和研究。
2、现有的主流并行技术包括数据并行、流水线并行和模型并行。数据并行是在早期分布式训练中广泛使用的方法,它将输入数据进行切分后发送给不同设备进行计算,每个设备都装载有完整模型。数据并行可以提高应用程序的吞吐量,但无法降低端到端推理延迟,因此不适合实时应用程序模型部署,并且对单个推理设备提出了较大内存挑战。流水线并行将模型切成若干个连续的层,每个设备只需要装载模型的部分层,能够有效缓解内存压力。然而,这种方法会产生流水线气泡,造成设备资源利用率较低,并且单个推理请求在各个分布式推理设备之间形成流水线,无法利用多设备的并行性。
3、相比之下,模型并行是实现分布式推理最合适的方法,它将模型的某个或某些层切分成多个部分,不同部分分发到各个设备上并行计算。在模型并行下,每个设备只需要装载一部分模型,能够有效缓解模型尺寸带来的压力。其中,模型并行又包括张量并行和序列并行,张量并行直接切分模型权重,但由于当前网络的紧耦合结构,直接划分权重后,并行时需要大量通信来消除各部分间的数据依赖、聚合各部分的输出结果,尤其在弱互连条件下会产生高昂的通信开销,导致分布式
技术实现思路
1、本申请的主要目的在于提供一种数据推理方法、装置、设备及存储介质,旨在解决分布式推理的通信瓶颈的问题。
2、为实现上述目的,本申请提供一种数据推理方法,所述数据推理方法包括以下步骤:
3、获取待推理数据;
4、通过预先获得的数据推理模型,根据所述待推理数据进行模型并行推理,得到数据推理结果,所述数据推理模型通过对预设的原始推理模型进行解耦获得。
5、可选地,所述通过预先获得的数据推理模型,根据所述待推理数据进行模型并行推理,得到数据推理结果的步骤之前包括:
6、基于预设的模型结构解耦算法,对所述原始推理模型进行解耦,得到解耦推理模型;
7、根据预先获取的训练数据,对所述解耦推理模型进行模型训练,得到权重解耦推理模型;
8、基于预设的模型自适应放置算法,将所述权重解耦推理模型放置进预设的集群中,得到所述数据推理模型。
9、可选地,所述基于预设的模型结构解耦算法,对所述原始推理模型进行解耦,得到解耦推理模型的步骤包括:
10、基于所述模型结构解耦算法,对所述原始推理模型中的原始层进行解耦,得到解耦层;
11、根据所述原始层和解耦层进行模型构建,得到所述解耦推理模型。
12、可选地,所述基于预设的模型自适应放置算法,将所述权重解耦推理模型放置进预设的集群中,得到所述数据推理模型的步骤包括:
13、对所述权重解耦推理模型进行离线性能分析,得到模型性能分析结果;
14、根据所述模型性能分析结果,获得模型放置计划;
15、基于所述模型自适应放置算法,根据所述模型放置计划,将所述权重解耦推理模型放置进预设的集群中,得到所述数据推理模型。
16、可选地,所述对所述权重解耦推理模型进行离线性能分析,得到模型性能分析结果的步骤包括:
17、获取模型性能分析指令和标准测试数据;
18、将所述标准测试数据输入所述权重解耦推理模型;
19、通过所述模型性能分析指令,根据所述标准测试数据对所述权重解耦推理模型进行测试,得到通信时间数据和计算时间数据;
20、根据所述通信时间数据和计算时间数据进行模型性能分析,得到所述模型性能分析结果。
21、可选地,所述基于所述模型自适应放置算法,根据所述模型放置计划,将所述权重解耦推理模型放置进预设的集群中,得到所述数据推理模型的步骤包括:
22、基于所述模型自适应放置算法中的解耦层放置算法,将所述权重解耦推理模型中的解耦层均匀放置在所述集群的运算设备中,获得第一解耦层;
23、基于所述模型自适应放置算法中的原始层放置算法,根据所述模型放置计划,将所述权重解耦推理模型中的原始层放置在所述集群中,获得第一原始层;
24、根据所述第一原始层和第一解耦层,得到所述数据推理模型。
25、可选地,所述基于所述模型自适应放置算法中的原始层放置算法,根据所述模型放置计划,将所述权重解耦推理模型中的原始层放置在所述集群中,获得第一原始层的步骤包括:
26、根据预先获取的集群内存容量数据、集群网络带宽数据和所述模型放置计划,获得原始层放置策略;
27、基于所述原始层放置算法,根据所述原始层放置策略,将所述权重解耦推理模型中的原始层放置在所述集群中,获得所述第一原始层。
28、此外,为实现上述目的,本申请还提供一种数据推理装置,所述数据推理装置包括:
29、数据获取模块,用于获取待推理数据;
30、数据推理模块,用于通过预先获得的数据推理模型,根据所述待推理数据进行模型并行推理,得到数据推理结果,所述数据推理模型通过对预设的原始推理模型进行解耦获得。
31、本申请实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据推理程序,所述数据推理程序被所述处理器执行时实现如上所述的数据推理方法的步骤。
32、本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有数据推理程序,所述数据推理程序被处理器执行时实现如上所述的数据推理方法的步骤。
33、本申请实施例提出的一种数据推理方法、装置、设备及存储介质,通过获取待推理数据;通过预先获得的数据推理模型,根据所述待推理数据进行模型并行推理,得到数据推理结果,所述数据推理模型通过对预设的原始推理模型进行解耦获得。通过对原始推理模型进行解耦得到的数据推理模型,优化了模型并行,降低了推理延迟。由此,实现了对数据的分布式推理,解决了现有技术中分布式推理的通信瓶颈的技术问题。相较于现有技术,能够有效降低模型并行中的通信开销,提升分布式推理性能。
34、以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的
,均同本文档来自技高网...
【技术保护点】
1.一种数据推理方法,其特征在于,所述数据推理方法包括以下步骤:
2.如权利要求1所述的数据推理方法,其特征在于,所述通过预先获得的数据推理模型,根据所述待推理数据进行模型并行推理,得到数据推理结果的步骤之前包括:
3.如权利要求2所述的数据推理方法,其特征在于,所述基于预设的模型结构解耦算法,对所述原始推理模型进行解耦,得到解耦推理模型的步骤包括:
4.如权利要求2所述的数据推理方法,其特征在于,所述基于预设的模型自适应放置算法,将所述权重解耦推理模型放置进预设的集群中,得到所述数据推理模型的步骤包括:
5.如权利要求4所述的数据推理方法,其特征在于,所述对所述权重解耦推理模型进行离线性能分析,得到模型性能分析结果的步骤包括:
6.如权利要求4所述的数据推理方法,其特征在于,所述基于所述模型自适应放置算法,根据所述模型放置计划,将所述权重解耦推理模型放置进预设的集群中,得到所述数据推理模型的步骤包括:
7.如权利要求6所述的数据推理方法,其特征在于,所述基于所述模型自适应放置算法中的原始层放置算法,根据所述
8.一种数据推理装置,其特征在于,所述数据推理装置包括:
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据推理程序,所述数据推理程序被所述处理器执行时实现如权利要求1-7中任一项所述的数据推理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据推理程序,所述数据推理程序被处理器执行时实现如权利要求1-7中任一项所述的数据推理方法的步骤。
...【技术特征摘要】
1.一种数据推理方法,其特征在于,所述数据推理方法包括以下步骤:
2.如权利要求1所述的数据推理方法,其特征在于,所述通过预先获得的数据推理模型,根据所述待推理数据进行模型并行推理,得到数据推理结果的步骤之前包括:
3.如权利要求2所述的数据推理方法,其特征在于,所述基于预设的模型结构解耦算法,对所述原始推理模型进行解耦,得到解耦推理模型的步骤包括:
4.如权利要求2所述的数据推理方法,其特征在于,所述基于预设的模型自适应放置算法,将所述权重解耦推理模型放置进预设的集群中,得到所述数据推理模型的步骤包括:
5.如权利要求4所述的数据推理方法,其特征在于,所述对所述权重解耦推理模型进行离线性能分析,得到模型性能分析结果的步骤包括:
6.如权利要求4所述的数据推理方法,其特征在于,所述基于所述模型自适应放置算法,根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。