基于搜索的分布式张量的不同排布方式间的自动转换系统技术方案

技术编号：35991574 阅读：12 留言：0更新日期：2022-12-17 23:06

本发明专利技术公开了基于搜索的分布式张量的不同排布方式间的自动转换系统，涉及分布式张量转换技术领域，包括排布转换方案搜索器、模拟器、缓存表与执行器；所述排布转换方案搜索器，用于得到从起始序列到目标序列转换序列表；所述模拟器，用于在不真实执行的情况下，根据模型给出序列转换过程中，每个操作的开销，并累积起来；所述缓存表，用于缓存在所有搜索过的方案；该基于搜索的分布式张量的不同排布方式间的自动转换系统，通过设置有排布转换方案搜索器、模拟器、缓存表与执行器，完成高维集群下的分布式张量排布的自动转换，模拟器给出的信息，可以用来做分布式张量排布的选择或者自动并行方案的选择，缓存表可以使运行时的搜索开销大幅降低。销大幅降低。销大幅降低。

全部详细技术资料下载

【技术实现步骤摘要】
基于搜索的分布式张量的不同排布方式间的自动转换系统

[0001]本专利技术涉及分布式张量转换
，具体为基于搜索的分布式张量的不同排布方式间的自动转换系统。

技术介绍

[0002]随深度学习模型逐渐变得越来越大以达到更佳的精度要求。深度学习模型的参数量已经达到百亿级别，甚至千亿级别。智源悟道2.0模型甚至有1.75万亿的参数规模。
[0003]在这种级别的大模型上，甚至单个张量的显存开销可能是单个设备无法承受的，这时张量的分布式存储技术被很多框架使用。为不同的排布方案提供一个自动转换系统，可以极大地提高张量分布式存储技术的易用性。
[0004]当前的主流分布式张量自动转换方案有OneFlow，TensorFlow XLA模块.
[0005]OneFlow：该框架提供了一套完整的分布式张量表达方案和自动转换方案。
[0006]分布式张量表达方案：在OneFlow框架中，构造了一套SBP的表达方案，其中S代表split，B代表broadcast，P代表partial sum：
[0007]Split：表示物理上的多个张量是由逻辑上的张量进行切分后得到的。Split会包含一个参数Axis，表示被切分的维度。如果把所有物理上的张量按照Split的维度进行拼接，就能还原出逻辑上的张量。
[0008]Broadcast：表示物理上的多个张量是逻辑上张量的复制，两者数据完全相同。
[0009]Partial Sum：表示物理上的多个张量跟逻辑上的张量的形状相同，但每个对应...

【技术保护点】

【技术特征摘要】
1.基于搜索的分布式张量的不同排布方式间的自动转换系统，其特征在于：包括排布转换方案搜索器(1)、模拟器(2)、缓存表(3)与执行器(4)；所述排布转换方案搜索器(1)，用于得到从起始序列到目标序列转换序列表；所述模拟器(2)，用于在不真实执行的情况下，根据模型给出序列转换过程中，每个操作的开销，并累积起来；所述缓存表(3)，用于缓存在所有搜索过的方案；所述执行器(4)，用于在运行时中，执行搜索器搜索到的转换序列表，完成分布式张量排布的切换。2.根据权利要求1所述的基于搜索的分布式张量的不同排布方式间的自动转换系统，其特征在于：所述排布转换方案搜索器(1)包括序列生成模块(5)、相似度计算模块(6)与序列选择模块(7)，所述序列生成模块(5)，用于根据起始序列，生成所有与原序列距离为1的序列；所述相似度计算模块(6)，用于利用一个相似度计算函数，计算出序列间的相似度；所述序列选择模块(7)，用于根据相似度的高低进行选择。3.根据权利要求1所述的基于搜索的分布式张量的不同排布方式间的自动转换系统，其特征在于：所述排布转换方案搜索器(1)计算到与目标序列不同，则将C中选择到的序列，...

【专利技术属性】
技术研发人员：刘育良，李升桂，方佳瑞，卞正达，李永彬，柳泓鑫，麦思琪，黄海晨，娄宇轩，吴俊铭，路广阳，陈巍文，
申请(专利权)人：北京潞晨科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人