下载一种大模型的加速训练方法、装置、设备及存储介质的技术资料

文档序号:41442135

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种大模型的加速训练方法、装置、设备及存储介质,涉及大模型技术领域。该方法包括:根据大模型分布式训练过程中的分词模型和进程数,对样本文本数据集中样本文本数据进行分片和分桶,得到新的文本分片文件;从新的文本分片文件加载各训练进程对...
该专利属于达观数据有限公司所有,仅供学习研究参考,未经过达观数据有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。