下载大模型训练容错方法、系统、终端及存储介质的技术资料

文档序号:40517692

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供了一种大模型训练容错方法、系统、终端及存储介质,该方法包括:对大模型集群的集群缓存信息进行故障检测;若故障检测合格,则获取集群缓存信息中故障训练任务的任务信息,根据故障训练任务的任务信息确定故障类型;若故障类型是第一类型,重启故障...
该专利属于四川云知声智能科技有限公司所有,仅供学习研究参考,未经过四川云知声智能科技有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。