下载一种大语言模型训练加速方法的技术资料

文档序号:43012215

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供一种大语言模型训练加速方法,包括以下步骤:对大模型的不同网络层进行数学建模,分析对应层的参数量,计算不同层的计算量:模型参数量是指一个神经网络或机器学习模型中可以进行学习和调整的参数的数量,这些参数包括权重和偏置,它们在训练过程中...
该专利属于中国电子科技集团有限公司电子科学研究院所有,仅供学习研究参考,未经过中国电子科技集团有限公司电子科学研究院授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。