下载大语言模型膨胀预训练方法、系统、电子设备及存储介质的技术资料

文档序号:42699634

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本申请实施例提供了一种大语言模型膨胀预训练方法、系统、电子设备及存储介质,属于人工智能技术领域。该方法通过预先训练参数较小的第一语言模型,然后根据第一语言模型中目标网络的参数集合将目标网络拓展为第一专家网络和第二专家网络,将低秩矩阵映射单元...
该专利属于中电信人工智能科技(北京)有限公司所有,仅供学习研究参考,未经过中电信人工智能科技(北京)有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。