一种可持续扩展专家的大模型多语言增强训练方法技术资料下载

当前位置: 首页 > 专利查询>中国移动通信有限公司研究院 > 一种可持续扩展专家的大模型多语言增强训练方法技术 >技术资料下载

下载一种可持续扩展专家的大模型多语言增强训练方法的技术资料

文档序号：44468049

温馨提示：您尚未登录，请点登陆后下载，如果您还没有账户请点注册，登陆完成后，请刷新本页查看技术详细信息。

本发明提出了一种可持续扩展专家的大模型多语言增强训练方法，包括：步骤1，对待训练的大型语言模型LLM中的原FFN模块进行抽取并分割为若干个新的细粒度FFN模块，作为细粒度专家；步骤2，设置细粒度路由器，根据预设规则选择预设数量的新增细粒度专...
该专利属于中国移动通信有限公司研究院所有，仅供学习研究参考，未经过中国移动通信有限公司研究院授权不得商用。

详细技术文档下载地址

温馨提示：您尚未登录，请点登陆后下载，如果您还没有账户请点注册，登陆完成后，请刷新本页查看技术详细信息。