提供算力资源的智能计算中心云平台的大模型网络动态扩展方法及装置制造方法及图纸

技术编号:46435323 阅读:2 留言:0更新日期:2025-09-19 20:39
本发明专利技术提供一种提供算力资源的智能计算中心云平台的大模型网络动态扩展方法及装置,包括:接收用户输入的样本问题集;基于样本问题集对大模型进行训练,得到训练后的大模型;大模型设置有跳跃门控模块和循环门控模块;跳跃门控模块和循环门控模块用于在大模型的训练过程中,基于样本问题集进行学习,以逐步学习到最优动态决策规则;训练后的大模型,用于接收用户输入的待处理问题,并基于跳跃门控模块、循环门控模块和最优动态决策规则对待处理问题进行推理,并在推理过程中动态扩展自身的多个网络层,基于扩展后的多个网络层得到输出结果。在大模型的训练推理过程中动态扩展网络层的层数,可在提高大模型的推理性能的同时,减少算力资源的消耗。

【技术实现步骤摘要】

本专利技术涉及智能计算中心、智算中心及算力基础设施,具体涉及提供算力资源的智能计算中心云平台的大模型网络动态扩展方法及装置


技术介绍

1、随着人工智能技术的快速发展,“智能计算中心”和“智算中心”应运而生。

2、“智能计算中心”是指通过使用大规模异构算力资源,包括通用算力和智能算力,主要为人工智能应用(如人工智能深度学习模型开发、模型微调和模型推理等场景)提供所需算力、数据和算法的设施。智能计算中心涵盖设施、硬件、软件,并可提供从底层算力到顶层应用使能的全栈能力。

3、“智能计算中心”包括但不限于“智算中心”。

4、“智算中心”即人工智能计算中心,是基于人工智能理论,采用人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的一类算力基础设施。

5、“算力”是“智能计算中心”和“智算中心”的核心,是计算机设备或计算/数据中心处理信息的能力,是计算机硬件和软件配合共同执行某种计算需求的能力,是通过对信息数据进行处理,实现目标结果输出的计算能力,是集信息计算力、网络运载力、数据存储力于一体的新型生产本文档来自技高网...

【技术保护点】

1.一种提供算力资源的智能计算中心云平台的大模型网络动态扩展方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述步骤S2包括:

3.根据权利要求1所述的方法,其特征在于,所述训练后的大模型的架构为Transformer架构,所述Transformer架构的训练后的大模型至少包括嵌入层、所述多个网络层;

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求3所述的方法,其特征在于,

6.一种提供算力资源的智能计算中心云平台的大模型网络动态扩展装置,其特征在于,所述装置包括:</p>

7.根据...

【技术特征摘要】

1.一种提供算力资源的智能计算中心云平台的大模型网络动态扩展方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述步骤s2包括:

3.根据权利要求1所述的方法,其特征在于,所述训练后的大模型的架构为transformer架构,所述transformer架构的训练后的大模型至少包括嵌入层、所述多个网络层;

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求3所述的方法,其特征在于,

6.一种提供算力资源的智能计算中心云平台的大模型网络动态扩展装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述步骤s2包括:

<...

【专利技术属性】
技术研发人员:张小静
申请(专利权)人:北京九章云极科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1