模型芯片架构实现方法、装置、电子设备、存储介质和计算机程序产品制造方法及图纸

技术编号:42336305 阅读:28 留言:0更新日期:2024-08-14 16:12
本发明专利技术提供一种模型芯片架构实现方法、装置、电子设备、存储介质和计算机程序产品,所述方法包括:确定模型在目标阶段的计算访存比,以及当前芯片架构的计算强度;基于计算访存比以及计算强度,从各芯片架构中确定目标阶段对应的目标芯片架构。本发明专利技术提供的模型芯片架构实现方法、装置、电子设备、存储介质和计算机程序产品,基于目标阶段的计算访存比以及当前芯片架构的计算强度,从各芯片架构中确定目标阶段对应的目标芯片架构,从而实现基于不同阶段的计算特点选取最适合的目标芯片架构,不仅可以减少资源浪费降低成本,还可以达到较好的推理速度。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种模型芯片架构实现方法、装置、电子设备、存储介质和计算机程序产品


技术介绍

1、大模型尤其是那些在自然语言处理和多模态任务中表现卓越的模型,通常拥有庞大的参数量,这使得它们在推理过程中展现出卓越的性能,同时也带来了较高的计算成本。

2、大模型的推理过程往往涉及多个不同的阶段,各阶段对计算资源的需求各不相同,目前的实现方案是在相同的芯片上依次完成各阶段的任务。然而,某些阶段对算力要求较高,某些阶段对存储带宽要求较高,如果均在同一芯片上完成不同阶段的任务,会造成计算资源的浪费,计算成本较高;此外,在不同的并行策略下均采用相同的芯片,会造成资源浪费,计算效率低下。


技术实现思路

1、本专利技术提供一种模型芯片架构实现方法、装置、电子设备、存储介质和计算机程序产品,用以解决现有技术中在同一芯片上完成不同阶段的任务,会造成计算资源的浪费,计算成本较高的缺陷。

2、本专利技术提供一种模型芯片架构实现方法,包括:

3、确定模型在目标阶段的计算访存比,以本文档来自技高网...

【技术保护点】

1.一种模型芯片架构实现方法,其特征在于,包括:

2.根据权利要求1所述的模型芯片架构实现方法,其特征在于,所述基于所述计算访存比以及所述计算强度,从各芯片架构中确定所述目标阶段对应的目标芯片架构,包括:

3.根据权利要求1所述的模型芯片架构实现方法,其特征在于,所述目标阶段的计算访存比基于如下步骤确定:

4.根据权利要求3所述的模型芯片架构实现方法,其特征在于,所述基于所述输入矩阵与所述权重矩阵,确定计算量以及数据读取量,包括:

5.根据权利要求3所述的模型芯片架构实现方法,其特征在于,所述基于所述计算量以及所述数据读取量,确定所述计算访...

【技术特征摘要】

1.一种模型芯片架构实现方法,其特征在于,包括:

2.根据权利要求1所述的模型芯片架构实现方法,其特征在于,所述基于所述计算访存比以及所述计算强度,从各芯片架构中确定所述目标阶段对应的目标芯片架构,包括:

3.根据权利要求1所述的模型芯片架构实现方法,其特征在于,所述目标阶段的计算访存比基于如下步骤确定:

4.根据权利要求3所述的模型芯片架构实现方法,其特征在于,所述基于所述输入矩阵与所述权重矩阵,确定计算量以及数据读取量,包括:

5.根据权利要求3所述的模型芯片架构实现方法,其特征在于,所述基于所述计算量以及所述数据读取量,确定所述计算访存比,包括:

6.根据权利要求1至5任一项所述的模型芯片架...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:上海壁仞科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1