一种针对大语言模型的资源优化和碳减排方法及设备技术

技术编号：39292333 阅读：17 留言：0更新日期：2023-11-07 11:00

本申请实施例提供一种针对大语言模型的资源优化和碳减排方法及设备。针对大语言模型的预训练过程，基于所选定的时间区间内动态变化的碳排放强度，为大语言模型确定在该时间区间内的预训练起止时间节点以及预训练期间的GPU资源量调控参数值，以使大语言模型在该时间区间内对应的预训练碳排放预估总量达到指定要求。这样，可在选定的时间区间内，基于动态变化的碳排放强度合理地调控预训练起止时间节点以及预训练期间的各个时间节点下的GPU资源量调控参数值，从而动态调控用于大语言模型预训练的GPU资源量，进而将预训练任务合理切分至所选定时间区间内的相关时间节点，这可有效降低大语言模型预训练所产生的碳排放量。效降低大语言模型预训练所产生的碳排放量。效降低大语言模型预训练所产生的碳排放量。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对大语言模型的资源优化和碳减排方法及设备

[0001]本申请涉及计算机
，尤其涉及一种针对大语言模型的资源优化和碳减排方法及设备。

技术介绍

[0002]随着各类生成式AI的发布，大语言模型(Large Language Model，LLM)成为研究热点，并且开始在各个领域广泛应用。近年来，大语言模型的参数规模不断增大，其模型效果也有了极大的提升，然而，更大的模型意味着更大的计算资源需求，进而意味着更加巨大的能源需求和更多的碳排放。
[0003]目前，针对大语言模型的能耗和碳排优化问题，现有的研究方案大多通过芯片的功耗限制、优化神经网络模型结构或者选用更低能耗更高效率的处理器等方式来降低计算能耗，但现有的研究方案大多未深入研究大语言模型在GPU上进行预训练时的低碳优化调控策略。
[0004]因此，亟需为大语言模型提供更优的碳减排方案。

技术实现思路

[0005]本申请的多个方面提供一种针对大语言模型的资源优化和碳减排方法及设备，用以通过对GPU资源的优化调控，更好地降低大语言模型预训练所产生的碳排放量。
[0006]本申请实施例提供一种针对大语言模型的资源优化和碳减排方法，包括：为待处理的大语言模型，选定用于开展预训练的时间区间；基于所述时间区间内动态变化的碳排放强度，为所述大语言模型确定在所述时间区间内的预训练起止时间节点以及预训练期间的各个时间节点下的GPU资源量调控参数值，以使所述大语言模型在所述时间区间内对应的预训练碳排放预估总量达到指定要求；按照所述预训练...

【技术保护点】

【技术特征摘要】
1.一种针对大语言模型的资源优化和碳减排方法，包括：为待处理的大语言模型，选定用于开展预训练的时间区间；基于所述时间区间内动态变化的碳排放强度，为所述大语言模型确定在所述时间区间内的预训练起止时间节点以及预训练期间的GPU资源量调控参数值，以使所述大语言模型在所述时间区间内对应的预训练碳排放预估总量达到指定要求达到指定要求；按照所述预训练起止时间节点以及所述各个GPU资源量调控参数值，在所述时间区间内动态调控用于对所述大语言模型进行预训练的GPU资源量。2.根据权利要求1所述的方法，基于所述时间区间内动态变化的碳排放强度，为所述大语言模型确定在所述时间区间内的预训练起止时间节点以及预训练期间的各个时间节点下的GPU资源量调控参数值，包括：以所述大语言模型在所述时间区间内对应的预训练碳排放预估总量达到指定要求为目标，构建目标函数，其中，所述目标函数中以所述时间区间内单个时间节点下碳排放强度和能耗总量的乘积表征对应时间节点下的碳排放预估量，且单个时间节点下的能耗总量以GPU资源量调控参数和用于表征预训练起止时间节点的参数作为影响因子；求解所述目标函数，以确定所述预训练起止时间节点以及所述各个GPU资源量调控参数值。3.根据权利要求2所述的方法，所述GPU资源量调控参数包括GPU并行度，以所述大语言模型在所述时间区间内对应的预训练碳排放预估总量达到指定要求为目标，构建目标函数，包括：获取单个GPU处于运行状态时在单个时间节点下所导致的第一能耗值以及单个GPU处于空闲状态时在单个时间节点下所导致的第二能耗值；基于单个时间节点下的GPU并行度、所述第一能耗值及所述第二能耗值，对所述时间区间中相应时间节点下GPU所导致的能耗量进行表征；结合用于表征预训练起止时间节点的参数以及表征出的单个时间节点下GPU所导致的能耗量，对相应时间节点下的能耗总量进行表征，以构建出所述目标函数。4.根据权利要求3所述的方法，所述目标函数表征为：其中，表示t时间节点的碳排放强度，表示t时间节点下的GPU并行度，表示所述第一能耗值，表示GPU处于运行状态时在单个时间节点下的自身能耗值，则表示一个GPU处于运行状态时在其所处服务器上的其他部分所导致的单个时间节点的能耗值；表示t时间节点下空闲的GPU数量，N为GPU总数目，相应地，表示所述第二能耗值，表示GPU处于空闲状态时在单个时间节点下的自身能耗值，则表示一个GPU处于空闲状态时在其所处服务器上的其他部分所导致的单个时间节点的能耗值；和为用于表征预训练起止时间节点的参数，其中，表示t时间节点是否处于预训练期间，表示t时间节点是否因预训练开始而导致发生服务器开机事件，
表示...

【专利技术属性】
技术研发人员：闫月君，王朝阳，刘文宇，
申请(专利权)人：阿里云计算有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人