信息处理方法、装置及电子设备和存储介质制造方法及图纸

技术编号:41533729 阅读:18 留言:0更新日期:2024-06-03 23:11
本申请实施例公开了一种信息处理方法、装置及电子设备和存储介质,本申请在需要加载大模型时,读取大模型的至少部分原始参数;基于设备资源的被占用情况确定上述至少部分原始参数中的目标原始参数的量化位数,并基于该量化位数对目标原始参数进行量化,得到量化后的目标参数;基于量化后目标参数加载大模型。

【技术实现步骤摘要】

本申请涉及人工智能,更具体地说,涉及一种信息处理方法、装置及电子设备和存储介质


技术介绍

1、大模型(large model,lm)通常指的是包含超大规模参数的神经网络模型,如自然语言处理领域中的大语言模型、transformer、bert等模型。大模型的出现使得计算机能够更好地理解和处理大规模数据,并在各种复杂任务中表现出色。

2、随着大模型性能不断提升,能帮助用户解决越来越多的问题,考虑到用户隐私问题,更多的大模型需要移植到端侧设备进行部署。但是,由于端侧设备存在内存和计算能力受限等问题,将大模型部署到端侧设备后容易出现设备无法正常运行或者设备卡死的问题。


技术实现思路

1、本申请的目的是提供一种信息处理方法、装置及电子设备和存储介质,包括如下技术方案:

2、一种信息处理方法,所述方法包括:

3、读取大模型的至少部分原始参数;

4、基于设备资源的被占用信息确定所述至少部分原始参数中目标原始参数的量化位数;

5、基于所述目标原始参数的量化位数对所本文档来自技高网...

【技术保护点】

1.一种信息处理方法,所述方法包括:

2.根据权利要求1所述的方法,在读取大模型的至少部分原始参数之前,还包括:

3.根据权利要求2所述的方法,所述根据所述设备资源的被占用信息确定所述所有原始参数中的目标原始参数,以及确定所述目标原始参数的量化位数,包括:

4.根据权利要求1所述的方法,还包括:在运行所述大模型的过程中,监测所述设备资源的被占用信息;

5.根据权利要求4所述的方法,还包括:

6.根据权利要求1所述的方法,所述设备资源的被占用信息包括:所述设备资源的占用率;

7.根据权利要求1所述的方法,所述目标原始参...

【技术特征摘要】

1.一种信息处理方法,所述方法包括:

2.根据权利要求1所述的方法,在读取大模型的至少部分原始参数之前,还包括:

3.根据权利要求2所述的方法,所述根据所述设备资源的被占用信息确定所述所有原始参数中的目标原始参数,以及确定所述目标原始参数的量化位数,包括:

4.根据权利要求1所述的方法,还包括:在运行所述大模型的过程中,监测所述设备资源的被占用信息;

...

【专利技术属性】
技术研发人员:魏闪闪张翱翔
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1