当前位置: 首页 > 专利查询>中南大学专利>正文

一种面向数字健康机器人的大模型微调方法、设备和介质技术

技术编号:45094254 阅读:17 留言:0更新日期:2025-04-25 18:31
本发明专利技术涉及医疗具身机器人技术领域,具体涉及一种面向数字健康机器人的大模型微调方法、设备和介质,所述方法通过对具身大模型预训练的权重矩阵进行随机奇异值分解,并对随机高斯初始化矩阵进行重采样,实现数字健康机器人的具身大模型参数高效微调。本发明专利技术方法在微调数字健康机器人的具身大模型时引入了随机奇异值分解:随机奇异值分解通过引入随机采样来近似计算矩阵的主要成分,从而在保持计算效率的同时,尽可能保留矩阵的关键信息。

【技术实现步骤摘要】

本专利技术涉及医疗具身机器人,具体涉及一种面向数字健康机器人的大模型微调方法、设备和介质


技术介绍

1、随着大模型能力的不断提升, 以及具身智能中示教数据、仿真平台、任务集合的不断完善, 大模型和具身智能的结合将成为人工智能的下一个浪潮。为了让大模型在数字健康机器人上运行并适应具身应用,需要对大模型进行轻量化处理,让大模型在降低模型复杂度的同时保持具身推理和决策中的能力。在大模型直接产生任务规划时依赖模型中编码的知识,由于大模型缺乏具身任务规划的相关知识, 且在具身任务规划时不对大模型参数进行调整, 大模型需要使用额外的反馈模块来对产生的不合理规划进行迭代。为了让大模型实现具身应用,通常需要针对使用场景进行微调, 使其适应于具身智能任务场景。

2、目前,lora是对最常见的大模型轻量级微调技术,对模型参数进行微调,尽可能多的保留大模型自身编码的知识结构。然而,lora和其他类似方法通常采用随机初始化低秩矩阵,可能导致梯度下降过程中的效率低下,同时由于起始点不理想,会降低模型的泛化能力。

3、综上所述,急需一种面向数字健康机器人的大本文档来自技高网...

【技术保护点】

1.一种面向数字健康机器人的大模型微调方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的大模型微调方法,其特征在于,在S2中,对秩为的权重矩阵的近似矩阵,生成一个的随机高斯初始化矩阵,计算第一矩阵;对残差矩阵,生成一个的随机高斯初始化矩阵,计算第二矩阵。

3.根据权利要求2所述的大模型微调方法,其特征在于,在S3中,对第一矩阵进行正交三角分解,表达式如下:

4.根据权利要求3所述的大模型微调方法,其特征在于,在S4中,计算低秩近似矩阵,低秩近似矩阵是一个矩阵,其中,表示矩阵的转置;计算低秩残差矩阵,低秩残差矩阵是一个矩阵。</p>

5.根据...

【技术特征摘要】

1.一种面向数字健康机器人的大模型微调方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的大模型微调方法,其特征在于,在s2中,对秩为的权重矩阵的近似矩阵,生成一个的随机高斯初始化矩阵,计算第一矩阵;对残差矩阵,生成一个的随机高斯初始化矩阵,计算第二矩阵。

3.根据权利要求2所述的大模型微调方法,其特征在于,在s3中,对第一矩阵进行正交三角分解,表达式如下:

4.根据权利要求3所述的大模型微调方法,其特征在于,在s4中,计算低秩近似矩阵,低秩近似矩阵是一个矩阵,其中,表示矩阵的转置;计...

【专利技术属性】
技术研发人员:苏修丁小云吴忠泽龙军
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1