一种模型推理方法、系统、设备及计算机可读存储介质技术方案

技术编号：43948598 阅读：18 留言：0更新日期：2025-01-07 21:36

本申请公开了一种模型推理方法、系统、设备及计算机可读存储介质，涉及人工智能技术领域，确定大语言模型中的各个中间层；筛选出满足跳过条件的中间层作为候选层；生成大语言模型跳过候选层进行推理的推理信息；根据推理信息，从候选层中筛选出目标层；获取待处理文本；将待处理文本输入跳过目标层的大语言模型，得到候选序列；将待处理文本和候选序列输入大语言模型，得到目标推理结果。本申请使得目标层能够与大语言模型进行推理的推理信息相适配，提高了大语言模型的推理准确度；且实现了借助大语言模型自身来进行投机采样，无需引入其他模型，易于实施，从而提高了大语言模型的推理速度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，更具体地说，涉及一种模型推理方法、系统、设备及计算机可读存储介质。

技术介绍

1、大语言模型（large language model，llm）指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。然而，大语言模型受限于结构等因素，存在推理速度慢、不准确的情况，影响用户对大语言模型的应用体验。

2、综上所述，如何提高大语言模型的推理速度和准确度是目前本领域技术人员亟待解决的问题。

技术实现思路

1、本申请的目的是提供一种模型推理方法，其能在一定程度上解决如何提高大语言模型的推理速度和准确度的技术问题。本申请还提供了一种模型推理系统、电子设备及计算机可读存储介质。

2、为了实现上述目的，本申请提供如下技术方案：

3、一种模型推理方法，包括：

4、确定大语言模型中的各个中间层；

5、筛选出满足跳过条件的中间层作为候选层；

6、生成大语言模型跳过候选层进行推理的推理信息；

7、根据推理信本文档来自技高网...

【技术保护点】

1.一种模型推理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述筛选出满足跳过条件的中间层作为候选层，包括：

3.根据权利要求2所述的方法，其特征在于，所述生成大语言模型跳过候选层进行推理的推理信息，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一输出分布、所述第二输出分布和所述推理时间，生成推理信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据推理信息，从候选层中筛选出目标层，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据最大累积值对应的候选组确定目标层，包括...

【技术特征摘要】

1.一种模型推理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述筛选出满足跳过条件的中间层作为候选层，包括：

3.根据权利要求2所述的方法，其特征在于，所述生成大语言模型跳过候选层进行推理的推理信息，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一输出分布、所述第二输出分布和所述推理时间，生成推理信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据推理信息，从候选层中筛选出目标层，包括：

【专利技术属性】
技术研发人员：刘吉，张天乐，
申请(专利权)人：杭州同顺传媒科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人