大型语音模型的操作方法、计算设备及存储介质技术

技术编号：43102707 阅读：18 留言：0更新日期：2024-10-26 09:46

本公开提出了一种LLM的操作方法、计算设备及存储介质。该操作方法包括：获取所述LLM针对第一输入的第一输出，所述第一输入基于第一查询和分类提示语构造；使用所述第一查询和所述第一输出构造第二输入；将所述第二输入作为输入送入分类模型；以及获取所述分类模型针对所述第二输入的分类结果，作为所述LLM针对所述第一查询的分类结果。通过使用在LLM后串接一个分类模型，并将原始查询与LLM的输出拼接送入分类模型进行分类的流水线结构，实现了针对原始查询的标准分类，解决了LLM输出多样性以及人工构造提示所带来的不确定性导致的LLM分类不准确的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能领域，尤其涉及一种大型语音模型的操作方法、计算设备及存储介质。

技术介绍

1、大型语言模型(large language model，llm)是指那些参数规模庞大的自然语言处理(natural language processing，nlp)模型。

2、llm在nlp任务中取得了显著的进展并广泛应用于各类对话系统。对话系统通常需要执行各种分类任务，但llm的推理结果通常无法符合特定模式，导致无法准确识别对应任务类别，从而降低对话系统的使用体验。

技术实现思路

1、根据本公开的第一方面，提出了一种llm的操作方法，包括：获取所述llm针对第一输入的第一输出，所述第一输入基于第一查询和分类提示语构造；使用所述第一查询和所述第一输出构造第二输入；将所述第二输入作为输入送入分类模型；以及获取所述分类模型针对所述第二输入的分类结果，作为所述llm针对所述第一查询的分类结果。

2、可选地，使用所述第一查询和所述第一输出构造第二输入包括：使用分隔符拼接所述第一查...

【技术保护点】

1.一种大型语言模型(LLM)的操作方法，包括：

2.根据权利要求1所述的方法，其中，使用所述第一查询和所述第一输出构造第二输入包括：

3.根据权利要求1所述的方法，还包括在获取所述LLM针对第一输入的第一输出之前：

4.根据权利要求3所述的方法，其中，获取所述LLM针对第一输入的第一输出包括：

5.根据权利要求3所述的方法，其中，所述分类模型是利用文本进行过预训练的分类模型，并且，所述方法还包括：

6.根据权利要求5所述的方法，其中，使用至少部分相同的数据内容构造所述LLM微调任务数据集和所述分类模型调整任务数据集，其中，针对...

【技术特征摘要】

1.一种大型语言模型(llm)的操作方法，包括：

2.根据权利要求1所述的方法，其中，使用所述第一查询和所述第一输出构造第二输入包括：

3.根据权利要求1所述的方法，还包括在获取所述llm针对第一输入的第一输出之前：

4.根据权利要求3所述的方法，其中，获取所述llm针对第一输入的第一输出包括：

5.根据权利要求3所述的方法，其中，所述分类模型是利用文本进行过预训练的分类模型，并且，所述方法还包括：

6.根据权利要求5所述的方法，其中，使用至少部分相同的数据内容构造所述llm微调...

【专利技术属性】
技术研发人员：安旭，
申请(专利权)人：武汉星纪魅族科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人