大型语音模型的操作方法、计算设备及存储介质技术

技术编号:43102707 阅读:18 留言:0更新日期:2024-10-26 09:46
本公开提出了一种LLM的操作方法、计算设备及存储介质。该操作方法包括:获取所述LLM针对第一输入的第一输出,所述第一输入基于第一查询和分类提示语构造;使用所述第一查询和所述第一输出构造第二输入;将所述第二输入作为输入送入分类模型;以及获取所述分类模型针对所述第二输入的分类结果,作为所述LLM针对所述第一查询的分类结果。通过使用在LLM后串接一个分类模型,并将原始查询与LLM的输出拼接送入分类模型进行分类的流水线结构,实现了针对原始查询的标准分类,解决了LLM输出多样性以及人工构造提示所带来的不确定性导致的LLM分类不准确的问题。

【技术实现步骤摘要】

本公开涉及人工智能领域,尤其涉及一种大型语音模型的操作方法、计算设备及存储介质


技术介绍

1、大型语言模型(large language model,llm)是指那些参数规模庞大的自然语言处理(natural language processing,nlp)模型。

2、llm在nlp任务中取得了显著的进展并广泛应用于各类对话系统。对话系统通常需要执行各种分类任务,但llm的推理结果通常无法符合特定模式,导致无法准确识别对应任务类别,从而降低对话系统的使用体验。


技术实现思路

1、根据本公开的第一方面,提出了一种llm的操作方法,包括:获取所述llm针对第一输入的第一输出,所述第一输入基于第一查询和分类提示语构造;使用所述第一查询和所述第一输出构造第二输入;将所述第二输入作为输入送入分类模型;以及获取所述分类模型针对所述第二输入的分类结果,作为所述llm针对所述第一查询的分类结果。

2、可选地,使用所述第一查询和所述第一输出构造第二输入包括:使用分隔符拼接所述第一查询和所述第一输出;以本文档来自技高网...

【技术保护点】

1.一种大型语言模型(LLM)的操作方法,包括:

2.根据权利要求1所述的方法,其中,使用所述第一查询和所述第一输出构造第二输入包括:

3.根据权利要求1所述的方法,还包括在获取所述LLM针对第一输入的第一输出之前:

4.根据权利要求3所述的方法,其中,获取所述LLM针对第一输入的第一输出包括:

5.根据权利要求3所述的方法,其中,所述分类模型是利用文本进行过预训练的分类模型,并且,所述方法还包括:

6.根据权利要求5所述的方法,其中,使用至少部分相同的数据内容构造所述LLM微调任务数据集和所述分类模型调整任务数据集,其中,针对...

【技术特征摘要】

1.一种大型语言模型(llm)的操作方法,包括:

2.根据权利要求1所述的方法,其中,使用所述第一查询和所述第一输出构造第二输入包括:

3.根据权利要求1所述的方法,还包括在获取所述llm针对第一输入的第一输出之前:

4.根据权利要求3所述的方法,其中,获取所述llm针对第一输入的第一输出包括:

5.根据权利要求3所述的方法,其中,所述分类模型是利用文本进行过预训练的分类模型,并且,所述方法还包括:

6.根据权利要求5所述的方法,其中,使用至少部分相同的数据内容构造所述llm微调...

【专利技术属性】
技术研发人员:安旭
申请(专利权)人:武汉星纪魅族科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1