基于大模型的人机交互方法技术

技术编号：39856176 阅读：8 留言：0更新日期：2023-12-30 12:53

本申请涉及一种基于大模型的人机交互方法

全部详细技术资料下载

【技术实现步骤摘要】
基于大模型的人机交互方法、装置、电子设备及存储介质

[0001]本申请涉及人机交互
，特别是涉及一种基于大模型的人机交互方法
、
装置
、
电子设备及存储介质
。

技术介绍

[0002]大语言模型（
LLM
）简称大模型，是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义
。
其中，遵循指令的大语言模型，如
ChatGPT
，因其在指令理解和文本生成方面的显著成功而受到了重视
。
这些大语言模型首先进行预训练，然后微调（
FineTune
）以对齐人类指令
。
大语言模型在各种自然语言处理（
NLP
）任务上表现出强大的性能，显示出大语言模型作为各种自然语言理解
、
文本生成和对话式人工智能问题的统一解决方案的潜力
。
[0003]但是，在一些特定的场景下（例如医疗问诊场景），经常需要模拟医生和患者之间进行多轮的问答，对一个回复进行深究，而现有的大语言模型中采用的数据集更加偏向于医疗知识问答，只能够实现简单的单轮对话功能，无法进行多轮有效对话，难以更好地模拟医疗问诊等需要进行多轮对话的场景
。
[0004]针对相关技术中存在的大语言模型难以适应多轮对话场景的问题，目前还没有提出有效的解决方案
。

技术实现思路

[0005]在本实施例中提供了一种基于大模型的人机交

【技术保护点】

【技术特征摘要】
1.
一种基于大模型的人机交互方法，其特征在于，包括以下步骤：利用语言处理工具对抗生成多轮对话数据集；其中，所述语言处理工具用于响应前续对话语句生成后续对话语句；将所述多轮对话数据集作为样本数据，对初始大语言模型进行微调，得到目标大语言模型；通过所述目标大语言模型对目标语句进行意图分类，得到意图分类结果，根据意图分类结果生成所述目标语句的回复内容
。2.
根据权利要求1所述的基于大模型的人机交互方法，其特征在于，所述利用语言处理工具对抗生成多轮对话数据集包括：设定多轮对话的对话流程和至少两个对话角色；根据所述对话流程，通过所述语言处理工具交替模拟至少两个所述对话角色进行多轮对话，生成所述多轮对话数据集
。3.
根据权利要求1所述的基于大模型的人机交互方法，其特征在于，所述根据意图分类结果生成所述目标语句的回复内容包括：在预先构建的知识库中检索与所述意图分类结果相关的目标知识内容；根据所述目标知识内容生成所述目标语句的回复内容
。4.
根据权利要求3所述的基于大模型的人机交互方法，其特征在于，所述知识库的构建方法包括：获取知识内容；分别根据所述知识内容的关键词生成自身的内容标识，所述内容标识包括意图类型；基于所述知识内容以及所述内容标识，确定所述知识库
。5.
根据权利要求4所述的基于大模型的人机交互方法，其特征在于，所述在预先构建的知识库中检索与所述意图分类结果相关的目标知识内容包括：在所述知识库中检索与所述意图分类结果相匹配的目标内容标识；根据所述目标内容标识，确定所述目标知识...

【专利技术属性】
技术研发人员：房洁，
申请(专利权)人：安徽十锎信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人