一种采用大模型增强虚拟数字人对话系统技术方案

技术编号：41560269 阅读：38 留言：0更新日期：2024-06-06 23:44

本发明专利技术涉及一种采用大模型增强虚拟数字人对话系统，包括控制器子系统、SPARK子系统和大模型子系统，所述控制器子系统包括语音模块和Launcher模块，所述语音模块用于集成了语音识别和语音唤醒功能，实时获取交互人的语音的数据信息，所述Launcher模块用于输出交互人的反馈语音的数据信息；所述SPARK子系统包括输入模块和输出模块，所述输入模块与所述语音模块连接用于接收交互人的语音的数据信息。本发明专利技术不仅可以增强虚拟数字人在多轮对话中的连贯性和适应性，有助于上下文的理解，实现连贯的多轮对话，而且可以提高虚拟数字人回复的通顺性及多样性，能够更好地理解和回应乘客的需求，更接近真实人类的交流方式。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人机交互，尤其是涉及一种采用大模型增强虚拟数字人对话系统。

技术介绍

1、人工智能大家并不陌生，在发展过程中，也有一些语言模型的研究，但这些模型往往只能处理一些简单的语言任务，无法和人类进行自然的交流，通常答非所问，达不到人机交互的基本要求，如何实现人机交互的进一步发展成为我们亟待解决的问题。

2、现有技术中，专利(申请号：202311701121.4)公开了采用chatgpt和虚幻引擎增强metahuman数字人对话效果的方法及系统，包括以下步骤：s1、创建metahuman数字人模型，将其导入虚幻引擎项目，使用虚幻引擎的动画蓝图调整和创建所需的动作和表情；s2、在虚幻引擎项目中创建用户界面，通过虚幻引擎蓝图程序接收用户多模态输入的问题，并将其转换为文本发送至虚幻引擎后台；s3、调用chatgpt获取文本形式问题的答案，检查答案合法性后，利用算法对正常答案进行分段，并生成语音文件，保存并记录生成的语音文件地址及用户反馈；s4、在用户界面上展示文本对话，同时使用varest插件解析语音文件地址，并将其添加到流媒...

【技术保护点】

1.一种采用大模型增强虚拟数字人对话系统，包括控制器子系统、SPARK子系统和大模型子系统，其特征在于，

2.根据权利要求1所述的采用大模型增强虚拟数字人对话系统，其特征在于，所述构建交互人语音反馈大模型，对交互人的语音的数据信息进行反馈包括：

3.根据权利要求2所述的采用大模型增强虚拟数字人对话系统，其特征在于，在步骤M2中，所述语音反馈调节因子α和β的约束条件为，

4.根据权利要求2所述的采用大模型增强虚拟数字人对话系统，其特征在于：所述语音反馈调节因子α为，

5.根据权利要求2所述的采用大模型增强虚拟数字人对话系统，其特征在于：所述交...

【技术特征摘要】

1.一种采用大模型增强虚拟数字人对话系统，包括控制器子系统、spark子系统和大模型子系统，其特征在于，

3.根据权利要求2所述的采用大模型增强虚拟数字人对话系统，其特征在于，在步骤m2中，所述语音反馈调节因子α和β的约束条件为，

4.根据权利要求2所述的采用大模型增强虚拟数字人对话系统，其特征在于：所述语音反馈调节因子α为，

5.根据权利要求2所述的采用大模型增强虚拟数字人对话系统，其特征在于：所述交互人语音反馈大模型包括语音输入层、交互人语音反馈函数层和语音反馈层，所述语音反馈层与所述交互人语音反馈函数层连接，所述交互人语音反馈函数层与所述语音输入层连接。

6.根据权利要求3所述的采用大模型增强虚拟数字人对话系统，其特征在于：所述交互人语音输入层用于采用语音模糊数据增强算法对输入的...

【专利技术属性】
技术研发人员：江丰年，蔡营，
申请(专利权)人：东风悦享科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人