基于制造技术

技术编号：39497576 阅读：5 留言：0更新日期：2023-11-24 11:27

本发明专利技术涉及虚拟数字人技术领域，更具体地说是一种基于

全部详细技术资料下载

【技术实现步骤摘要】
基于LLM语言大模型的虚拟数字人交互系统

[0001]本专利技术涉及虚拟数字人
，更具体地说是一种基于
LLM
语言大模型的虚拟数字人交互系统
。

技术介绍

[0002]LLM
语言大模型是一种人工智能模型，旨在理解和生成人类语言，它们在大量的文本数据上进行训练，可以执行广泛的任务，包括文本总结
、
翻译
、
情感分析等等，
LLM
的特点是规模庞大，包含数十亿的参数，帮助它们学习语言数据中的复杂模式
。
[0003]例如
GPT
模型以
LLM
语言大模型作为基础设计，通过
GPT
模型能够帮助我们大大减少检索时间，更快速的获取想要知道的答案，并且能够实现灵活对话；但是目前的模型呈现的形式主要为文字，在实际应用中，例如多人学习会议
、
网络直播等形式时，依靠文字进行答案输出存在一定的不便性，无法灵活生动的实现教学或者网络直播，让观看者更容易接受；因此，本专利技术提出一种基于
LLM
语言大模型的虚拟数字人交互系统，通过虚拟人与使用者进行直接对话，提升用户的使用感受，同时让用户更容易了解相关的知识
。

技术实现思路

[0004]本专利技术提供基于
LLM
语言大模型的虚拟数字人交互系统，通过构建数字虚拟人与用户进行直接对话，以解决现有语言模型主要以文字的形式进行对话，使用场景存在局限性等问题
>。
[0005]本专利技术具体的技术方案如下：
[0006]基于
LLM
语言大模型的虚拟数字人交互系统，交互系统包括：
[0007]连接单元，所述连接单元用于与
LLM
语言大模型进行数据联系，获取
LLM
语言大模型输出的结果；
[0008]图像生成单元，所述图像生成单元基于第三方软件自动生成虚拟人图像，供用户进行观看；
[0009]VC
语音文字转换单元，所述
VC
语音文字转换单元用于将
LLM
语言大模型生成的文字转换为语音，或者将用于语音转换为文字通过
LLM
语言大模型进行检索；
[0010]表情适配单元，所述表情适配单元包括摄像头，通过用户的表情自动调整相应的虚拟人表情
。
[0011]作为本方案的进一步改进，所述连接单元通过
API
接口与
LLM
语言大模型构建信息联系
。
[0012]作为本方案的进一步改进，所述图像生成单元包括信息录入
、
性格选择
、
兴趣爱好等子单元，用户在图像生成单元能够根据自身情况输入相关数据，用于生成数字虚拟人形象
。
[0013]作为本方案的进一步改进，所述图像生成单元基于
3D
建模软件进行建模，人物的形象特点基于
LLM
语言大模型检索的答案进行生成
。
[0014]作为本方案的进一步改进，所述表情设配单元通过摄像头能够检索用户的表情，进而根据用户表情实时动态调整数字虚拟人的表情
。
[0015]作为本方案的进一步改进，所述表情适配单元中的表情图库来源与
LLM
语言大模型检索，以及开发者提前录入两个途径
。
[0016]与现有技术相比，本专利技术具有如下有益效果：
[0017]1、
本专利技术通过用户将自己的信息以及需求输入完成后，图像生成单元能够甘菊输入的数据通过
API
接口将信息输送至
LLM
语言大模型中，大模型将根据输入的数据检索相关的结果，例如活跃型
、
独立型等性格，从而将相关的数据结果通过连接单元再次发送到图像生成单元中，然后图像生成单元根据数据结果进行建模，例如活跃型同样也喜欢活跃型性格的人，因为图像生成单元会生成一个同样活跃型的数字虚拟人，使得更贴合用户的性格，提升用户体验
。
[0018]2、
本专利技术通过虚拟人能够根据表情适配单元对用户的表情进行分析，然后将表情因素输入到图像生成单元中，图像生成单元根据表情因素然后生成相匹配的单元，进而避免因用户心情不好而加剧用户感受，同时降低用户的不良体验，通过虚拟人配合用户的面部表情能够更加直观的适应当时用户的心情
。
附图说明
[0019]图1是本专利技术智虚拟人交互系统流程图
。
具体实施方式
[0020]下面结合附图和实施例对本专利技术的实施方式作进一步详细描述
。
以下实施例用于说明本专利技术，但不能用来限制本专利技术的范围
。
[0021]本实施例中，如图1所示，基于
LLM
语言大模型的虚拟数字人交互系统，交互系统包括：
[0022]连接单元，所述连接单元用于与
LLM
语言大模型进行数据联系，获取
LLM
语言大模型输出的结果；
[0023]图像生成单元，所述图像生成单元基于第三方软件自动生成虚拟人图像，供用户进行观看；
[0024]VC
语音文字转换单元，所述
VC
语音文字转换单元用于将
LLM
语言大模型生成的文字转换为语音，或者将用于语音转换为文字通过
LLM
语言大模型进行检索；
[0025]表情适配单元，所述表情适配单元包括摄像头，通过用户的表情自动调整相应的虚拟人表情
。
[0026]实施例：
[0027]首先，开发者通过交互系统中的连接单元通过
API
接口与
LLM
语言语言大模型建立信息联系，建立一个可以与用户便捷沟通的数字虚拟人系统软件，该软件可安装在电脑
、
平板
、
手机等智能终端上，用户首先通过软件进行注册，注册过程中会获取用户的摄像头权限，以及语音通话权限，当用户这些权限都授予后；软件界面会跳出一些关于年龄
、
性格选择
、
兴趣爱好等选项，供用户进行选择，当用户将自己的信息以及需求输入完成后，这些选项被录入到连接单元后，将通过
API
接口将信息输送至
LLM
语言大模型中，大模型将根据输
入的数据检索相关的结果，例如活跃型
、
独立型等性格，从而将相关的数据结果通过连接单元再次发送到图像生成单元中，然后图像生成单元根据数据结果进行建模，例如活跃型同样也喜欢活跃型性格的人，因为图像生成单元会生成一个同样活跃型的数字虚拟人，使得更贴合用户的性格，提升用户体验
。
[0028]需要说明的是：
LLM
语言大模型以
GPT
模型为主要检索工具；图像本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
基于
LLM
语言大模型的虚拟数字人交互系统，其特征在于，交互系统包括：连接单元，所述连接单元用于与
LLM
语言大模型进行数据联系，获取
LLM
语言大模型输出的结果；图像生成单元，所述图像生成单元基于第三方软件自动生成虚拟人图像，供用户进行观看；
VC
语音文字转换单元，所述
VC
语音文字转换单元用于将
LLM
语言大模型生成的文字转换为语音，或者将用于语音转换为文字通过
LLM
语言大模型进行检索；表情适配单元，所述表情适配单元包括摄像头，通过用户的表情自动调整相应的虚拟人表情
。2.
如权利要求1所述融合人工智能和知识图谱技术的智慧档案构建方法，其特征在于：所述连接单元通过
API
接口与
LLM
语言大模型构建信息联系
。3.
如权利要求1所述...

【专利技术属性】
技术研发人员：周健，徐栋梁，
申请(专利权)人：沨呵智慧科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人