基于人工智能的虚拟现实人机交互方法及系统技术方案

技术编号：39802573 阅读：8 留言：0更新日期：2023-12-22 02:33

本发明专利技术公开了一种基于人工智能的虚拟现实人机交互方法及系统，涉及虚拟现实技术领域，其通过在采集到用户输入的数字人语音控制信号后，在后端将该语音控制信号转化为语音控制文本，并引入语义理解和处理技术来进行语音控制文本的语义识别，以此来生成数字人动作控制指令，这样，能够实现用户通过语音发送指令，数字角色能够根据指令做出相应的动作和对话效果，增强了虚拟现实体验的沉浸感和真实感

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的虚拟现实人机交互方法及系统

[0001]本申请涉及虚拟现实
，且更为具体地，涉及一种基于人工智能的虚拟现实人机交互方法及系统
。

技术介绍

[0002] 虚拟现实（
Virtual Reality
，简称
VR
）是一种通过计算机生成的模拟环境，用户可以身临其境地感受和交互其中
。
虚拟现实人机交互是指通过虚拟现实技术实现人与计算机之间的交互，其目标是提供一种沉浸式
、
自然而直观的交互体验，使用户能够以更加自然的方式与虚拟环境进行交互和操作
。
传统的人机交互方式，如键盘
、
鼠标和触摸屏等，对于虚拟现实环境来说不够直观和自然
。
因此，虚拟现实人机交互致力于开发更加智能
、
自适应的交互方式，使用户能够通过自己的身体动作
、
语音
、
手势等与虚拟环境进行交互
。
[0003]在虚拟现实人机交互过程中，语音控制成为一种重要的交互方式
。
通过语音指令，用户可以与虚拟现实环境中的数字角色进行沟通和互动
。
这需要将用户的语音输入转化为可理解的指令，并使得数字角色能够根据指令做出相应的动作和对话效果
。
[0004]然而，现有的虚拟现实人机交互方案中，语音识别技术在识别用户的语音指令时可能存在误解或错误，这可能导致数字角色无法正确理解用户的意图，从而无法做出正确的动作和

【技术保护点】

【技术特征摘要】
1.
一种基于人工智能的虚拟现实人机交互方法，其特征在于，包括：获取由用户输入的数字人语音控制信号；对所述数字人语音控制信号进行语义识别以得到语音控制文本；对所述语音控制文本进行语义编码以得到语音控制文本语义理解特征，其包括：将所述语音控制文本通过基于
AIGC
模型的语义信息补偿器以得到补偿优化语音控制文本；对所述补偿优化语音控制文本进行分词处理后通过包含词嵌入层的语义编码器以得到语音控制文本语义理解特征向量作为所述语音控制文本语义理解特征；基于所述语音控制文本语义理解特征，生成数字人动作控制指令
。2.
根据权利要求1所述的基于人工智能的虚拟现实人机交互方法，其特征在于，对所述补偿优化语音控制文本进行分词处理后通过包含词嵌入层的语义编码器以得到语音控制文本语义理解特征向量作为所述语音控制文本语义理解特征，包括：对所述补偿优化语音控制文本进行分词处理以将所述补偿优化语音控制文本转化为由多个词组成的词序列；使用所述包含词嵌入层的语义编码器的嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列；使用所述包含词嵌入层的语义编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量；以及将所述多个全局上下文语义特征向量进行级联以得到所述语音控制文本语义理解特征向量
。3.
根据权利要求2所述的基于人工智能的虚拟现实人机交互方法，其特征在于，基于所述语音控制文本语义理解特征，生成数字人动作控制指令，包括：将所述语音控制文本语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示动作类型标签；以及基于所述分类结果，生成数字人动作控制指令
。4.
根据权利要求3所述的基于人工智能的虚拟现实人机交互方法，其特征在于，还包括训练步骤：用于对所述包含词嵌入层的语义编码器和所述分类器进行训练
。5.
根据权利要求4所述的基于人工智能的虚拟现实人机交互方法，其特征在于，所述训练步骤，包括：获取训练数据，所述训练数据包括由用户输入的训练数字人语音控制信号，以及，所述动作类型标签的真实值；对所述训练数字人语音控制信号...

【专利技术属性】
技术研发人员：郭勇，苑朋飞，靳世凯，赵存喜，
申请(专利权)人：中影年年北京文化传媒有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人