一种基于语音识别的VR交互系统和方法技术方案

技术编号：23534134 阅读：33 留言：0更新日期：2020-03-20 08:12

本发明专利技术涉及语音识别系统的相关领域，公开了一种基于语音识别的VR交互系统，包括云端和VR外设端，云端包括语音识别模块、语义识别模块、场景处理模块、存储模块和通信模块，VR外设端包括显示器模块、语音输入模块和语音输入模块，VR外设端也包括通信模块，本发明专利技术还公开了一种基于语音识别的VR交互系统的方法，包括如下方法步骤：构建知识库对话库；开启云端和VR外设端；用户佩戴VR外设；用户输入；云端处理。本发明专利技术有效改善目前现有VR产品交互性差，抽离感强的不足，实现人和虚拟场景人物更自然的交互体验。

A VR interactive system and method based on speech recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语音识别的VR交互系统和方法
本专利技术涉及语音识别系统的相关领域，具体为一种基于语音识别的VR交互系统和方法。
技术介绍
VR，简称虚拟现实技术，虚拟现实技术是仿真技术的一个重要方向是仿真技术与计算机图形学人机接口技术多媒体技术传感技术网络技术等多种技术的集合是一门富有挑战性的交叉技术前沿学科和研究领域。虚拟现实技术(VR)主要包括模拟环境、感知、自然技能和传感设备等方面。模拟环境是由计算机生成的、实时动态的三维立体逼真图像。感知是指理想的VR应该具有一切人所具有的感知。除计算机图形技术所生成的视觉感知外，还有听觉、触觉、力觉、运动等感知，甚至还包括嗅觉和味觉等，也称为多感知。自然技能是指人的头部转动，眼睛、手势、或其他人体行为动作，由计算机来处理与参与者的动作相适应的数据，并对用户的输入作出实时响应，并分别反馈到用户的五官。传感设备是指三维交互设备。虚拟现实是由美国vpl公司创建人拉尼尔在20世纪80年代初提出的。其具体内涵是：综合利用计算机图形系统和各种现实及控制等接口设备，在计算机上生成的、可交互的三维环境中提供沉浸感觉的技术。其中，计算机生成的、可交互的三维环境成为虚拟环境，虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统它利用计算机生成一种模拟多源信息融合的交互式的三维动态视景和实体行为的系统仿真使用户沉浸到该环境中。VR技术在医疗，教育，房地产，设计方面都有广阔的前景。目前VR的交互技术主要还是靠动作捕捉，手势识别，用户的体验性并不好，所以在此情况下，语音交互就成为一个用...

【技术保护点】
1.一种基于语音识别的VR交互系统，其特征在于：包括云端(1)和VR外设端(2)，所述云端(1)包括语音识别模块(3)、语义识别模块(4)、场景处理模块(5)、存储模块(6)和通信模块，所述VR外设端(2)包括显示器模块(7)、语音输入模块(8)和语音输入模块(8)，所述VR外设端(2)也包括通信模块；/n所述语音识别模块(3)主要对用户的语音先进行初步的处理，即在语音输入模块(8)的基础上，通过降噪去混响方式提取语音特征，然后通过基于深度学习的算法进行语音模型的生成和检验，这一部分用到很多算法和处理工具，语音识别模块(3)和语义识别模块(4)相连；/n所述语义识别模块(4)在语音识别模块(3)的基础上再次进行语义处理，并且推断出用户意图，这一部分需要根据结合上下文进行分析，来提高准确性，语义识别模块(4)和场景处理模块(5)相连；/n所述场景处理模块(5)分析语义识别模块(4)的识别的结果，根据结果，调整场景的布局变换，并且通过显示器模块(7)输出结果，这需要该模块调用存储模块(6)中的知识库进行相关的处理，场景处理模块(5)和存储模块(6)以及显示器模块(7)相连；/n所述存储模块...

【技术特征摘要】
1.一种基于语音识别的VR交互系统，其特征在于：包括云端(1)和VR外设端(2)，所述云端(1)包括语音识别模块(3)、语义识别模块(4)、场景处理模块(5)、存储模块(6)和通信模块，所述VR外设端(2)包括显示器模块(7)、语音输入模块(8)和语音输入模块(8)，所述VR外设端(2)也包括通信模块；
所述语音识别模块(3)主要对用户的语音先进行初步的处理，即在语音输入模块(8)的基础上，通过降噪去混响方式提取语音特征，然后通过基于深度学习的算法进行语音模型的生成和检验，这一部分用到很多算法和处理工具，语音识别模块(3)和语义识别模块(4)相连；
所述语义识别模块(4)在语音识别模块(3)的基础上再次进行语义处理，并且推断出用户意图，这一部分需要根据结合上下文进行分析，来提高准确性，语义识别模块(4)和场景处理模块(5)相连；
所述场景处理模块(5)分析语义识别模块(4)的识别的结果，根据结果，调整场景的布局变换，并且通过显示器模块(7)输出结果，这需要该模块调用存储模块(6)中的知识库进行相关的处理，场景处理模块(5)和存储模块(6)以及显示器模块(7)相连；
所述存储模块(6)用于存储知识库和对话库，场景处理模块(5)根据前一步的结果，将调用存储在存存储模块(6)的所需的对话库知识库输出，对话库通过语音输出模块(9)输出，知识库通过显示器模块(7)进行输出；
所述语音输入模块(8)包括一些音频输入设备，语音输入模块(8)和语音输出模块(9)相连；
所述语音输出模块(9)将存储模块(6)中的结果进行语音输出；
所述通信模块负责外设间的通信。

2.根据权利要求1所述的一种基于语音识...

【专利技术属性】
技术研发人员：刘雨松，
申请(专利权)人：苏州意能通信息技术有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人