一种基于语音与增强现实环境交互的方法和系统技术方案

技术编号:18591392 阅读:21 留言:0更新日期:2018-08-04 19:57
本申请提供了一种基于语音与增强现实环境交互的方法和系统,所述方法包括,获取用户的语音数据,得到所述语音数据对应的操作指令;根据所述操作指令,对增强现实环境进行处理,显示所述增强现实处理结果。能够通过语音与增强现实环境交互,提高增强现实环境的交互效率。

A method and system based on interaction between speech and augmented reality environment

The present application provides a method and system based on the interaction of voice and augmented reality environment. The method includes obtaining the user's voice data and obtaining the operation instructions corresponding to the speech data, processing the augmented reality environment and displaying the augmented reality processing results according to the operating instructions. It can improve the interaction efficiency of the augmented reality environment through interaction between speech and augmented reality.

【技术实现步骤摘要】
一种基于语音与增强现实环境交互的方法和系统
本申请涉及自动控制领域,尤其涉及一种基于语音与增强现实环境交互的方法和系统。
技术介绍
增强现实技术(AugmentedReality,简称AR),是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术,增强现实技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。随着手机移动设备及手持移动设备的普及,基于移动设备的增强现实(AR环境)越来越被用户所认知。但是,基于移动设备的增强现实环境的互动手段单一,仅支持手势交互或移动设备自带GPS+姿态Sensor能力,使用手势交互或移动设备姿态交互,将增加不必要的动作,影响交互效率。
技术实现思路
本申请的多个方面提供一种基于语音与增强现实环境交互的方法和系统,用于提高增强现实环境的交互效率。本申请的一方面,提供一种基于语音与增强现实环境交互的方法,包括:获取用户的语音数据,得到所述语音数据对应的操作指令;根据所述操作指令,对增强现实环境进行处理,显示所述增强现实处理结果。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,获取用户的语音数据,得到所述语音数据对应的操作指令包括:启动语音监听服务,监听用户的语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的识别文本;对所述识别文本进行语义分析,得到所述识别文本对应的操作指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,对所述识别文本进行语义分析,得到所述识别文本对应的操作指令包括:在预设的操作指令中对所述识别文本进行精确匹配,查找对应的操作指令;和/或,对所述识别文本进行分词处理,生成关键词,查找与所述关键词匹配的操作指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,当所述关键词与至少两个操作指令匹配成功时,根据用户的进一步选择,得到对应的操作指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述增强现实环境包括:预设的增强现实子环境场景;或者,通过对摄像头获取的现实场景进行特征分析得到的增强现实子环境场景。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述操作指令,对增强现实环境进行处理包括:根据所述操作指令,对增强现实子环境场景中的增强现实信息进行对应的增强现实控制操作。本申请的另一方面,提供一种基于语音与增强现实环境交互的系统,包括:操作指令获取模块,用于获取用户的语音数据,得到所述语音数据对应的操作指令;增强现实处理模块,用于根据所述操作指令,对增强现实环境进行增强现实处理,显示所述增强现实处理结果。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述操作指令获取模块,具体包括:语音获取子模块,用于启动用户的语音数据;语音识别子模块,用于对所述语音数据进行语音识别,得到所述语音数据对应的识别文本;语义分析子模块,用于对所述识别文本进行语义分析,得到所述识别文本对应的操作指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语义分析子模块,具体用于:在预设的操作指令中对所述识别文本进行精确匹配,查找对应的操作指令;和/或,对所述识别文本进行分词处理,生成关键词,查找与所述关键词匹配的操作指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语义分析子模块,具体用于:当所述关键词与至少两个操作指令匹配成功时,根据用户的进一步选择,得到对应的操作指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述增强现实环境包括:预设的增强现实子环境场景;或者,通过对摄像头获取的现实场景进行特征分析得到的增强现实子环境场景。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述增强现实处理模块,具体用于:根据所述操作指令,对增强现实子环境场景中的增强现实信息进行对应的增强现实控制操作。本专利技术的另一方面,提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。本专利技术的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。由所述技术方案可知,本申请实施例可以提高增强现实环境的交互效率。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的基于语音与增强现实环境交互的方法的流程示意图;图2为本申请一实施例提供的基于语音与增强现实环境交互的系统的结构示意图;图3示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器012的框图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。图1为本申请一实施例提供的基于语音与增强现实环境交互的方法的示意图,如图1所示,包括以下步骤:步骤S11、获取用户的语音数据,得到所述语音数据对应的操作指令;步骤S12、根据所述操作指令,对增强现实环境进行处理,显示所述增强现实处理结果。本实施例所述方法可以由增强现实的控制装置来执行,该装置可以由软件和/或硬件来实现,并集成在具有增强现实功能的移动终端中。其中,移动终端包括但不限定于手机、平板电脑等用户持有的设备。在步骤S11的一种优选实现方式中,优选地,获取用户的语音数据,得到所述语音数据对应的操作指令包括以下子步骤:子步骤S111、启动语音监听服务,监听用户的语音数据;优选地,音频监听设备可以是手持设备,例如手机或平板电脑的MIC。其中,监听用户的语音数据。其中,监听用户的语音数据可以是实时监听用户的语音数据,也可以是在完成上一项操作后监听用户的语音数据。例如,可以是在开启增强现实功能后监听用户的语音数据,或者完成增强现实内容的显示后监听用户的语音数据。优选地,若当前场景为预设增强现实子环境场景,则可以引导用户输入预设的语音操作指令。例如,所述增强现实子环境场景为汽车3D模型子环境场景,则在场景中,显示如“旋转模型”、“放大模型”、“缩小模型”等提示,用户可以根据上述提示输入格式化的固定语音,识别准确率较高。其中,预设增强现实子环境场景是通过增强现实的控制装置的特定入口进入,例如,控制装置的APP上预设了汽车3D模型、人物3D模型等多个入口,用户点击特定入口,即进入了预设增强现实子环境场景,在预设增强现实子环境场景中显示汽车3D模型。子步骤S112、对所述语音数据进行语音识别,得到所述语音数据对应的识别文本;优选地,调用自动语音识别(AutomaticSpeechRecognition,ASR)服务,对用户的语音数据进行解析,得到所述语音对应的语音识别结果,所述语音识别结果为语音对应的识别文本本文档来自技高网...

【技术保护点】
1.一种基于语音与增强现实环境交互的方法,其特征在于,包括以下步骤:获取用户的语音数据,得到所述语音数据对应的操作指令;根据所述操作指令,对增强现实环境进行处理,显示所述增强现实处理结果。

【技术特征摘要】
1.一种基于语音与增强现实环境交互的方法,其特征在于,包括以下步骤:获取用户的语音数据,得到所述语音数据对应的操作指令;根据所述操作指令,对增强现实环境进行处理,显示所述增强现实处理结果。2.根据权利要求1所述的方法,其特征在于,获取用户的语音数据,得到所述语音数据对应的操作指令包括:启动语音监听服务,监听用户的语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的识别文本;对所述识别文本进行语义分析,得到所述识别文本对应的操作指令。3.根据权利要求2所述的方法,其特征在于,对所述识别文本进行语义分析,得到所述识别文本对应的操作指令包括:在预设的操作指令中对所述识别文本进行精确匹配,查找对应的操作指令;和/或,对所述识别文本进行分词处理,生成关键词,查找与所述关键词匹配的操作指令。4.根据权利要求3所述的方法,其特征在于,当所述关键词与至少两个操作指令匹配成功时,根据用户的进一步选择,得到对应的操作指令。5.根据权利要求1所述的方法,其特征在于,所述增强现实环境包括:预设的增强现实子环境场景;或者,通过对摄像头获取的现实场景进行特征分析得到的增强现实子环境场景。6.根据权利要求1所述的方法,其特征在于,根据所述操作指令,对增强现实环境进行处理包括:根据所述操作指令,对增强现实子环境场景中的增强现实信息进行对应的增强现实控制操作。7.一种基于语音与增强现实环境交互的系统,其特征在于,包括:操作指令获取模块,用于获取用户的语音数据,得到所述语音数据对应的操作指令;增强现实处理模块,用于根据所述操作指令,...

【专利技术属性】
技术研发人员:谢高喜滕禹桥任大韫姚淼
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1