The invention relates to a method and system of AR interface based on speech recognition engine, the method comprises the following steps: S1, using the speech recognition engine to generate voice commands; S2, coordinate position of the virtual object recognition in AR interface, and the virtual objects in AR interface in the coordinate position according to the speech instruction corresponding interaction behavior. The invention relates to a AR interface for speech recognition engine based on augmented reality technology to solve the existing voice to game player recognition problem, enrich the people and the game in the application of AR interactive, not only can interact with virtual objects through the pictures, but also through the voice control function of the virtual object to certain behavior. AR enhances the game interesting and fun.
【技术实现步骤摘要】
一种基于语音识别引擎的AR界面交互方法及系统
本专利技术涉及AR
,具体的涉及一种基于语音识别引擎的AR界面交互方法及系统。
技术介绍
现有的关于增强现实技术(AugmentedReality,简称AR)方面的游戏的玩法是玩家通过操作设备界面上的按钮来执行对虚拟角色的行为操作,而这种玩法无法快速达到指挥AR界面上虚拟物体的目的;同时,现有的语音识别技术对大词汇量的识别无法达到很高的识别精度,而在AR游戏中,是不能容许语音指令的出现较高的误检率的,如果出现较高的误检率会降低游戏的可玩性。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于语音识别引擎的AR界面交互方法及系统,解决了现有增强现实技术对玩家的语音无法进行识别的问题,不仅能提高AR游戏应用的可玩性,也丰富了人与虚拟现实之间的互动,增强了AR技术产品的趣味性。本专利技术解决上述技术问题的技术方案如下:一种基于语音识别引擎的AR界面交互方法,包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。本专利技术的有益效果是:本专利技术一种基于语音识别引擎的AR界面交互方法利用语音识别引擎生成语音指令;识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为;该方法解决了现有增强现实技术对玩家的语音无法进行识别的问题,丰富了AR应用中人与游戏的交互性,不仅可以通过图片与虚拟物体进行交互,还能通过语音达到对虚拟物体一定行为的控制功能, ...
【技术保护点】
一种基于语音识别引擎的AR界面交互方法,其特征在于:包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。
【技术特征摘要】
1.一种基于语音识别引擎的AR界面交互方法,其特征在于:包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。2.根据权利要求1所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:所述S1具体为,S11,对需要语音识别的词汇进行离线学习,得到语音识别库;S12,将所述语音识别库导入到语音识别引擎中,S13,将语音信号输入至所述语音识别引擎中,并将所述语音信号与所述语音识别库中的数据进行匹配,所述语音识别引擎根据匹配结果生成对应的语音指令。3.根据权利要求2所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:所述S11具体为,S111,对需要语音识别的词汇进行标准发音,生成指令音频文件;S112,通过语音识别引擎离线学习工具对所述指令音频文件进行训练,并提取所述指令音频文件中的特征信息,生成指令文本文件;S113,对所述指令文本文件进行统计,并提取不同指令文本文件之间先后发生的统计关系;S114,根据所述统计关系构建语音识别模型,并输出语音识别模型的初始精度参数,S115,利用参数精度参数对所述语音识别模型进行反复测试,并根据测试结果调节所述初始精度参数,得出最终精度参数;S116,将所述最终精度参数与所述语音识别模型结合生成语音识别库。4.根据权利要求1至3任一项所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:所述语音识别引擎是基于PocketSphinx语音识别系统开发。5.根据权利要求2或3所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:在所述S13中,将所述语音信号与所述语音识别库中的数据进行匹配前还包括:对所述语音信号...
【专利技术属性】
技术研发人员:胡德志,孙碧亮,袁超飞,
申请(专利权)人:武汉秀宝软件有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。