一种基于语音识别引擎的AR界面交互方法及系统技术方案

技术编号:16429333 阅读:96 留言:0更新日期:2017-10-22 02:06
本发明专利技术涉及一种基于语音识别引擎的AR界面交互方法及系统,其方法包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。本发明专利技术一种基于语音识别引擎的AR界面交互方法解决了现有增强现实技术对玩家的语音无法进行识别的问题,丰富了AR应用中人与游戏的交互性,不仅可以通过图片与虚拟物体进行交互,还能通过语音达到对虚拟物体一定行为的控制功能,增强了AR游戏的趣味性与可玩性。

A method and system of AR interface interaction based on speech recognition engine

The invention relates to a method and system of AR interface based on speech recognition engine, the method comprises the following steps: S1, using the speech recognition engine to generate voice commands; S2, coordinate position of the virtual object recognition in AR interface, and the virtual objects in AR interface in the coordinate position according to the speech instruction corresponding interaction behavior. The invention relates to a AR interface for speech recognition engine based on augmented reality technology to solve the existing voice to game player recognition problem, enrich the people and the game in the application of AR interactive, not only can interact with virtual objects through the pictures, but also through the voice control function of the virtual object to certain behavior. AR enhances the game interesting and fun.

【技术实现步骤摘要】
一种基于语音识别引擎的AR界面交互方法及系统
本专利技术涉及AR
,具体的涉及一种基于语音识别引擎的AR界面交互方法及系统。
技术介绍
现有的关于增强现实技术(AugmentedReality,简称AR)方面的游戏的玩法是玩家通过操作设备界面上的按钮来执行对虚拟角色的行为操作,而这种玩法无法快速达到指挥AR界面上虚拟物体的目的;同时,现有的语音识别技术对大词汇量的识别无法达到很高的识别精度,而在AR游戏中,是不能容许语音指令的出现较高的误检率的,如果出现较高的误检率会降低游戏的可玩性。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于语音识别引擎的AR界面交互方法及系统,解决了现有增强现实技术对玩家的语音无法进行识别的问题,不仅能提高AR游戏应用的可玩性,也丰富了人与虚拟现实之间的互动,增强了AR技术产品的趣味性。本专利技术解决上述技术问题的技术方案如下:一种基于语音识别引擎的AR界面交互方法,包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。本专利技术的有益效果是:本专利技术一种基于语音识别引擎的AR界面交互方法利用语音识别引擎生成语音指令;识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为;该方法解决了现有增强现实技术对玩家的语音无法进行识别的问题,丰富了AR应用中人与游戏的交互性,不仅可以通过图片与虚拟物体进行交互,还能通过语音达到对虚拟物体一定行为的控制功能,增强了AR游戏的趣味性与可玩性。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,所述S1具体为,S11,对需要语音识别的词汇进行离线学习,得到语音识别库;S12,将所述语音识别库导入到语音识别引擎中,S13,将语音信号输入至所述语音识别引擎中,并将所述语音信号与所述语音识别库中的数据进行匹配,所述语音识别引擎根据匹配结果生成对应的语音指令。进一步,所述S11具体为,S111,对需要语音识别的词汇进行标准发音,生成指令音频文件;S112,通过语音识别引擎离线学习工具对所述指令音频文件进行训练,并提取所述指令音频文件中的特征信息,生成指令文本文件;S113,对所述指令文本文件进行统计,并提取不同指令文本文件之间先后发生的统计关系;S114,根据所述统计关系构建语音识别模型,并输出语音识别模型的初始精度参数,S115,利用参数精度参数对所述语音识别模型进行反复测试,并根据测试结果调节所述初始精度参数,得出最终精度参数;S116,将所述最终精度参数与所述语音识别模型结合生成语音识别库。采用上述进一步方案的有益效果是:本专利技术一种基于语音识别引擎的AR界面交互方法基于语音识别引擎,先对需要离线学习的语音指令的音频文件进行反复的训练和对识别参数的反复调试,以获取到高准确率的语音识别库,提高语音识别的精度。进一步,所述语音识别引擎是基于PocketSphinx语音识别系统开发。采用上述进一步方案的有益效果是:基于PocketSphinx语音识别系统开发的语音识别引擎是一个计算量和体积都很小的语音识别引擎,它对小词汇量的识别精度是很高的,并且对性能的销毁很小,反应很快,可以进一步解决现有增强现实技术对玩家的语音无法进行识别的问题。进一步,在所述S13中,将所述语音信号与所述语音识别库中的数据进行匹配前还包括:对所述语音信号进行过滤处理。采用上述进一步方案的有益效果是:对语音信号进行过滤处理后再与语音识别库中的数据进行匹配,可以去除语音信号中的噪声,避免干扰,提高匹配的准确率。基于上述一种基于语音识别引擎的AR界面交互方法,本专利技术还提供一种基于语音识别引擎的AR界面交互系统。一种基于语音识别引擎的AR界面交互系统,包括语音识别引擎和AR引擎,所述语音识别引擎,其用于生成语音指令;所述AR引擎,其用于识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。本专利技术的有益效果是:本专利技术一种基于语音识别引擎的AR界面交互系统将语音信号在语音识别引擎中生成语音指令并传送到AR引擎中,通过结合AR引擎识别追踪得到AR界面中虚拟物体的坐标位置,对AR界面中虚拟物体进行相应的行为控;该方法解决了现有增强现实技术对玩家的语音无法进行识别的问题,丰富了AR应用中人与游戏的交互性,不仅可以通过图片与虚拟物体进行交互,还能通过语音达到对虚拟物体一定行为的控制功能,增强了AR游戏的趣味性与可玩性。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,所述语音识别引擎具体用于,对需要语音识别的词汇进行离线学习,得到语音识别库;将所述语音识别库导入到语音识别引擎中,将语音信号输入至所述语音识别引擎中,并将所述语音信号与所述语音识别库中的数据进行匹配,所述语音识别引擎根据匹配结果生成对应的语音指令。进一步,所述语音识别引擎具体用于,对需要语音识别的词汇进行标准发音,生成指令音频文件;通过语音识别引擎离线学习工具对所述指令音频文件进行训练,并提取所述指令音频文件中的特征信息,生成指令文本文件;对所述指令文本文件进行统计,并提取不同指令文本文件之间先后发生的统计关系;根据所述统计关系构建语音识别模型,并输出语音识别模型的初始精度参数,利用参数精度参数对所述语音识别模型进行反复测试,并根据测试结果调节所述初始精度参数,得出最终精度参数;将所述最终精度参数与所述语音识别模型结合生成语音识别库。采用上述进一步方案的有益效果是:本专利技术一种基于语音识别引擎的AR界面交互系统基于语音识别引擎,先对需要离线学习的语音指令的音频文件进行反复的训练和对识别参数的反复调试,以获取到高准确率的语音识别库,提高语音识别的精度。进一步,所述语音识别引擎是基于PocketSphinx语音识别系统开发。采用上述进一步方案的有益效果是:基于PocketSphinx语音识别系统开发的语音识别引擎是一个计算量和体积都很小的语音识别引擎,它对小词汇量的识别精度是很高的,并且对性能的销毁很小,反应很快,可以进一步解决现有增强现实技术对玩家的语音无法进行识别的问题。进一步,在所述语音识别引擎中,将所述语音信号与所述语音识别库中的数据进行匹配前还包括:对所述语音信号进行过滤处理。采用上述进一步方案的有益效果是:对语音信号进行过滤处理后再与语音识别库中的数据进行匹配,可以去除语音信号中的噪声,避免干扰,提高匹配的准确率。附图说明图1为本专利技术一种基于语音识别引擎的AR界面交互方法的整体流程图;图2为本专利技术一种基于语音识别引擎的AR界面交互方法中生成语音指令的流程图;图3为本专利技术一种基于语音识别引擎的AR界面交互方法中对需要语音识别的词汇进行离线学习得到语音识别库的流程图;图4为本专利技术一种基于语音识别引擎的AR界面交互系统的结构框图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。如图1所示,一种基于语音识别引擎的AR界面交互方法,包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面本文档来自技高网...
一种基于语音识别引擎的AR界面交互方法及系统

【技术保护点】
一种基于语音识别引擎的AR界面交互方法,其特征在于:包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。

【技术特征摘要】
1.一种基于语音识别引擎的AR界面交互方法,其特征在于:包括以下步骤,S1,利用语音识别引擎生成语音指令;S2,识别AR界面中虚拟物体的坐标位置,并使所述AR界面中的虚拟物体在所述坐标位置处根据所述语音指令执行相应的交互行为。2.根据权利要求1所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:所述S1具体为,S11,对需要语音识别的词汇进行离线学习,得到语音识别库;S12,将所述语音识别库导入到语音识别引擎中,S13,将语音信号输入至所述语音识别引擎中,并将所述语音信号与所述语音识别库中的数据进行匹配,所述语音识别引擎根据匹配结果生成对应的语音指令。3.根据权利要求2所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:所述S11具体为,S111,对需要语音识别的词汇进行标准发音,生成指令音频文件;S112,通过语音识别引擎离线学习工具对所述指令音频文件进行训练,并提取所述指令音频文件中的特征信息,生成指令文本文件;S113,对所述指令文本文件进行统计,并提取不同指令文本文件之间先后发生的统计关系;S114,根据所述统计关系构建语音识别模型,并输出语音识别模型的初始精度参数,S115,利用参数精度参数对所述语音识别模型进行反复测试,并根据测试结果调节所述初始精度参数,得出最终精度参数;S116,将所述最终精度参数与所述语音识别模型结合生成语音识别库。4.根据权利要求1至3任一项所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:所述语音识别引擎是基于PocketSphinx语音识别系统开发。5.根据权利要求2或3所述的一种基于语音识别引擎的AR界面交互方法,其特征在于:在所述S13中,将所述语音信号与所述语音识别库中的数据进行匹配前还包括:对所述语音信号...

【专利技术属性】
技术研发人员:胡德志孙碧亮袁超飞
申请(专利权)人:武汉秀宝软件有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1