本发明专利技术公开了一种基于语音识别的索引菜单的方法、装置及其终端,属于移动通信领域。所述方法包括以下步骤:启动语音识别引擎服务;接收用户语音,并根据接收的语音遍历体感动作特征库,获取与接收的语音相匹配的语音特征文件,通过语音特征文件将接收的语音转译成文本字符;通过预设的索引菜单映射表查找到文本字符对应的菜单项;调用菜单项对应的接口函数执行菜单操作。通过本发明专利技术,利用语音识别技术中对各个语言基本字符的识别高效、准确和多种语言通用化的特点,使得语音特征库只需要提供基本字符的语音特征文件,通过自由组合可以实现所有菜单操作命令,满足复杂的语音识别才能完成的菜单操作,提高了灵活性和可扩展性。
【技术实现步骤摘要】
本专利技术涉及移动通讯领域,特别涉及一种基于语音识别的索引菜单的方法、装置及其终端。
技术介绍
随着移动通信领域技术的不断发展和成熟,在日益普及的移动终端中,特别是智能终端中软件功能越来越丰富,用户的个性化需求越来越多。但随着移动操作系统和硬件平台的日趋统一,软件功能的同质化也日趋严重。不断创新引入语音识别等新的交互方式成为保持终端产品竞争力的重要途径。语音识别作为一种新的、重要的用户交互技术在移动终端中的应用越来越广泛。随着语音识别技术的不断发展和云端语音服务器的引入,语音识别率有了很大提升,但从目前移动终端中已推出的语音产品的实际性能看,使用效果并不理想,技术还没有完全成熟。语音识别技术的应用主要包括两种方式本地化的直接命令式语音和依靠云端服务器的自然语言解析两种方式。直接命令式语音存在可扩展性差问题,需要提前预设固定范围的词汇库。也存在因为用户使用习惯、地域的不同,语言发音不用,国别不同等识别误差范围较大,准确率不高的问题。用户需要记忆每个命令式,命令长度相对较长,没有统一的格式,没有通用的规则可以助记。依靠云端语音服务器的自然语言解析方式,接近用户的使用习惯,但该功能依赖于网络,需要大量的数据交互操作,会引起用户网络流量的费用问题。同时当网络状态不好时,识别率会很低,用户使用场景受限。还有因为用户使用习惯、地域的不同,语言发音不用,国别不同等使得语音识别误差范围较大,识别准确率不足。此外,语音识别需要大量的计算,所以语音识别的速度和设备的能耗也会受语音命令的长度影响。
技术实现思路
为克服现有技术中的问题,本专利技术提供一种基于语音识别的索引菜单的方法、装置及其终端,以解决直接命令式的语音识别存在可扩展性差的问题。本专利技术解决上述技术问题所采用的技术方案如下根据本专利技术的一个方面,提供的一种基于语音识别的索引菜单的方法包括以下步骤A、启动语音识别引擎服务;B、接收用户语音,并根据接收的语音遍历体感动作特征库,获取与接收的语音相匹配的语音特征文件,通过语音特征文件将接收的语音转译成文本字符;C、通过预设的索引菜单映射表查找到文本字符对应的菜单项;D、调用菜单项对应的接口函数执行菜单操作。优选地,上述方法之后还包括步骤E、判断是否还进行下一级索引操作,如果是,则转到步骤B继续执行索引菜单操作,否则结束流程。优选地,启动语音识别引擎服务包括在开机过程中或者接收到用户通过快捷方式的命令后启动语音识别引擎服务;启动语音识别引擎服务之后还包括将语音识别服务当前的状态通过状态栏图标或者通知栏通知消息提示用户。优选地,语音特征库包含各个基本字符的语音特征文件,基本字符包括字母A-Z、数字O 9、和/或特殊符号*、#、+。优选地,索引菜单映射表包括预设应用索引菜单映射表和/或第三方应用索引菜单映射表,其中预设应用索引菜单映射表中设置为从菜单的树状逻辑结构的根节点到叶节点中,每一个层级对应一个索引菜单映射表,每一个节点对应一个菜单项,通过脚本语言进行配置;第三方应用索引菜单映射表设置为对应第三方应用程序的一级索引菜单映射表,通过第三方应用程序安装和卸载时进行配置管理。根据本专利技术的另一个方面,提供的一种基于语音识别的索引菜单的装置包括以下模块启动模块,用于启动语音识别引擎服务;语音识别引擎服务,用于接收用户语音,并根据接收的语音遍历体感动作特征库,获取与接收的语音相匹配的语音特征文件,通过语音特征文件将接收的语音转译成文本字符;查找模块,用于通过预设的索引菜单映射表查找到文本字符对应的菜单项;执行模块,用于调用菜单项对应的接口函数执行菜单操作。优选地,索引菜单映射表包括预设应用索引菜单映射表和/或第三方应用索引菜单映射表,其中预设应用索引菜单映射表设置为从菜单的树状逻辑结构的根节点到叶节点中,每一个层级对应一个索引菜单映射表,每一个节点对应一个菜单项,通过脚本语言进行配置;第三方应用索引菜单映射表设置为对应第三方应用程序的一级索引菜单映射表,通过应用程序安装和卸载时进行配置管理。优选地,启动模块具体用于在开机过程中或者接收到用户通过快捷方式的命令后启动语音识别引擎服务;还用于启动语音识别引擎服务后,将语音识别服务当前的状态通过状态栏图标或者通知栏通知消息提示用户。优选地,上述装置还包括休眠模块,休眠模块用于当菜单被操作后超过预定的时间没有接收到下一次操作时,休眠或关闭语音识别引擎服务。根据本专利技术的再一个方面,还提供了一种终端,该终端包括上述技术方案中的基于语音识别的索引菜单的装置。根据本专利技术的实施例,利用语音识别技术中对各个语言基本字符的识别高效、准确和多种语言通用化的特点,利用语音识别技术识别出用户读出的各个基本字符组合的语音,进而转译成基本字符组合文本,并通过查找预设规则索引菜单映射表,实现语音识别索引菜单操作,使得语音特征库只需要提供基本字符的语音特征文件,通过自由组合可以实现所有菜单操作命令,满足复杂的语音识别才能完成的菜单操作,提高了灵活性和可扩展性。附图说明图1为本专利技术提供的一种基于语音识别的索引菜单的方法流程图;图2为本专利技术实施例提供的一种菜单的逻辑结构示意图;图3为本专利技术实施例提供的一种索引菜单映射表的数据结构示意图;图4为本专利技术提供的一种基于语音识别的索引菜单的装置模块结构图;图5为本专利技术实施例提供的应用于号码查找的方法流程图。具体实施例方式以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。实施例一如图1所示是本专利技术提供一种基于语音识别的索引菜单实现方法,该方法包括以下步骤S101、启动语音识别引擎服务;具体来说,该步骤中启动语音识别引擎服务的方式包括但不限于在开机过程中或者接收到用户通过快捷方式的命令后启动;优选地,为了让用户确认当前是否支持语音识别索引菜单的功能,在启动语音识别引擎服务之后,可以通过将语音识别服务当前的状态状态栏图标或者通知栏通知消息提不用户。S102、接收用户语音,并根据接收的语音遍历体感动作特征库,获取与接收的语音相匹配的语音特征文件,通过语音特征文件将接收的语音转译成文本字符;具体来说,语音特征库包含基本字符集中各个基本字符的语音特征文件,其中基本字符集包括字母A-Z、数字O 9、和/或特殊符号*、#、+。语音特征文件中包含能够识别语音的特征信息。比如A字符的特征信息,当接收到用户语音后,会将用户语音与特征文件中的信息进行匹配,并会依据匹配的相似度,输出相应的一个或多个候选字符集。优选地,基本字符集同当前选择的语言相对应,由当前语言包含的基本字符集决定,用户可以根据实际需求配置裁剪。组成基本字符组合的字符个数理论上不受限制,但为了保证索引菜单命令的简单性,组成索引菜单的基本字符的个数最好小于或者等于3个。特殊符号可以用于通用菜单操作命令的定义。比如返回操作、选择操作、返回待机操作等。S103、通过预设的索引菜单映射表查找到上述文本字符对应的菜单项;具体来说,索引菜单映射表是通过一定的预设规则建立基本字符组合和各个菜单操作的映射关系配置表,基本字符组合作为映射的菜单操作的索引。索引菜单映射表包括预设应用索引菜单映射表和/或第三方应用索引菜单映射表,其中预设应用索引菜单映射表设置为从菜单的树状逻辑结构的根本文档来自技高网...
【技术保护点】
一种基于语音识别的索引菜单的方法,其特征在于,所述方法包括以下步骤:A、启动语音识别引擎服务;B、接收用户语音,并根据所述语音遍历体感动作特征库,获取与所述语音相匹配的语音特征文件,通过所述语音特征文件将接收的语音转译成文本字符;C、通过预设的索引菜单映射表查找到所述文本字符对应的菜单项;D、调用所述菜单项对应的接口函数执行菜单操作。
【技术特征摘要】
1.一种基于语音识别的索引菜单的方法,其特征在于,所述方法包括以下步骤A、启动语音识别引擎服务;B、接收用户语音,并根据所述语音遍历体感动作特征库,获取与所述语音相匹配的语音特征文件,通过所述语音特征文件将接收的语音转译成文本字符;C、通过预设的索引菜单映射表查找到所述文本字符对应的菜单项;D、调用所述菜单项对应的接口函数执行菜单操作。2.根据权利要求1所述的方法,其特征在于,所述方法之后还包括步骤E、判断是否还进行下一级索引操作,如果是,则转到步骤B继续执行索引菜单操作,否则结束流程。3.根据权利要求1所述的方法,其特征在于,所述启动语音识别引擎服务包括在开机过程中或者接收到用户通过快捷方式的命令后启动语音识别引擎服务;所述启动语音识别引擎服务之后还包括将所述语音识别服务当前的状态通过状态栏图标或者通知栏通知消息提示用户。4.根据权利要求1所述的方法,其特征在于,所述语音特征库包含各个基本字符的语音特征文件,所述基本字符包括字母A-Z、数字O 9、和/或特殊符号*、#、+。5.根据权利要求1所述的方法,其特征在于,所述索引菜单映射表包括预设应用索引菜单映射表和/或第三方应用索引菜单映射表,其中所述预设应用索引菜单映射表中设置为从菜单的树状逻辑结构的根节点到叶节点中,每一个层级对应一个索引菜单映射表,每一个节点对应一个菜单项,通过脚本语言进行配置;所述第三方应用索引菜单映射表设置为对应所述第三方应用程序的一级索引菜单映射表,通过所述第三方应用程序安装和卸...
【专利技术属性】
技术研发人员:柏凤佳,海茜,潘启蒙,
申请(专利权)人:深圳市中兴移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。