一种基于语音识别字符索引的查找方法及系统技术方案

技术编号:8489850 阅读:161 留言:0更新日期:2013-03-28 11:58
本发明专利技术公开了一种基于语音识别字符索引的查找方法和系统。该方法包括如下步骤:用户语音输入基本字符,识别出用户读出的各个基本字符组合的语音,转译成基本字符组合文本索引,并进一步转译成标准的按键事件、触屏事件或用户识别的自定义事件,通过标准的事件传递函数传递给需要进行查找的应用场景或界面,实现语音识别字符索引的查找。该系统包括语音识别引擎服务装置,用于识别用户语音输入的基本字符,以作为语音识别的字符索引;读取转译装置,转译识别装置和匹配装置。本发明专利技术实现了语音识别字符索引的快速查找功能。

【技术实现步骤摘要】

本专利技术涉及移动通信领域,尤其涉及一种基于语音识别字符索引的快速查找方法 及系统。
技术介绍
随着移动通信领域技术的不断发展和成熟,在日益普及的移动终端中,特别是智 能终端中软件功能越来越丰富,用户的个性化需求越来越多。但随着移动操作系统和硬件 平台的日趋统一,软件功能的同质化也日趋严重。不断创新引入语音识别等新的交互方式 成为保持终端产品竞争力的重要途径。语音识别作为一种新的、重要的用户交互技术在移动终端中的应用越来越广泛。 随着语音识别技术的不断发展和云端语音服务器的引入,语音识别率有了很大提升,但从 目前移动终端中已推出的语音产品的实际性能看,使用效果并不理想,技术还没有完全成 熟。特别是存在因为用户使用习惯、地域的不同,语言发音不用,国别不同等识别误差范围 较大,准确率不高的问题。同时,依靠云端语音服务器的自然语言解析方式,依赖于网络,需 要大量的数据交互操作,会引起用户网络流量的费用问题,而且当网络状态不好时,识别率 会很低,用户使用场景受限。号码查找功能是移动终端中的一项十分重要的,核心的功能。就目前已上市的产 品来说,号码查找功能都是通过键盘或触屏虚拟键盘输入联系人名称或号码相关信息进行 查找匹配,不支持通过语音识别进行字符索引快速查找的功能。因此,为了弥补上述技术的不足,本专利技术提出一种新的,基于语音识别字符索引的 快速查找方法及系统。
技术实现思路
为了克服现有技术中存在的缺陷或不足,本专利技术提供了一种基于语音识别字符索 引的查找方法及系统。为解决上述技术问题,本专利技术提供的技术方案为一种基于语音识别字符索引的 查找方法,该方法包括如下步骤用户语音输入基本字符,识别出用户读出的各个基本字符组合的语音,转译成基 本字符组合文本索引,并进一步转译成标准的按键事件、触屏事件或用户识别的自定义事 件,通过标准的事件传递函数传递给需要进行查找的应用场景或界面,实现语音识别字符 索引的查找。本专利技术还提供了一种基于语音识别字符索引的查找方法,该方法具体包括如下步 骤步骤11 :语音识别引擎服务启动;步骤12 :用户语音输入基本字符,作为语音识别的字符索引;步骤13 :语音识别引擎服务接收到用户语音后,读取语音特征库,遍历,获取与用户语音输入基本字符相匹配的语音特征文件,并将识别出的语音转译成文本字符;步骤14 :将上述文本字符转移为标准的按键或触屏事件或用户识别的自定义事 件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用;步骤15 :进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式反馈给 用户,提示用户当前的匹配状态;如果匹配结束或匹配结果为空,查找方法结束,执行步骤 12;否则,转到步骤16;步骤16 :用户再次语音输入基本字符,转到步骤13。优选的,语音识别引擎服务通过状态栏图标或者通知栏通知消息提示用户语音识 别服务当前的状态,以此确认当前是否支持基于语音识别字符索引的快速查找功能。优选的,步骤15中,如果匹配结束或匹配结果为空,查找方法结束后,执行步骤12 前,还包括如下步骤一段时间内没有执行步骤12,语音识别引擎服务休眠或关闭,该一段 时间的长度由用户根据实际需求分等级设定。优选的,语音识别的语音特征库包含各个基本字符的语音特征文件字母A-Z,数 字O 9,特殊符号*#+。本专利技术还提供了一种基于语音识别字符索引的查找系统,该系统包括语音识别引擎服务装置,用于识别用户语音输入的基本字符,以作为语音识别的 字符索引; 读取转译装置,用于读取语音特征库,遍历,获取与语音识别弓I擎服务装置识别的 语音输入的基本字符匹配的语音特征文件,并将识别出的语音转译成文本字符;转译识别装置,用于将上述文本字符转译为标准的按键或触屏事件或用户识别的 自定义事件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用;匹配装置,用于进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式 反馈给用户,提示用户当前的匹配状态。优选的,语音识别的语音特征库包含各个基本字符的语音特征文件字母A-Z,数 字O 9,特殊符号*#+。本专利技术的有益效果在于1.本专利技术涉及的号码查找算法是基于基本字符语音特征库的,语音识别的计算量 较小,识别准确率高,速度快,设计实现更简单,占用系统资源更少。2.本专利技术涉及的号码查找算法通过将基本字符的语音转译成文本字符,并进一步 转译成标准按键或触屏事件的方法,一方面引入了一种基于语音识别的新的号码查找的交 互方式,另一方面该方法可以同按键和触屏等传统触碰式交互方式一起工作,互不影响,优 势互补。3.本专利技术涉及的号码查找算法基于语音识别,对于在比如高空作业、震动环境、有 操作障碍等对按键或触屏等直接触控不方便的应用场景更为方便。附图说明图1为本专利技术提供的语音识别字符索引查找转译流程示意图。图2为本专利技术提供的语音识别字符索引查找一个实施例的流程示意图。图3为本专利技术提供的语音识别字符索引字符匹配一个实施例的流程示意图。具体实施方式下面结合附图对本专利技术做进一步说明。本专利技术的核心思想是利用语音识别技术中对各个语言基本字符识别高效、准确、 多种语言通用化的特点,应用语音识别技术识别出用户读出的各个基本字符组合的语音, 转译成基本字符文本索引,并进一步转译成标准的按键事件、触屏事件或用户可以识别的 自定义事件,通过标准的事件传递函数传递给需要进行快速查找的应用场景或界面,实现 语音识别字符索引的快速查找功能。字符索引的引入,用户可以根据实际需求自由组合基本字符作为字符索引,弥补 了直接命令式语音操作的可扩展性差的问题。直接命令式的语音操作要扩展操作命令必须 扩展直接命令语音库,这样会增加对用户存储空间和内存的使用,同时由于语音库的增加, 遍历解析特定语音命令的响应时间会线性增加,会导致相应的语音操作越来越慢。字符索引的引入,使得语音库只需要提供基本字符的语音特征文件,通过自由组 合,在不需要云端语音识别服务器的前提下,理论上可以高准确率实现几乎所有可能的快 速查找命令。同时字符索引的响应时间不会因快速查找命令数量的增加而线性增加。可以 很好的满足在云端语音识别服务无法获取的情况下的语音识别的快速查找操作。因为是基本字符范围的语音识别,所以语言的通用性相对较好,在没有相应多语 言语音库时也可以工作。比如在只有英文字母的语音库时,同样可以实现通过汉语中对拼 音的识别和使用。这对实现语音识别的查找或排序提供了便利。当然,可以必须看到字符索引方式不是用户习惯的自然语言交互方式,需要依据 预设规则记忆命令集。所以语音识别字符索引不能太多太复杂,层级不能太深。基于语音识别字符索引的快速查找方法对于有操作障碍,提供了一种可以实现无 障碍沟通的方便有效的方法。本专利技术的一个优先实例的技术方案为1.本专利技术的语音识别的词汇表范围包含各个基本字符集字母A-Z,数字O 9, 特殊符号*#+。基本字符集同当前选择的语言相对应,由当前语言包含的基本字符集决定。 用户可以根据实际需求配置裁剪。2.本专利技术的语音识别的语音库包含各个基本字符的语音特征文件字母A-Z,数 字O 9,特殊符号*#+。3.本专利技术可以通过一定的预设规则建立基本字符组合和各个查找应用场景的映 关系。4.本专利技术组成字符索引的字符个数不受限制本文档来自技高网...

【技术保护点】
一种基于语音识别字符索引的查找方法,其特征在于,该方法包括如下步骤:用户语音输入基本字符,识别出用户读出的各个基本字符组合的语音,转译成基本字符组合文本索引,并进一步转译成标准的按键事件、触屏事件或用户识别的自定义事件,通过标准的事件传递函数传递给需要进行查找的应用场景或界面,实现语音识别字符索引的查找。

【技术特征摘要】

【专利技术属性】
技术研发人员:柏凤佳
申请(专利权)人:深圳市中兴移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1