用于使用手势来切换处理模式的系统和方法技术方案

技术编号:12339897 阅读:93 留言:0更新日期:2015-11-18 12:41
本发明专利技术提供用于使用手势在语音听写模式之间切换的系统和方法,以使得可以对所听写的词语应用替代性含义。所述所提供的系统和方法给所检测到的手势和从语音听写所检测到的词语加时间戳,并且比较检测到手势的时间戳与检测到词语的时间戳。当确定手势的时间戳大致匹配词语的时间戳时,所述词语可以被处理成具有替代性含义,例如命令、标点或动作。

【技术实现步骤摘要】
【国外来华专利技术】
本文所揭示的实施例大体上是针对在计算装置的模式之间切换的系统和方法。确 切地说,本文所揭示的实施例是针对基于所检测到的手势来在模式之间切换。
技术介绍
语音听写过去常意味着向磁带录音机或打字员说话。然而,随着语音检测系统改 进,并且系统能够较好地将语音处理成文字,语音听写系统已经在安装于计算机或移动装 置上的软件中实施。此外,语音听写系统能够在用户说话时将语音处理成文字,从而在免提 和可访问性应用中提供明显进步。 在实施语音听写中的困难之一是适应个人的自然话音模式(naturalspeech pattern)。目前的语音听写系统将完整说出的词语串处理成文字,并且处理所述文字的命 令或标点。然而,对于许多系统,处理文字的命令或标点是困难的。一些系统寻找停顿以确 定文字的结束,并且使用这一停顿作为下一字串(string)将包含待对前一字串执行的命 令的提示。如果用户在其话音中停顿以整理思绪或考虑接下来要说什么,并且下一字串包 含可能被解译为命令的词语,那么尽管用户不希望同时执行命令,但命令仍可能得到执行。 因此,需要用于改进的语音听写的系统和方法,所述语音听写能够较好地顾及用 户的自然话音模式并且区分所听写的词语(包含可能是命令和/或标点的词语)的不同含 义。
技术实现思路
与一些实施例一致,提供一种用于以第一模式和第二模式处理所检测到的音频波 形的系统。所述系统包含麦克风,所述麦克风经配置用于检测音频波形;手势检测传感器, 所述手势检测传感器经配置以检测无接触手势;以及系统时钟,所述系统时钟经配置以向 所检测到的音频波形和所检测到的无接触手势提供时间戳。所述系统还包含一或多个处理 器,所述处理器经配置以在所检测到的音频波形的时间戳与所检测到的无接触手势的时间 戳大致匹配时以第二模式处理所检测到的音频波形。 与一些实施例一致,进一步提供一种用于以第一模式和第二模式处理所检测到的 音频波形的方法。所述方法包含以下步骤:通过麦克风检测初始音频波形输入;启动手势 检测;给所述音频波形输入加时间戳;检测是否执行无接触手势;给所检测到的无接触手 势加时间戳;以及从大约所述所检测到的无接触手势的时间戳起,由一或多个耦合到所述 麦克风上的处理器以第二模式处理音频波形输入,直到大约不再检测到无接触手势时的时 间为止。所提供的方法也可以实施为计算机可读媒体中的指令。 与一些实施例一致,进一步提供一种用于以第一模式和第二模式处理所检测到的 音频波形的系统。所述系统包含用于检测音频波形输入并且给所述音频波形输入加时间戳 的装置;用于检测无接触手势并且给所检测到的无接触手势加时间戳的装置;以及用于在 所述音频波形输入的时间戳大致匹配所述所检测到的无接触手势的时间戳时选择性地以 第二模式处理所述音频波形输入的装置。【附图说明】 图1是图解说明与一些实施例一致的处理装置100的简图。 图2A到2C图解说明与一些实施例一致的一种用于基于所检测到的手势来以第一 模式和第二模式处理所检测到的音频波形的系统的实例。 图3A到3F图解说明与一些实施例一致的一种基于所检测到的手势来以第一模式 和第二模式处理所检测到的音频波形的系统的实例。 图4是图解说明与一些实施例一致的一种以第一模式和第二模式处理所检测到 的音频波形的方法的流程图。 图5是图解说明与一些实施例一致的一种以第一模式和第二模式处理所检测到 的音频波形的方法的流程图。 图6A到6G图解说明与一些实施例一致的一种基于所检测到的手势来以第一模式 和第二模式处理所检测到的音频波形的系统的实例。 图7是图解说明与一些实施例一致的一种以第一模式和第二模式处理所检测到 的音频波形的方法的流程图。 在附图中,具有相同名称的元件具有相同或类似的功能。【具体实施方式】 在以下描述中,阐述描述某些实施例的具体细节。然而,对于所属领域的技术人 员将显而易见的是,所揭示的实施例可以在没有这些具体细节中的一些或全部的情况下实 践。所呈现的具体实施例意图为说明性的而非限制性的。所属领域的技术人员可以认识到 尽管未具体描述于本文中但处于本专利技术范围和精神内的其它材料。 图1是图解说明与一些实施例一致的处理装置100的简图。处理装置100可以 是移动装置,例如智能手机(例如iPhone?),或运行iOS?操作系统、Android?操作系统、 BlackBerry?操作系统、Microsoft?Window禮手机操作系统、Symbian?OS或WebOSira^ 其它移动装置,或不实施操作系统的移动装置。处理装置100也可以是平板计算机(例如iPad?)或运行前述操作系统中的一者的其它平板计算机。处理装置100也可以是PC或膝 上型计算机或上网本、机顶盒(STB)(例如由电缆或卫星内容提供商提供),或视频游戏系 统控制台(例如Nintendo?Wii?、Microsoft?Xbox360?或Sony?PlayStation? 3)或 其它视频游戏系统控制台。在一些实施例中,处理装置100实施在汽车中,例如在汽车的娱 乐中心或控制台中,或包含或实施在医疗装置中。根据一些实施例,处理装置100可以使 用经配置用于接收和采集音频输入并且检测手势的硬件和/或软件的任何适当组合来实 施。确切地说,处理装置100可以包含硬件和/或软件的任何适当组合,所述硬件和/或软 件具有一或多个处理器并且能够读取存储在非暂时性机器可读媒体上的用于由用于接收 和采集音频输入并且检测手势的一或多个处理器执行的指令。机器可读媒体的一些常见形 式包含例如软盘、软磁盘、硬盘、磁带、任何其它磁性媒体、CD-ROM、任何其它光学媒体、穿孔 卡片、纸带、具有孔洞图案的任何其它物理媒体、RAM、PR0M、EPR0M、FLASH-EPR0M、任何其它 存储器芯片或盒带,和/或一或多个处理器或计算机经调适以从其进行读取的任何其它媒 体。 处理装置100可以包含经配置用于与网络通信的网络接口组件102。与一些实施 例一致,网络接口组件102可以经配置以与同轴电缆、光纤电缆、数字订户线(DSL)调制解 调器、公共交换电话网络(PSTN)调制解调器、以太网装置和/或各种其它类型的有线网络 通信装置介接。网络接口组件102还可以包含一或多个无线收发器,其中每一个无线收发 器可以包含天线(所述天线是可分离的或一体化的),并且能够根据不同的无线联网协议 (例如Wi-Fi?、3G、4G、HDSPA、LTE、RF、NFC)发送和接收信息。与一些实施例一致,处理装 置100包含用于互连处理装置100内的各种组件以及在所述各种组件之间的通信信息的系 统总线104。在一些实施例中,总线104在片上系统(SoC)中实施并且连接一或多个处理器 的芯片和/或核心上的各种元件或组件。组件可以包含处理组件106,所述处理组件可以 是一或多个处理器、中央处理单元(CPU)、图像信号处理器(ISP)、微控制器或数字信号处 理器(DSP)和音频信号处理器,所述音频信号处理器可以包含模拟和/或数字音频信号处 理器。组件还可以包含系统存储器组件108,其可以对应于随机存取存储器(RAM);内部存 储器组件110,其可以对应于只读存储器(ROM);和外部或静态存储器112,其可本文档来自技高网...

【技术保护点】
一种用于以第一模式和第二模式处理所检测到的音频波形的系统,所述系统包括:麦克风,所述麦克风经配置用于检测音频波形;手势检测传感器,所述手势检测传感器经配置以检测无接触手势;系统时钟,所述系统时钟经配置以提供用于通过所述麦克风所检测到的音频波形和通过所述手势检测传感器所检测到的无接触手势的时间戳;一或多个处理器,所述处理器经配置以在通过所述麦克风所检测到的音频波形的时间戳与通过所述手势检测传感器所检测到的无接触手势的时间戳大致匹配时选择性地以所述第二模式处理所述所检测到的音频波形。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:P·L·通埃文·R·希尔德雷思乔尔·S·伯恩阿特S·阿雷拉诺
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1