基于部分热词发起动作制造技术

技术编号:25227267 阅读:30 留言:0更新日期:2020-08-11 23:15
本申请涉及基于部分热词发起动作。一种包括编码在计算机存储介质上的计算机程序的方法、系统、以及装置:接收音频数据;确定音频数据的初始部分与热词的初始部分相对应;响应于确定音频数据的初始部分与热词的初始部分相对应,从当检测到整个热词时所执行的一个或多个动作的集合当中选择一个或多个动作的子集;并且使得该子集的一个或多个动作被执行。

【技术实现步骤摘要】
基于部分热词发起动作分案说明本申请属于申请日为2014年3月21日的中国专利技术专利申请No.201480066328.1的分案申请。
本公开讨论了基于部分热词而发起动作,并且更具体地说,响应于检测到部分热词而提供初始动作。
技术介绍
声音发声可以包括热词,即使得系统执行对应动作的预定保留词。电子设备上的语音识别服务通常从用户接收所说的词的声音发声,并且将所说的词转录成文本。为了实现此,语音识别服务可能试图使话语输入的声音与文本词的语音表示相匹配。
技术实现思路
根据在该说明书中所描述的主题的一些创新方面,对热词的初始部分的检测使得将执行动作。用户可能会向移动计算设备说诸如"OKGoogle(好的Google)"这样的热词,这使得移动计算设备执行动作。例如,热词“OKGoogle(好的Google)”使得移动计算设备从睡眠或待机状态醒来。一旦检测到热词的初始部分,例如一旦检测到热词“OKGoogle(好的Google)”的“OK(好的)”部分,则移动计算设备可使得与完整热词“OKGoogle(好的Google)”相关联的动作被执行。例如,一旦检测到部分热词“OK(好的)”,则移动计算设备可打开网络连接。通过在检测到热词的初始部分之后使得动作的与该热词相关联的子集被执行,可降低与热词相关联的等待时间,并且因而,与该热词相关联的处理时间降低了,同时这对用户是透明的。也就是说,用户感知到移动计算设备的速度提高。在本说明书中所描述的主题的创新方法可以具体体现为下述方法,该方法包括动作:接收音频数据;确定音频数据的初始部分与热词的初始部分相对应;响应于确定音频数据的初始部分与热词的初始部分相对应,从当检测到整个热词时所执行的一个或多个动作的集合当中选择一个或多个动作的子集;并且使得该子集中的一个或多个动作被执行。这些方面的其它实施例包括对应系统、装置、以及编码在计算机存储设备上的被配置为执行所述方法的动作的计算机程序。这些及其它实施例每一个可以选择性地包括以下特征中的一个或多个。例如,识别音频数据的初始部分的一个或多个声学特征;将音频数据的初始部分的一个或多个声学特征与和存储在数据库中的一个或多个热词相关联的一个或多个声学特征进行比较;以及基于该比较,确定音频数据的初始部分与存储在数据库中的一个或多个热词中的热词的初始部分相对应。获得音频数据的初始部分的转录,该音频数据包括语音发声;将音频的初始部分的转录与和存储在数据库中的一个或多个热词相关联的一个或多个转录进行比较;以及基于该比较,确定音频的初始部分与存储在数据库中的一个或多个热词中的热词的初始部分相对应。热词的初始部分包括小于整个热词。子集中的一个或多个动作包括执行该动作的计算设备的用户不可见的动作。子集中的一个或多个动作包括在执行动作的计算设备的后台计算环境中执行的动作。将中断信号传送到在计算设备上执行的操作系统以执行一个或多个动作。中断信号使得操作系统对计算设备的照相机功能初始化。中断信号使得操作系统将计算设备从睡眠状态激活。中断信号使得操作系统对计算机设备上的网络连接初始化。中断信号使得操作系统预加载计算设备上与热词相关联的应用。该特征进一步包括例如:接收音频数据的随后部分;确定音频数据的初始部分和音频数据的随后部分整体地与整个热词相对应;响应于确定音频数据的初始部分和音频数据的随后部分整体地与整个热词相对应,从当检测到整个热词时所执行的一个或多个动作的集合中选择一个或多个动作的附加子集;并且使得附加子集中的一个或多个动作被执行。一个或多个动作的集合包括该一个或多个动作的子集以及该一个或多个动作的附加子集。接收音频数据的随后部分;确定音频数据的初始部分和音频数据的随后部分整体地与整个热词不对应;并且响应于确定音频数据的初始部分和音频数据的随后部分整体地与整个热词不对应,使得附加子集中的一个或多个动作将被反转(reverse)。选择所述一个或多个动作的附加子集,所述一个或多个动作的附加子集用于当被执行时反转所述一个或多个动作的子集中的一个或多个动作;以及使得所述附加子集中的一个或多个动作将执行。在接收到音频数据之前,接收(i)指示音频数据的初始部分与热词的初始部分相对应的数据以及(ii)指示与热词相关联的动作的子集的数据。热词是特定项,所述特定项触发对在该特定项之后的一个或多个项的附加项的语义解释。在附图及下面的描述中阐述了在该说明书中所描述的主题的一个或多个实施例的细节。从该描述、附图、以及权利要求将显而易见地得知该主题的其它潜在特征、方面、以及优点。附图说明图1描绘了用于检测部分热词的示例系统。图2A-2F描绘了用于检测部分热词的示例过程的泳道图。图3描绘了用于检测部分热词的示例流程图。图4描绘了可以用于实现这里所描述的技术的计算机设备和移动计算机设备。附图中的相同附图标记指示相同元件。具体实施方式图1描绘了用于检测部分热词的系统100。在一些示例中,系统100包括音频子系统102、部分热词动作启动器104、热词检测器106、热词至动作映射器108、热词至动作数据库110、以及动作引擎112。在一些示例中,系统100是例如移动计算设备100的移动计算设备。在一些示例中,移动计算设备包括智能电话、或者平板计算设备。移动计算设备100可包括例如麦克风的用于检测来自用户116的发声的任何音频检测装置。在一些示例中,用户116说出移动计算设备100所检测的一个或多个词。在一些示例中,发声包括使得移动计算设备100执行动作的一个或多个热词或者部分热词。如在所图示的示例中所描述的,用户116说出“OKGoogle(好的Google)”。移动计算设备100利用适当地接收发声“OKGoogle(好的Google)”的音频数据的音频子系统102来检测“OKGoogle(好的Google)”。在所图示的示例中,音频子系统102在时间t1接收与发声“OK(好的)”相关联的音频数据的初始部分。音频数据的初始部分可包括该发声的最初几个音频帧,或者与该发声相关联的音频数据的最初几百毫秒。在一些示例中,音频子系统102对发声进行处理以生成包括发声的一部分或者基本上发声的整个部分的波形数据。在一些示例中,音频子系统102对所接收到的音频数据进行适当地处理。例如,音频子系统102识别音频数据的初始部分的一个或多个声学特征。在所说明的示例中,音频子系统102识别与和发声“OK(好的)”相关联的音频数据的初始部分相关联的声学特征。在一些示例中,音频子系统102获得与发声“OK(好的)”相关联的音频数据的初始部分的转录。在所说明的示例中,音频子系统102获得与发声“OK(好的)”相关联的音频数据的初始部分的转录。在一些示例中,音频子系统102将经处理的音频数据提供给部分热词动作启动器104。例如,音频子系统102将与发声“OK(好的)”相关联的经处理的音频数据提供给部分热词动作启动器104。在一些示例中,经处理的音频数据可包括与发声“OK(好的)本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,包括:/n由正在睡眠模式中操作的移动计算设备接收和与将所述移动计算设备唤醒到唤醒模式相关联的预定热词的起始部分相对应的声音;以及/n在接收到和与将所述移动计算设备唤醒到唤醒模式相关联的所述预定热词的其余部分相对应的声音之前,由所述移动计算设备发起开始将所述移动计算设备唤醒到所述唤醒模式的处理而不发起完成将移动计算设备唤醒到唤醒模式的处理。/n

【技术特征摘要】
20131204 US 14/096,359;20140320 US 14/220,7811.一种计算机实现的方法,包括:
由正在睡眠模式中操作的移动计算设备接收和与将所述移动计算设备唤醒到唤醒模式相关联的预定热词的起始部分相对应的声音;以及
在接收到和与将所述移动计算设备唤醒到唤醒模式相关联的所述预定热词的其余部分相对应的声音之前,由所述移动计算设备发起开始将所述移动计算设备唤醒到所述唤醒模式的处理而不发起完成将移动计算设备唤醒到唤醒模式的处理。


2.根据权利要求1所述的计算机实现的方法,进一步包括:
接收和与将所述移动计算设备唤醒到所述唤醒模式相关联的所述预定热词的所述其余部分相对应的声音;以及
确定所述预定热词的所述起始部分和所述预定热词的随后部分整体地对应于整个所述预定热词;
响应于确定所述预定热词的所述起始部分和所述预定热词的所述随后部分整体地对应于整个所述预定热词,由所述移动计算设备发起完成将所述移动计算设备唤醒到所述唤醒模式的处理。


3.根据权利要求1所述的计算机实现的方法,进一步包括:
接收附加声音;
确定与所述预定热词的所述起始部分相对应的所述声音和所述附加声音整体地不与整个所述预定热词相对应;以及
响应于确定与所述预定热词的所述起始部分相对应的所述声音和所述附加声音整体地不与整个所述预定热词相对应,由所述移动计算设备发起将所述移动计算设备返回所述睡眠模式的处理。


4.根据权利要求1所述的计算机实现的方法,其中,所述唤醒模式包括以下中的一个或多个:激活所述移动计算设备的显示器,初始化所述移动计算设备的相机功能,初始化所述移动计算设备上的网络连接,预加载所述移动计算设备上的应用,以及在所述移动计算设备的显示器上显示用户界面。


5.根据权利要求1所述的计算机实现的方法,其中,开始将所述移动计算设备唤醒到所述唤醒模式的处理包括所述移动计算设备的用户无法觉察的处理。


6.根据权利要求1所述的计算机实现的方法,其中,所述预定热词包括特定项,所述特定项触发对所述特定项之后的一个或多个项中的附加项的语义解释。


7.如权利要求2所述的计算机实现的方法,其中,确定所述预定热词的所述起始部分和所述预定热词的所述随后部分整体地对应于整个所述预定热词包括以下中的至少一个:(i)将所述预定热词的所述起始部分和所述预定热词的所述随后部分的一个或多个声学特征和与存储在数据库中的一个或多个热词相关联的一个或多个声学特征进行比较,或者(ii)将所述预定热词的所述起始部分和所述预定热词的所述随后部分的转录和与存储在数据库中的一个或多个热词相关联的一个或多个转录进行比较。


8.一种系统,包括:
一个或多个处理器;以及
一个或多个存储指令的存储设备,所述指令在由所述一个或多个处理器执行时可操作以使得所述一个或多个处理器执行操作,所述操作包括:
由正在睡眠模式中操作的移动计算设备接收和与将所述移动计算设备唤醒到唤醒模式相关联的预定热词的起始部分相对应的声音;以及
在接收到和与将所述移动计算设备唤醒到唤醒模式相关联的所述预定热词的其余部分相对应的声音之前,由所述移动计算设备发起开始将所述移动计算设备唤醒到所述唤醒模式的处理而不发起完成将移动计算设备唤醒到唤醒模式的处理。


9.根据权利要求8所述的系统,所述操作进一步包括:
接收和与将所述移动计算设备唤醒到所述唤醒模式相关联的所述预定热词的所述其余部分相对应的声音;以及
确定所述预定热词的所述起始部分和所述预定热词的随后部分整体地对应于整个所述预定热词;
响应于确定所述预定热词的所述起始部分和所述预定热词的所述随后部分整体地对应于整个所述预定热词,由所述移动计算设备发起完成将所述移动计算设备唤醒到所述唤醒模式的处理。


10.根据权利要求8所述的系统,所述操作进一步包括:
接收附加声音;
确定与所述预定热词的所述起始部分相对应的所述声音和所述附加声音整体地不与整个所述预定热词相对应;以及
响应于确定与所述预定热词的所述起始部分相对应的所述声音和所述附加声音整体地不与整个所述预定热词相对应,由所述移动计算设备发起将所述移动计算设备返回所述睡眠模式的处理。


11.根据权利要求8所述的系统,其中,所述唤醒模式包括以下中的一个或多个:激活所述移动计算设备的显示器,初始化所述移动计算设备的相机功能,初始化所述移动计算设备上的网络连接,预加载所述移动计算设备上的应用,以及在所述移动计算设备的显示器上显示用户界面。


12.根据权利要求8所述的系统,其中,开始将所述移动计算设备唤醒到所述唤醒模式的处理包括所述移动计算设备的用户无法觉察的处理。


13.根据权利要求8所述的系统,其中,所述预定热词包括特定项,所述特定项触发对所述特定项之后的一个或多个项中的附加项的语义解释。


14.根据权利要求9所述的系统,其中,确定所述预定热词的所述起始部分和所述预定热词的所述随后部分整体地对应于整个所述预定热词包括以下中的至少一个:(i)将所述预定热词的所述起始部分和所述预定热词的所述随后部分的一个或多个声学特征和与存储在数据库中的一个或多个热词相关联的一个或多个声学特征进行比较,或者(ii)将所述预定热词的所述起始部分和所述预定热词的所述随后部分的转录和与存储在数据库中的一个或多个热词相关联的一个或多个转录进行比较。


15.一种计算机实现的方法,包括:
接收音频数据;
由移动计算设备的、在所述移动计算设备处于低功耗状态中时保持激活的组件确定所述音频数据编码了预定激活项的前缀的可能发声,所述预定激活项发起对所述移动计算设备的硬件组件的激活,所述硬件组件(i)或则在所述移动计算设备处于所述低功耗状态中时被停用,并且(ii)或则在所述移动计算设备处于唤醒状态中时被激活;以及
(a)响应于由移动计算设备的、在所述移动计算设备处于低功耗状态中时保持激活的所述组件确定所述音频数据编码了发起对所述移动计算设备的、(i)或则在所述移动计算设备处于所述低功耗状态中时被停用并且(ii)或则在所述移动计算设备处于所述唤醒状态中时被激活的硬件组件的激活的预定激活项的前缀的可能发声,并且(b)在所述移动计算设备的所述组件或所述移动计算设备的任何其他组件确定所述音频数据或其他音频数据编码了整个所述预定激活项的可能发声之前,激活所述移动设备的、(i)或则在所述移动计算设备处于所述低功耗状态中时被停用并且(ii)或则在所述移动计算设备处于所述唤醒状态中时被激活的硬件组件。


16.根据权利要求15所述的计算机实现的方法,其中,确定所述音频数据编码了发起对所述移动计算设备的、(i)或则在所述移动计算设备处于所述低功耗状态中时被停用并且(ii)或则在所述移动计算设备处于所述唤醒状态中时被激活的硬件组件的激活的所述预定激活项的所述前缀的可能发声包括:
识别所述音频数据的一个或多个声学特征;
将所述音频数据的所述一个或多个声学特征和与数据库中存储的一个或多个预定激活项的前缀相关联的一个或多个声学特征进行比较,所述一个或多个预定激活项的前缀包括所述预定激活项的所述前缀;以及
基于所述比较,确定所述音频数据对应于所述预定激活项的所述前缀。


17.根据权利要求15所述的计算机实现的方法,其中,确定所述音频数据编码了发起对所述移动计算设备的、(i)或则在所述移动计算设备处于所述低功耗状态中时被停用并且(ii)或则在所述移动计算设备处于所述唤醒状态中时被激活的硬件组件的激活的所述预定激活项的所述前缀的可能发声包括:
获得所述音频数据的转录;
将所述音频数据的所述转录和与一个或多个预定激活项的前缀相关联的一个或多个转录进行比较,所述一个或多个预定激活项的前缀包括所述预定激活项的所述前缀;以及
基于所述比较,确定所述音频数据对应于所述预定激活项的所述前缀。


18.根据权利要求15所述的计算机实现的方法,其中,激活所述移动设备的、(i)或则在所述移动计算设备处于所述低功耗状态中时被停用并且(ii)或则在所述移动计算设备处于所述唤醒状态中时被激活的所述硬件组件包括:提供中断信号,所述中断信号初始化所述移动设备的、(i)或则在所述移动计算设备处于所述低功耗状态中时被停用并且(ii)或则在所述移动计算设备处于所述唤醒状态中时被激活的所述硬件组件。


19.根据权利要求15所述的计算机实现的方法,其中,激活所述移动设备的、(i)或则在所述移动计算设备处于所述低功耗状态中时被停用并且(ii)或则在所述移动计算设备处于所述唤醒状态中时被激活的所述硬件组件包括:
选择与所述预定激活项的所述前缀相关联的一个或多个动作的集合;以及
使得执行所述集合中的所述一个或多个动作。


20.根据权利要求19所述的计算机实现的方法,其中,所述集合中的所述一个或多个动作包括这样的动作:所述动作的相应结果对于执行所述动作的所述计算设备的用户而言是无法觉察的。


21.如权利要求15所述的计算机实现的方法,进一步包括:
由移动计算设备的、在所述移动计算设备处于低功耗状态中时保持激活的所述组件来确定:所述音频数据或其他音频数据编码了整个所述预定激活项的可能发声;以及
在确定所述音频数据或其他音频数据编码了整个所述预定激活项的可能发声之后,确定整个所述预定激活项包括特定激活项,所述特定激活项触发对所述特定激活项之后的一个或多个项中的附加项的语义解释。


22.一种系统,包括:
一个或多个处理器和一个或多个存储指令的存储设备,所述指...

【专利技术属性】
技术研发人员:马修·谢里菲
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1