用于语音验证的系统及方法技术方案

技术编号:15529999 阅读:46 留言:0更新日期:2017-06-04 17:13
本发明专利技术涉及一种用于验证唤醒话语的系统及方法。本发明专利技术的实施例可包含在第一计算装置处从第二计算装置接收音频信号,所述音频信号被识别为可能包含唤醒话语。实施例可进一步包含将所述音频信号倒回到所述唤醒话语的开始点,以产生经倒回音频信号。实施例可还包含确定所述经倒回音频信号是否包含所述唤醒话语。实施例可进一步包含将反馈传输到所述第二计算装置,其中所述反馈包含继续睡眠指示及接受检测指示中的至少一者。

System and method for voice verification

The present invention relates to a system and method for validating wakeup utterances. Embodiments of the present invention may include receiving an audio signal from a second computing device at a first computing device that is identified as possibly including a wakeup utterance. Embodiments may further include the starting point of the audio signal back to the wake of discourse, to produce the rewind audio signal. It also includes the determination of whether to the audio signal containing the wake-up embodiment of discourse. Embodiments may further include transmission of feedback to the second computing device, wherein the feedback includes at least one of the sleep instructions and the acceptance test instructions.

【技术实现步骤摘要】
【国外来华专利技术】用于语音验证的系统及方法相关申请案的交叉参考本申请案主张2014年8月19日申请的标题为“用于语音验证的系统及方法(SystemandMethodforSpeechValidation)”的第14/463,014号美国专利申请案的权利。所述案的全部揭示内容以引用方式并入本文中。
本专利技术大体上涉及一种用于语音辨识的方法,且更特定来说,涉及一种用于验证可在计算装置处接收的语音(例如唤醒话语)的方法。
技术介绍
语音辨识或自动语音辨识(“ASR”)涉及识别口头话语的计算机化过程。语音辨识存在许多用途,包含语音转录、语音翻译、通过话音控制装置及软件应用的能力、呼叫路由系统、互联网的话音搜索等。语音辨识系统可视需要与口语理解系统配对以提取在与系统交互时执行的语义及/或命令。语音辨识系统是高度复杂的且通过匹配发声的声学标记图与话语的声学标记图来操作。此匹配可视需要组合统计语言模型。因此,声学建模及语言建模两者用于语音辨识过程中。声学模型可从口头发声的音频记录以及相关联转录产生。声学模型然后定义对应话语的个别声音的统计表示。语音辨识系统使用声学模型以识别声音序列,同时语音辨识系统使用统计语言模型以从经识别声音识别可能的话语序列。提供话音启动或话音命令功能的语音辨识使说话人能够通过说出各种指令来控制装置及系统。举例来说,说话人可发出命令以执行具体任务或发出询问以检索具体结果。口头输入可遵循执行具体任务的一组严格短语,或口头输入可为由语音辨识系统的自然语言单元解译的自然语言。在便携式装置尤其是电池供电便携式装置(例如手机、膝上型计算机及桌上型计算机)上,话音命令功能变得越来越流行。一些装置可包含唤醒话语特征,其中主要话音控制应用保持处于“睡眠”状态直到检测到口头唤醒命令为止。在一些唤醒实施方案中,装置允许包含对话音控制应用的唤醒命令及随后而来的主要命令两者的连续音频流的无缝处理。
技术实现思路
在一个实施方案中,提供一种用于验证唤醒话语的方法。本专利技术的实施例可包含在第一计算装置处从第二计算装置接收音频信号,所述音频信号被识别为可能包含唤醒话语。实施例可进一步包含将所述音频信号倒回到所述唤醒话语的开始点,以产生经倒回音频信号。实施例还可包含确定所述经倒回音频信号是否包含所述唤醒话语。实施例可进一步包含将反馈传输到所述第二计算装置,其中所述反馈包含继续睡眠指示及接受检测指示中的至少一者。可包含下列特征中的一或多者。在一些实施例中,所述开始点可包含所述唤醒话语之前的预定量的静音。所述方法可包含将所述经确定唤醒话语传输到所述第二计算装置。所述方法可进一步包含从所述第二计算装置接收反馈,其中所述反馈包含继续睡眠指示及接受检测指示中的至少一者。在一些实施例中,反馈可包含所述唤醒话语的经改良发音及阈值设置变更建议中的至少一者。所述方法还可包含对所述音频信号及所述经倒回音频信号中的至少一者执行话音生物统计学分析。所述方法可进一步包含计算与所述可能的唤醒话语相关联的置信度得分。所述方法还可包含至少部分基于所述置信度得分确定是否传输所述经倒回信号。在另一实施方案中,提供一种用于验证唤醒话语的方法。本专利技术的实施例可包含在第一计算装置处从第二计算装置接收音频信号,所述音频信号被识别为可能包含唤醒话语。所述方法可进一步包含将所述音频信号倒回到所述唤醒话语的开始点,以产生经倒回音频信号。所述方法还可包含确定所述经倒回音频信号是否包含所述唤醒话语。所述方法可另外包含将反馈传输到所述第二计算装置,其中所述反馈包含继续睡眠指示及接受检测指示中的至少一者。可包含下列特征中的一或多者。在一些实施例中,所述开始点可包含所述唤醒话语之前的预定量的静音。所述方法可进一步包含从所述第一计算装置接收可能的唤醒话语。在一些实施例中,反馈可包含所述唤醒话语的经改良发音及阈值设置变更建议中的至少一者。所述方法还可包含对所述音频信号及所述经倒回音频信号中的至少一者执行话音生物统计学分析。在另一实施方案中,提供一种系统。所述系统可包含一或多个处理器,所述一或多个处理器经配置以在第一计算装置处从第二计算装置接收音频信号,所述音频信号被识别为可能包含唤醒话语。所述一或多个处理器可经配置以将所述音频信号倒回到所述唤醒话语的开始点,以产生经倒回音频信号。所述一或多个处理器可进一步经配置以确定所述经倒回音频信号是否包含所述唤醒话语。所述一或多个处理器可进一步经配置以将反馈传输到所述第二计算装置,其中所述反馈包含继续睡眠指示及接受检测指示中的至少一者。可包含下列特征中的一或多者。在一些实施例中,所述开始点可包含所述唤醒话语之前的预定量的静音。所述一或多个处理器可经配置以从所述第一计算装置接收可能的唤醒话语。反馈可包含所述唤醒话语的经改良发音及阈值设置变更建议中的至少一者。所述一或多个处理器可经配置以对所述音频信号及所述经倒回音频信号中的至少一者执行话音生物统计学分析。在附图及下文描述中陈述一或多个实施方案的细节。从具体实施方式、附图说明及权利要求书,其它特征及优点将变得显而易见。附图说明图1是根据本专利技术的实施例的语音验证过程的实例的示意视图;图2是根据本专利技术的实施例的语音验证过程的流程图;图3是根据本专利技术的实施例的语音验证过程的流程图;及图4展示可用来实施本文中描述的语音验证过程的计算机装置及移动计算机装置的实例。各个图式中的相同参考符号可指示相同元件。具体实施方式本文中提供的实施例旨在一种用于验证语音的系统及方法。如本文中使用,短语“唤醒特征”可指代其中可在装置上处理连续音频流以检测是否说出唤醒短语或唤醒话语的情况。在许多产品中提供有唤醒特征(例如在手持机上、在电视机中、在汽车中及/或在其中可需要免提接口的实例中的个人助理)。所述特征的一个挑战是其可连续地运行,此常暗指所述特征必须以小CPU/电池/存储器预算操作且无需网络连接。在检测到唤醒之后,可建立网络连接,相同发声中或新采集物上的循序音频可透过所述网络连接输送到运行应用(例如,消息传送、网页搜索等)的全部极大词汇表的网络ASR服务器。关于语音辨识方法及唤醒话语的额外信息可在可购自本专利技术的受让人的具有申请案序号13/456,959的第2013/0289994号美国公开案中找到,所述案的副本的全文以引用方式并入本文中。此方法的一个问题是小CPU/电池/存储器预算通常暗指最佳算法可能尚未被使用,借此导致许多分类错误(例如,错误检测及错误拒绝)。一些检测管线是分阶段的,其中后期阶段运行越来越复杂的算法,然而,管线通常仍在比可用于服务器中的硬件更低效的嵌入式硬件上运行。因此,检测算法可具有高分类错误率。据此,本文中包含的实施例建议在服务器端处应用更复杂唤醒短语检测以便减小错误检测的影响。服务器端可运行更复杂声学模型且相对于嵌入式系统可能够实现的错误检测率可能够显著地减小错误检测率。参考图1,图中展示可常驻在计算机12上且可由计算机12执行的语音验证过程10,计算机12可连接到网络14(例如,互联网或局域网)。服务器应用20可包含本文中描述的语音验证过程10的一些或所有元素。计算机12的实例可包含但不限于单个服务器计算机、一系列服务器计算机、单个个人计算机、一系列个人计算机、迷你型计算机、主机计算机、电子邮件服务器、社交网络服务器、本文档来自技高网
...
用于语音验证的系统及方法

【技术保护点】
一种计算机实施方法,其包括:在第一计算装置处接收音频信号;确定所述音频信号是否可能包含唤醒话语;将所述音频信号倒回到所述唤醒话语的开始点,以产生经倒回音频信号;及将所述经倒回音频信号传输到第二计算装置。

【技术特征摘要】
【国外来华专利技术】2014.08.19 US 14/463,0141.一种计算机实施方法,其包括:在第一计算装置处接收音频信号;确定所述音频信号是否可能包含唤醒话语;将所述音频信号倒回到所述唤醒话语的开始点,以产生经倒回音频信号;及将所述经倒回音频信号传输到第二计算装置。2.根据权利要求1所述的方法,其中所述开始点包含所述唤醒话语之前的预定量的静音。3.根据权利要求1所述的方法,其进一步包括:将所述经确定唤醒话语传输到所述第二计算装置。4.根据权利要求1所述的方法,其进一步包括:从所述第二计算装置接收反馈,其中所述反馈包含继续睡眠指示及接受检测指示中的至少一者。5.根据权利要求4所述的方法,其中反馈包含所述唤醒话语的经改良发音及阈值设置变更建议中的至少一者。6.根据权利要求1所述的方法,其进一步包括:对所述音频信号及所述经倒回音频信号中的至少一者执行话音生物统计学分析。7.根据权利要求1所述的方法,其进一步包括:计算与所述可能的唤醒话语相关联的置信度得分。8.根据权利要求7所述的方法,其进一步包括:至少部分基于所述置信度得分确定是否传输所述经倒回信号。9.一种计算机实施方法,其包括:在第一计算装置处从第二计算装置接收音频信号,所述音频信号被识别为可能包含唤醒话语;将所述音频信号倒回到所述唤醒话语的开始点,以产生经倒回音频信号;确定所述经倒回音频信号是否包含所述唤醒话语;及将反馈传输到所述第二计算装置,其中所述反馈...

【专利技术属性】
技术研发人员:J·E·达安
申请(专利权)人:努恩斯通讯公司
类型:发明
国别省市:美国,US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1