当前位置: 首页 > 专利查询>英特尔公司专利>正文

经由间歇采样的低功率音频触发器制造技术

技术编号:10430924 阅读:160 留言:0更新日期:2014-09-17 10:13
本发明专利技术涉及经由间歇采样的低功率音频触发器。系统和方法可提供在定期检测窗口的第一部分期间使用移动装置的音频前端从音频信号获得采样音频,并且在该定期检测窗口的第二部分期间降低音频前端的一个或多个部件的功耗。另外,可至少部分基于采样音频做出关于在音频信号中是否存在语音活动的确定。在一个示例中,第一部分的长度和第二部分的长度由定期检测窗口的占空比限定。

【技术实现步骤摘要】
经由间歇采样的低功率音频触发器
实施例大体上涉及移动装置。更特定地,实施例涉及使用低功率语音触发器来发起与移动装置的交互。
技术介绍
移动装置的免提操作在例如车载操作和与残疾相关的使用场景等多种背景下可有关。然而,在免提设置中发起移动装置交互可提出许多挑战。例如,常规技术方案可指定预先设置的激活短语(例如,“喂计算机”),其实现基于话语的用户界面用于进一步交互,其中可对音频连续采样以供短语识别器分析直到检测到激活短语。这样的方法可增加功耗并且对电池寿命具有负面影响。 【附图说明】 实施例的各种优势将通过阅读下列说明书和附上的权利要求并且通过参考下列图而对本领域内技术人员变得明显,其中:图1是根据实施例的语音触发器架构的示例的框图;图2是根据实施例对于多种帧大小的语音触发器准确性vs.语音活动检测器始发持续时间的示例的标绘图;图3是根据实施例发起与移动装置的交互的方法的示例的流程图;图4是根据实施例的移动装置的示例的框图。 【具体实施方式】 现在转向图1,示出低功率语音触发器架构24。该架构24大体上可用于在免提设置中(例如,在用户不按压按钮或用别的方式触碰移动装置的情况下)实现与移动装置的语音交互始发的检测。在图示的示例中,音频前端10包括麦克风12、模数(A/D)转换器14、存储器16、语音活动检测器(VAD) 18和短语识别器20。如将更详细论述的,例如定期检测窗口等窗口可由对于架构24的功率管理模块22 (例如,其包括功率管理逻辑)建立,其中该定期检测窗口具有占空比,其限定定期检测窗口的活跃部分(例如,采样帧)和定期检测窗口的不活跃部分(例如,丢弃帧)。特别要注意的是,不活跃部分可对移动装置实现很大的功率节省和延长的电池寿命。 更特定地,在定期检测窗口的活跃部分期间,音频前端10可用于从麦克风12捕获的音频信号获得采样音频。在这样的情况下,A/D转换器14可以特定采样速率(例如,每秒X个样本)对音频信号采样来获得对于定期检测窗口的每个活跃部分/采样帧的采样音频(例如,N毫秒的音频数据)。 另一方面,在定期检测窗口的不活跃部分期间,音频前端10可放弃音频信号的任何采样并且功率管理模块22可降低音频前端10的一个或多个部件的功耗。例如,在定期检测窗口的不活跃部分期间,功率管理模块22可对麦克风12、A/D转换器14、语音活动检测器18和/或短语识别器20断电,使存储器16处于自刷新模式,等。从而,前端10可持续奇数N毫秒地对音频信号采样,然后持续偶数N毫秒地“睡眠”(在每个定期检测窗口期间)。特别要注意的是,降低在定期检测窗口的不活跃部分期间音频前端10的部件的功耗可明显延长移动装置的电池寿命。 在一个示例中,可在确定采样帧(S卩,定期检测窗口的活跃部分)和丢弃帧(S卩,定期检测窗口的不活跃部分)的长度时考虑与加电和掉电操作关联的开销。例如,采样帧的长度(例如,采样帧长度)可选为充分地大于与音频前端10的加电操作关联的任何开销持续时间以便确保能量节省不被本文描述的占空循环方法所无效。相似地,丢弃帧的长度(例如,丢弃帧长度)可选为充分大于与音频前端10的掉电操作关联的任何开销持续时间。在这方面,根据情况,定期检测窗口的占空比可以是50%,或某其他值。例如,如果掉电开销相对于加电开销是低的,占空比可能增加到大于50%的值以便增加采样帧长度并且进一步优化功率节省。 采样音频可在存储器16中缓冲,其中图示的语音活动检测器18至少部分基于采样音频来确定在音频信号中是否存在语音活动。从而,图示的语音活动检测器18可基于在定期检测窗口的活跃部分期间获得的奇数N毫秒帧来做出活动决策。如果检测到语音活动,短语识别器20可分析采样音频来确定在音频信号中是否存在预先设置的激活短语。 图2示出对于多种采样帧大小的语音触发器准确性vs.VAD始发持续时间的标绘图26。VAD始发持续时间可对应于缓冲存储器的大小,例如用于存储根据如本文描述的占空比获得的采样音频的存储器16 (例如,缓冲量)。在图示的示例中,标绘图26证明对于多至40毫秒的采样帧大小以及多至160毫秒的始发持续时间,准确性下降可以是能接受的(例如,在2%内)。 现在转向图3,示出发起与移动装置交互的方法30。该方法30可在移动装置中实现为一组逻辑指令,其存储在例如随机存取存储器(RAM)、只读存储器(ROM)、可编程ROM(PR0M)、固件、闪速存储器等机器或计算机可读存储介质中,在例如可编程逻辑阵列(PLA)、现场可编程门阵列(FPGA)、复杂可编程逻辑装置(CPLD)等可配置逻辑中,在使用例如专用集成电路(ASIC)、互补金属氧化物半导体(CMOS)或晶体管-晶体管逻辑(TTL)技术等电路技术的固定功能性逻辑硬件中,或其任何组合。例如,用于实施在方法30中示出的操作的计算机程序代码可用一个或多个编程语言的任何组合来编写,包括例如Java、Smalltalk、C++或类似物等面向对象编程语言以及例如“C”编程语言或相似的编程语言等常规的程序化编程语目。 图示的处理框32在定期检测窗口的第一部分期间使用移动装置的音频前端从音频信号获得采样音频。音频前端的一个或多个部件的功耗可在框34在定期检测窗口的第二部分期间降低,其中可在框36至少部分基于采样音频做出关于在音频信号中是否存在语音活动的确定。如果是这样的话,图示的框38继续对音频信号采样(例如,中止占空比采样)以便提高短语检测目的的准确性。否则,过程可重复直到检测到语音活动。 图4示出移动装置40。该移动装置40可以是具有计算功能性(例如,个人数字助理/PDA、膝上型电脑、智能平板电脑)、通信功能性(例如,无线智能电话)、成像功能性、媒体播放功能性(例如,智能电视/TV)或其任何组合(例如,移动互联网装置/MID)的平台的部分。在图示的示例中,装置40包括用于向装置40提供电力的电池58和具有集成存储器控制器aMC) 44的处理器42,该集成存储器控制器aMC) 44可与系统存储器46通信。系统存储器46可包括例如动态随机存取存储器(DRAM),其配置为一个或多个存储器模块,例如双直列存储器模块(DIMM)、小型DIMM (SODIMM),等。 图示的装置40还包括输入输出(1)模块48,有时称为芯片集的南桥,其起到主机装置的作用并且可与例如音频编解码器50、麦克风52、一个或多个扬声器54以及大容量存储56 (例如,硬盘驱动器/HDD、光盘、闪速存储器,等)通信。音频编解码器50、麦克风52、1模块48等可以是例如已经论述的音频前端10(图1)等音频前端的部分。图示的处理器62 (其可起到与例如功率管理模块22 (图1)等功率管理模块相似的作用)可执行逻辑60,其配置成在定期检测窗口的第一部分期间使用音频前端从音频信号获得采样音频。该逻辑60还可在定期检测窗口的第二部分期间降低音频前端的一个或多个部件的功耗,并且至少部分基于采样音频确定在音频信号中是否存在语音活动。逻辑60可备选地在处理器42外部实现。另外,处理器42和1模块48可共同在相同的半导体晶片上实现为芯片上系统(SoC)。 额外的注意和示例:示例一可包括移动装置,其具有用于对该移本文档来自技高网...

【技术保护点】
一种用于发起交互的移动装置,其包括:电池,用于对所述移动装置供电;音频前端;以及逻辑,用于在窗口的第一部分期间使用所述音频前端从音频信号获得采样音频;在所述窗口的第二部分期间降低所述音频前端的一个或多个部件的功耗;以及至少部分基于采样音频确定在所述音频信号中是否存在语音活动。

【技术特征摘要】
2013.03.15 US 13/8411661.一种用于发起交互的移动装置,其包括: 电池,用于对所述移动装置供电; 音频前端;以及 逻辑,用于 在窗口的第一部分期间使用所述音频前端从音频信号获得采样音频; 在所述窗口的第二部分期间降低所述音频前端的一个或多个部件的功耗;以及 至少部分基于采样音频确定在所述音频信号中是否存在语音活动。2.如权利要求1所述的移动装置,其中所述第一部分的长度和所述第二部分的长度由所述窗口的占空比限定。3.如权利要求1所述的移动装置,其中所述第一部分大于与所述音频前端的一个或多个加电操作关联的第一开销持续时间,并且所述第二部分大于与所述音频前端的一个或多个掉电操作关联的第二开销持续时间。4.如权利要求1所述的移动装置,其中所述逻辑用于以一定采样速率对所述音频信号采样来获得采样音频。5.如权利要求1-4中任一项所述的移动装置,其中所述音频前端包括麦克风、语音活动检测器、模数转换器、存储器和短语识别器中的一个或多个。6.一种用于发起交互的设备,其包括: 逻辑,用于 在窗口的第一部分期间使用移动装置的音频前端从音频信号获得采样音频; 在所述窗口的第二部分期间降低所述音频前端的一个或多个部件的功耗;以及 至少部分基于采样音频确定在所述音频信号中是否存在语音活动。7.如权利要求6所述的设备,其中所述第一部分的长度和所述第二部分的长度由所述窗口的占空比限定。8.如权利要求6所述的设备,其中所述第一部分大于与所述音频前端的一个或多个加电操作关联的第一开销持续时间,并且所述第二部分大于与所述音频前端的一个或多个掉电操作关联的第二开销持续时间。9.如权利要求6所述的设备,其中所述逻辑用于以一定采样速率对所述音频信号采样来获得采样音频。10.如权利要求6所述的设备,其中所述逻辑用于将所述采样音频存储到所述音频前端的存储器。11.如权利要求6所述的设备,其中如果在所述音频信号中存在语音活动则所述逻辑连续对所述音频信号采样。12.如权利要求6-11中任一项所述的设备,其中在所述窗口的第二部分期间降低麦克风、语音活动检测器、模数转换器、存储器和短语识别...

【专利技术属性】
技术研发人员:L克里斯纳默斯ME戴舍尔FM塔拉佩PR达特塔
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1