【技术实现步骤摘要】
【国外来华专利技术】用于音频特征提取的倒谱方差归一化
本说明书涉及音频处理,并且尤其涉及确定用于倒谱系数特征向量的统计值。
技术介绍
话音或语音识别越来越多地被用作许多不同类型的计算设备中的用户接口的一部分。许多蜂窝电话允许用户按下按钮并对麦克风说话以执行查询并执行各种不同的命令。便携式和台式计算机执行类似的功能。这些系统还可以将语音转换为文本,并将其用作对于约会、消息或存储文档的文本输入。这些系统中的一些系统在设备中本地处理用户语音,但是许多系统将语音的记录发送到远程服务器。汽车还可以接收话音命令以及查询以操作导航系统或车辆中的包括进行呼叫和发送消息的其他功能。话音或语音识别也用于识别、登录和其他目的。用户更喜欢快速响应话音输入;然而,可能需要大量的处理资源来完成语音或任何其他音频的准确分析。此外,许多语音分析技术被设计为接收完整的话语,并且然后将完整的话语整体地进行分析。这要求系统等待用户停止说话,并且然后开始使用整个话语进行处理。这种固有的等待时间可能令人烦恼,特别是与键盘和鼠标输入的即时性相比而言。对于某些系统,可能没有足够的可用存储器来对话语进行缓冲,使得语音分析是不可能的 ...
【技术保护点】
一种方法,包括:接收来自麦克风的数字化音频的帧序列;确定针对所述帧序列的第一帧的特征向量,所述特征向量使用初始均值和初始方差来确定;使用针对所述第一帧的所确定的特征向量来将所述初始均值更新为当前均值;使用所述当前均值和针对所述第一帧的所确定的特征向量来将所述方差更新为当前方差;确定针对所述帧序列中的每个后续帧的下一个特征向量;在确定针对每个后续帧的下一个特征向量之后,将所述当前均值更新为下一个当前均值并将所述当前方差更新为下一个当前方差,并且其中确定针对后续帧的特征向量包括使用所述下一个当前均值和所述下一个当前方差;和将所确定的特征向量发送到音频处理流水线的识别级。
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:接收来自麦克风的数字化音频的帧序列;确定针对所述帧序列的第一帧的特征向量,所述特征向量使用初始均值和初始方差来确定;使用针对所述第一帧的所确定的特征向量来将所述初始均值更新为当前均值;使用所述当前均值和针对所述第一帧的所确定的特征向量来将所述方差更新为当前方差;确定针对所述帧序列中的每个后续帧的下一个特征向量;在确定针对每个后续帧的下一个特征向量之后,将所述当前均值更新为下一个当前均值并将所述当前方差更新为下一个当前方差,并且其中确定针对后续帧的特征向量包括使用所述下一个当前均值和所述下一个当前方差;和将所确定的特征向量发送到音频处理流水线的识别级。2.根据权利要求1所述的方法,还包括:将所述初始均值和方差设置为针对所述数字化音频的估计值。3.根据权利要求1或2所述的方法,其中,基于针对所述第一帧所确定的特征向量来设置所述初始均值和方差。4.根据上述权利要求中任一项或多项所述的方法,其中,确定特征向量包括确定梅尔频率倒谱系数。5.根据权利要求4所述的方法,其中,所述当前均值包括倒谱均值,并且所述当前方差包括倒谱方差。6.根据权利要求5所述的方法,其中,确定下一个特征向量包括使用倒谱均值减法和倒谱方差归一化来确定下一个特征向量。7.根据上述权利要求中任一项或多项所述的方法,其中,所述数字化音频是语音。8.根据上述权利要求中任一项或多项所述的方法,其中,所述识别级包括解码器,所述方法还包括在所述解码器处接收所确定的特征向量,并在所述解码器处确定所述数字化语音是否与经认证的用户匹配。9.根据上述权利要求中任一项或多项所述的方法,其中,在每个下一个特征向量之后仅使用对应的下一个特征向量和所述帧序列的较早帧的特征向量来确定下一个当前均值。10.根据权利要求9所述的方法,其中,在每个下一特征向量之后仅使用相应的下一个当前均值来确定所述下一个当前方差。11.一种在其上具有指令的机器可读介质,所述指令当由机器执行时使所述机器执行操作,所述操作包括:接收来自麦克风的数字化音频的帧序列;确定针对所述帧序列的第一帧的特征向量,所述特征向量使用初始均值和初始方差来确定;使用针对所述第一帧的所确定的特征向量来将所述初始均值更新为当前均值;使用所述当前均值和针对所述第一帧的所确定的特征向量来将所述方差更新为当前方差;确定针对所述帧序列中的每个后续帧的下一个特征向量;在确定针对每个后续帧的下一个特征向量之后,将所述当前均值更新为下一个当前均值并将所述当前方差更新为下一个当前方差,并且其中确定针对后续帧的特征向量包括使用所述下一个当前均值和所述下一个当前方差;和将所确定的特征向量发送到音频处理流水线的识别级。12.根据权利要求11所述的介质,其中确定特征向量包括确定梅尔频率倒谱系数。13.如权利要求12所述的介质,其中,所述当前均值包括倒谱均值,并且所述当前方差包括倒谱方差。14.根据权利要求13所述的介质,其中,确定下一特征向量包括使用倒...
【专利技术属性】
技术研发人员:A马雷克,T博克莱特,
申请(专利权)人:英特尔公司,A·马雷克,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。