带有语音识别的麦克风电路总成和系统技术方案

技术编号：10428515 阅读：141 留言：0更新日期：2014-09-12 19:12

本发明专利技术涉及带有语音识别的麦克风电路总成和系统。所述麦克风电路总成包括麦克风前置放大器和模拟-数字转换器以以第一预定采样速率生成麦克风信号样本。语音特征提取器被配置为接收和处理麦克风信号样本预定块以提取表示所述麦克风信号样本的语音特征的语音特征向量。所述麦克风电路总成还包括语音词汇表，其包括被编码为目标特征向量集的人类语音的目标词或目标短语，以及判定电路，其被配置为将所述语音特征提取器生成的所述语音特征向量与所述目标特征向量进行比较以检测目标语音词或短语。控制器被配置为在所述麦克风电路总成的外部可接入输出端上生成识别信号以响应所述麦克风信号样本中被识别的目标词或短语。

全部详细技术资料下载

【技术实现步骤摘要】
带有语音识别的麦克风电路总成和系统本专利技术一方面涉及用于连接至外部应用程序处理器(比如，可编程数字信号处理器)的麦克风电路总成。麦克风电路总成包括麦克风前置放大器和模拟-数字转换器以以第一预定采样速率生成麦克风信号样本。语音特征提取器被配置为接收和处理麦克风信号样本预定块以提取表示麦克风信号样本的语音特征的语音特征向量。麦克风电路总成还包括语音词汇表，其包括被编码为目标特征向量集的人类语音的目标词或目标短语，以及判定电路，其被配置为将语音特征提取器生成的语音特征向量与目标特征向量进行比较以检测目标语音词或短语。控制器被配置为在麦克风电路总成的外部可接入输出端子上生成识别信号以响应麦克风信号样本中被识别的目标词或短语。本专利技术的其它方面涉及包括麦克风电路总成的数字信号处理系统。专利技术背景在语音识别系统中，应用于进入的通常由安装在便携式通信设备(如，电话、玩具、电视机或PC等)内的麦克风生成的语音信号的第一滤波器组通常是梅尔倒频谱系数(MFCC)滤波器组的变体，无论底层语音识别系统是否基于神经网络(NN)、隐马尔可夫模型(HMM)或因子图(FG)。整个语音识别系统的目的是提供对装置功能(比如，从睡眠模式变为唤醒或开机)的语音激活控制。然而，已知的语音识别装置和系统的MFCC滤波器组在计算上很复杂，并因此常常在可编程应用程序处理器(比如，可编程定点或浮点DSP内核或引擎)上执行。这些类型的DSP内核常常使用24位或32位字长来表示进入的语音/音频信号样本，致使具有对应字长的数据路径电路、数据寄存器和逻辑来适应进入的音频样本的字格式。该特征导致在处理进入的语音...
带有语音识别的麦克风电路总成和系统

【技术保护点】
一种用于连接至外部应用程序处理器的麦克风电路总成，包括：麦克风前置放大器，其包括用于接收麦克风信号的输入端子，模拟‑数字转换器，其被配置为接收所述麦克风前置放大器的输出信号，并以第一预定采样速率生成对应的麦克风信号样本，语音特征提取器，其被配置为接收和处理麦克风信号样本预定块以提取表示所述麦克风信号样本的语音特征的语音特征向量，语音词汇表，其包括被编码为目标特征向量集的人类语音的目标词或目标短语，控制器，其包括被配置为将所述语音特征提取器生成的所述语音特征向量与所述目标特征向量进行比较以检测所述目标语音词或短语的判定电路，所述控制器被配置为在外部可接入输出端子上生成识别信号以响应所述麦克风信号样本中被识别出的目标词或短语。

【技术特征摘要】
2013.03.08 US 13/789,8471.一种用于连接至外部应用程序处理器的麦克风电路总成，包括: 麦克风前置放大器，其包括用于接收麦克风信号的输入端子，模拟-数字转换器，其被配置为接收所述麦克风前置放大器的输出信号，并以第一预定采样速率生成对应的麦克风信号样本，语音特征提取器，其被配置为接收和处理麦克风信号样本预定块以提取表示所述麦克风信号样本的语音特征的语音特征向量，语音词汇表，其包括被编码为目标特征向量集的人类语音的目标词或目标短语，控制器，其包括被配置为将所述语音特征提取器生成的所述语音特征向量与所述目标特征向量进行比较以检测所述目标语音词或短语的判定电路，所述控制器被配置为在外部可接入输出端子上生成识别信号以响应所述麦克风信号样本中被识别出的目标词或短语。2.根据权利要求1所述的麦克风电路总成，其包括用于将所述麦克风信号样本传输至外部应用程序处理器的数据通信接口。3.根据权利要求2所述的麦克风电路总成，其中所述麦克风前置放大器和所述模拟-数字转换器至少可在以下中操作: 具有第一功率消耗的第一功率模式，其中具有第一动态范围的麦克风信号样本以所述第一预定采样速率生成；以及具有第二功率消耗的第二功率模式，其中具有第二动态范围的麦克风信号样本以第二预定采样速率生成；其中所述第二动态范围大于所述第一动态范围，且所述第二功率消耗大于所述第一功率消耗。4.根据权利要求3所述的麦克风电路总成,其中所述麦克风信号样本的所述第一动态范围小于72dB，优选小于66dB ；所述动态范围被测量为信噪比加上所述麦克风信号样本的THD，信号取值为相对于所述麦克风前置放大器的AC短路输入端子的麦克风信号样本的A计权噪音电平的IkHz满标度麦克风输入信号。5.根据权利要求4所述的麦克风电路总成，其中所述数字麦克风信号的所述第二动态范围大于82dB。6.根据权利要求3所述的麦克风电路总成，其中所述模拟-数字转换器被配置为以8至16kHz的采样速率生成所述麦克风信号样本。7.根据权利要求3所述的麦克风电路总成，其中由所述模拟-数字转换器生成的所述麦克风信号样本的所述第二预定采样速率等于或大于32kHz。8.根据权利要求3所述的麦克风电路总成，其中所述控制器进一步被配置为: 从所述麦克风前置放大器和所述模拟-数字转换器的所述第一功率模式切换至所述第二功率模式以响应识别出的目标词或短语，通过所述数据通信接口传输麦克风信号样本以响应所述识别出的目标词或短语。9.根据权利要求3所述的麦克风电路总成，包括: 配置寄存器，其包括控制{所述麦克风前置放大器、所述模拟-数字转换器、所述语音特征提取器}中的至少一个的可编程设置的参数值；所述控制器被配置为用于通过所述数据通信接口接收包括所述参数值的配置数据。10.根据权利要求9所述的麦克风电路总成，其中所述控制器被配置为: 读取所述配置数据，提取并选择与所述麦克风前置放大器和所述模拟-数字转换器中的一个的所述可编程设置相关的参数值，将一个或多个参数值写入所述配置寄存器的各个地址以选择所述第一功率模式和所述第二功率模式中的一个。11.根据权利要求9所述的麦克风电路总成，其中所述控制器被配置为: 读取所述配置数据，选择与所述语音特征提取器的所述可编程设置相关的参数值，将参数值写入所述配置寄存器以选择所述语音特征提取器的所述可编程设置。12.根据权利要求2所述的麦克风电路总成，包括: 圆形语音数据缓冲器，其用于存储表示所述麦克风信号样本的预定时间段的连续语音片段。13.根据...

【专利技术属性】
技术研发人员：M·莫尔滕森，
申请(专利权)人：亚德诺半导体股份有限公司，
类型：发明
国别省市：丹麦;DK

全部详细技术资料下载我是这个专利的主人