头部安装的多-感觉音频输入系统技术方案

技术编号：3046465 阅读：203 留言：0更新日期：2012-04-11 18:40

本发明专利技术将常规的音频话筒与附加的语音传感器组合起来，语音传感器基于输入提供语音传感器信号。语音传感器信号是基于由说话者在讲话期间采取的动作诸如面部运动、骨振动、喉部阻抗变化等而产生的。语音检测器组件从语音传感器接收输入并输出语音检测信号，表示用户是否正在说话。语音检测器基于话筒信号和语音传感器信号产生语音检测信号。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频输入系统。更具体地说，本专利技术涉及在多-感觉变送器输入系统中的语音处理。
技术介绍
在许多不同的语音识别应用中，具有清晰和一致的音频输入是非常重要且可以是决定性的，音频输入代表着要提供给自动语音识别系统的语音。倾向于破坏给语音识别系统的音频输入的两类噪声是环境噪声和由背景语音产生的噪声。为了消除来自音频输入的环境噪声，现在已经在开发噪声消除技术方面进行了大量的工作。有些技术已经在音频处理软件中商业化，或者集成到数字话筒诸如通用串行总线(USB)话筒中。处理与背景语音有关的噪声是一个更难以解决问题。这可以在各种各样不同的噪声环境中发生。例如，当感兴趣的说话者在人群中或者在他人之间说话，常规的话筒经常拾取不同于感兴趣的说话者的说话者语音。实际上，在其它人正在讲话的任何环境中，由感兴趣的说话者产生的音频信号能受其他人讲话的危害。处理背景语音的一个现有的解决方案是在耳机线上或在听筒上提供开启/关闭开关。开启/关闭开关称为“推按讲话(push-to-talk)”按钮，并要求用户在说话之前推按该按钮。当用户推按按钮时，它产生一个按钮信号。按钮信号向语音识别系统表示，感兴趣的说话者正在说话，或者将要说话。不过，有些可用性研究显示这种类型的系统不令人满意或者不是用户所想要的。另外，已经在尝试将由话筒拾取的背景说话者与感兴趣的说话者(或前台话说者)分离开来方面进行了工作。这在清楚的办公室环境中工作得相当好，但已证明了在高度嘈杂的环境中不行。在另外一种现有技术中，将来自标准话筒的信号与来自喉式话筒的信号组合起来。喉式话筒间接地通过测量在说话过程中穿过喉...

【技术保护点】
一种语音识别系统，其特征在于，包括：音频话筒，基于检测到音频输入输出话筒信号；语音传感器，基于由语音动作产生的非音频输入输出传感器信号；以及语音检测器组件，基于传感器信号输出语音检测信号，表示用户是否正在说话。

【技术特征摘要】
US 2003-7-29 10/629,278;US 2003-8-7 10/636,1761.一种语音识别系统，其特征在于，包括音频话筒，基于检测到音频输入输出话筒信号；语音传感器，基于由语音动作产生的非音频输入输出传感器信号；以及语音检测器组件，基于传感器信号输出语音检测信号，表示用户是否正在说话。2.如权利要求1所述的语音检测系统，其特征在于，语音检测器组件基于传感器信号的第一特性和基于话筒信号输出语音检测信号。3.如权利要求2所述的语音检测信号，其特征在于，传感器信号的第一特性具有用户正在说话时的第一电平和用户不在说话时的第二电平，其中，语音检测器组件基于传感器信号的第一特性的电平相对于包括特性的第一和第二电平中的预定的一个的第一特性的基线电平，输出语音检测信号。4.如权利要求3所述的语音检测系统，其特征在于，基线电平是基于经过一段时间的第一特性的电平来计算的。5.如权利要求4所述的语音检测系统，其特征在于，基线电平是通过平均经过一段时间的第一特性的电平来计算的。6.如权利要求4所述的语音检测系统，其特征在于，基线电平是间歇地在语音检测系统的操作过程中重新计算的。7.如权利要求6所述的语音检测系统，其特征在于，基线电平是周期性地重新计算的，以代表经过一个循环的时间窗的第一特性的电平。8.如权利要求6所述的语音检测系统，其特征在于，语音检测器组件基于传感器信号的第一特性的电平与基线电平的比较，输出语音检测信号，其中，比较是周期性地进行的。9.如权利要求8所述的语音检测系统，其特征在于，比较是比重新计算基线电平更频繁地进行的。10.如权利要求1所述的语音检测系统，其特征在于，音频话筒和语音传感器安装在头戴式耳机上。11.一种语音识别系统，其特征在于，包括语音检测系统，包括音频话筒，基于检测到音频输入，输出话筒信号；语音传感器，基于由语音动作产生的非音频输入，输出传感器信号；以及语音检测器组件，基于话筒信号和传感器信号，输出语音检测信号，表示用户是否正在说话；以及语音识别引擎，基于话筒信号和语音检测信号，提供识别输出，表示在检测到的音频输入中的语音。12.如权利要求11所述的语音识别系统，其特征在于，语音检测器组件计算语音检测信号作为语音检测测量，表示用户正在说话的概率。13.如权利要求12所述的语音识别系统，其特征在于，语音检测器组件将语音检测测量与话筒信号组合起来以产生组合信号。14.如权利要求13所述的语音识别系统，其特征在于，语音识别引擎基于组合信号产生识别输出。15.如权利要求14所述的语音识别系统，其特征在于，语音检测测量包括用户正在说话的概率。16.如权利要求15所述的语音识别系统，其特征在于，组合信号包括概率与话筒信号的乘积。17.一种检测语音的方法，其特征在于，包括用音频话筒产生第一信号，表示音频输入；产生第二信号，...

【专利技术属性】
技术研发人员：黄学东，刘自成，张正友，MJ辛克莱尔，A阿塞罗，
申请(专利权)人：微软公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人