自校准的远场语音交互设备及远场语音自校准方法技术

技术编号：14453670 阅读：172 留言：0更新日期：2017-01-19 00:55

本发明专利技术提供了一种自校准的远场语音交互设备及远场语音自校准方法，麦克风阵列采集远场语音信号，自校准和语音识别终端对由麦克风通道增益和信号传播衰减引起的误差进行校准，得到增强语音输出。本发明专利技术利用通道增益校准的方式，保证各个麦克风通道相对增益一致，提高了后端GSC的性能；采用语音段作为校准声源，后续处理保证语音损伤较小，有利于目标信号的消除和噪声干扰信号的保留；还可以自动判断麦克风工作状态，能够保证在麦克风损坏情况下，设备仍然能够正常工作，提高了设备的稳健性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总体上涉及语音处理
，尤其涉及自校准的远场语音交互设备及远场语音自校准方法。
技术介绍
麦克风阵列技术近几十年来受到了研究者的广泛关注，特别是最近几年来受到人工智能繁荣发展的驱动，远场语音识别技术得到更大的关注，对作为远场语音识别前端的麦克风阵列技术提出了更大的要求。目前针对远场语音识别的主要方法包括MVDR(MinimumVarianceDistortionlessResponse，最小方差无畸变响应)和多通道维纳滤波方法，不管哪一种方法都是进行了远场假设，通常认为通道到达每个麦克风的幅度一致，只是声波到达时间不同，但实际中通常不同通道麦克风增益不同，同时由于距离衰减等因素造成幅度差异，因此需要对麦克风增益及信号幅度衰减进行补偿，才能保证算法性能。同时上述算法都需要明确麦克风的准确位置，大量方法与研究也是基于麦克风准确位置设计的，并且所有麦克风都能正常工作，极端情况下，一旦麦克风无法正常录音工作，将导致算法性能急剧下降，在实际产品应用中，麦克风位置通常是已知的，但在使用过程中很难保证其中的某个麦克风发生问题，无法正常录音，这种情形下需要剔除问题...

【技术保护点】
一种自校准的远场语音交互设备，其特征在于，包括：麦克风阵列与自校准和语音识别终端，所述麦克风阵列与所述自校准和语音识别终端电性连接；所述麦克风阵列采集远场语音信号，并将所述远场语音信号传输至所述自校准和语音识别终端，其中，所述远场语音信号包含由麦克风通道增益和信号传播衰减引起的误差；所述自校准和语音识别终端对所述误差进行校准，得到增强语音输出。

【技术特征摘要】
1.一种自校准的远场语音交互设备，其特征在于，包括：麦克风阵列与自校准和语音识别终端，所述麦克风阵列与所述自校准和语音识别终端电性连接；所述麦克风阵列采集远场语音信号，并将所述远场语音信号传输至所述自校准和语音识别终端，其中，所述远场语音信号包含由麦克风通道增益和信号传播衰减引起的误差；所述自校准和语音识别终端对所述误差进行校准，得到增强语音输出。2.如权利要求1所述的远场语音交互设备，其特征在于，所述自校准和语音识别终端包括：自校准模块和广义旁瓣对消器，所述麦克风阵列连接自校准模块，所述自校准模块连接所述广义旁瓣对消器，其中，所述自校准模块对所述误差进行校准，校准后的远场语音信号传输至所述广义旁瓣对消器；所述广义旁瓣对消器对校准后的远场语音信号进行处理，得到增强语音输出。3.如权利要求2所述的远场语音交互设备，其特征在于，所述自校准模块包括：语音活动检测模块、相对增益计算模块和增益校准模块；其中，所述语音活动检测模块选取麦克风阵列的一个麦克风作为参考通道，利用所述参考通道提取远场语音信号中的语音段；所述相对增益计算模块连接所述语音活动检测模块，利用所述语音段计算麦克风阵列中的其他麦克风相对于所述参考通道的相对增益；所述增益校准模块连接所述相对增益计算模块，根据所述相对增益，将其他麦克风的语音段调整到参考通道的增益水平，得到校准后的远场语音信号。4.如权利要求2所述的远场语音交互设备，其特征在于，所述广义旁瓣对消器包括：固定波束形成模块、阻塞矩阵模块、自适应噪声抵消模块；其中，校准后的远场语音信号分别进入固定波束形成模块和阻塞矩阵模块；固定波束形成模块对校准后的远场语音信号进行处理，生成语音参考信号；阻塞矩阵模...

【专利技术属性】
技术研发人员：陈日林，冯大航，陈孝良，常乐，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人