【技术实现步骤摘要】
本专利技术总体上涉及语音处理
,尤其涉及自校准的远场语音交互设备及远场语音自校准方法。
技术介绍
麦克风阵列技术近几十年来受到了研究者的广泛关注,特别是最近几年来受到人工智能繁荣发展的驱动,远场语音识别技术得到更大的关注,对作为远场语音识别前端的麦克风阵列技术提出了更大的要求。目前针对远场语音识别的主要方法包括MVDR(MinimumVarianceDistortionlessResponse,最小方差无畸变响应)和多通道维纳滤波方法,不管哪一种方法都是进行了远场假设,通常认为通道到达每个麦克风的幅度一致,只是声波到达时间不同,但实际中通常不同通道麦克风增益不同,同时由于距离衰减等因素造成幅度差异,因此需要对麦克风增益及信号幅度衰减进行补偿,才能保证算法性能。同时上述算法都需要明确麦克风的准确位置,大量方法与研究也是基于麦克风准确位置设计的,并且所有麦克风都能正常工作,极端情况下,一旦麦克风无法正常录音工作,将导致算法性能急剧下降,在实际产品应用中,麦克风位置通常是已知的,但在使用过程中很难保证其中的某个麦克风发生问题,无法正常录音,这种情形下需要剔除问题 ...
【技术保护点】
一种自校准的远场语音交互设备,其特征在于,包括:麦克风阵列与自校准和语音识别终端,所述麦克风阵列与所述自校准和语音识别终端电性连接;所述麦克风阵列采集远场语音信号,并将所述远场语音信号传输至所述自校准和语音识别终端,其中,所述远场语音信号包含由麦克风通道增益和信号传播衰减引起的误差;所述自校准和语音识别终端对所述误差进行校准,得到增强语音输出。
【技术特征摘要】
1.一种自校准的远场语音交互设备,其特征在于,包括:麦克风阵列与自校准和语音识别终端,所述麦克风阵列与所述自校准和语音识别终端电性连接;所述麦克风阵列采集远场语音信号,并将所述远场语音信号传输至所述自校准和语音识别终端,其中,所述远场语音信号包含由麦克风通道增益和信号传播衰减引起的误差;所述自校准和语音识别终端对所述误差进行校准,得到增强语音输出。2.如权利要求1所述的远场语音交互设备,其特征在于,所述自校准和语音识别终端包括:自校准模块和广义旁瓣对消器,所述麦克风阵列连接自校准模块,所述自校准模块连接所述广义旁瓣对消器,其中,所述自校准模块对所述误差进行校准,校准后的远场语音信号传输至所述广义旁瓣对消器;所述广义旁瓣对消器对校准后的远场语音信号进行处理,得到增强语音输出。3.如权利要求2所述的远场语音交互设备,其特征在于,所述自校准模块包括:语音活动检测模块、相对增益计算模块和增益校准模块;其中,所述语音活动检测模块选取麦克风阵列的一个麦克风作为参考通道,利用所述参考通道提取远场语音信号中的语音段;所述相对增益计算模块连接所述语音活动检测模块,利用所述语音段计算麦克风阵列中的其他麦克风相对于所述参考通道的相对增益;所述增益校准模块连接所述相对增益计算模块,根据所述相对增益,将其他麦克风的语音段调整到参考通道的增益水平,得到校准后的远场语音信号。4.如权利要求2所述的远场语音交互设备,其特征在于,所述广义旁瓣对消器包括:固定波束形成模块、阻塞矩阵模块、自适应噪声抵消模块;其中,校准后的远场语音信号分别进入固定波束形成模块和阻塞矩阵模块;固定波束形成模块对校准后的远场语音信号进行处理,生成语音参考信号;阻塞矩阵模...
【专利技术属性】
技术研发人员:陈日林,冯大航,陈孝良,常乐,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。