语音增强、交互方法、装置、程序产品及设备制造方法及图纸

技术编号：33876672 阅读：37 留言：0更新日期：2022-06-22 17:05

本申请涉及一种语音增强、交互方法、装置、程序产品及设备，其中，方法包括：在第一时间段中，采集麦克风信号，并根据麦克风信号，提取噪音特征；在间隔第二时间段后，根据噪音特征更新波束形成器；使用更新后的波束形成器，对后续的麦克风信号进行语音增强处理。本发明专利技术实施例利用在设备移动过程中，设备自身噪音信号特征变化较小，而外部的语音信号特征由于声源位置的变化而发生较大变化的特点，通过在噪音特征采集与波束形成器更新之间设置时间间隔的方式，来避免了有用的语音成分被消掉，从而提升语音增强的性能。升语音增强的性能。升语音增强的性能。

全部详细技术资料下载

【技术实现步骤摘要】
语音增强、交互方法、装置、程序产品及设备

[0001]本申请涉及一种语音增强、交互方法、装置、程序产品及设备，属于计算机

技术介绍

[0002]语音增强是指当语音信号被各种各样的噪音干扰、甚至淹没后，从噪音背景中提取有用的语音信号，并抑制、降低噪音干扰的技术。语音增强广泛应用于各种需要基于语音识别的人机交互场景中。
[0003]扫地机器人作为智能家居中的一个重要设备，也在逐步向着语音化、智能化的方向发展。对于扫地机器人来说，直接对设备进行语音交互存在着很大的困难：一方面，扫地机工作时其自身发出的机械噪音、电机噪音、吸尘器噪音较大，然而，麦克风又安装在扫地机主体上，距离噪音声源较近，所以麦克风接收到的原始信号信噪比极低，并且，扫地机上能发出噪音的设备有多种，而且距离麦克风都比较近，属于多干扰源问题。另一方面，扫地机在工作过程中会移动，导致其接收到的信号是实时动态的，很难实时确定语音声源的方向，进而无法进行有效的降噪处理。上述的问题也同样存在于其他类似的需要人机交互的可移动的智能设备上，例如无人机。

技术实现思路

[0004]本专利技术实施例提供一种语音增强、交互方法、装置、程序产品及设备，以提高移动设备的语音增强效果。
[0005]为了实现上述目的，本专利技术实施例提供了一种语音增强处理方法，包括：
[0006]在第一时间段中，采集麦克风信号，并根据所述麦克风信号，提取噪音特征；
[0007]在间隔第二时间段后，根据所述噪音特征更新波束形成器；
[000...

【技术保护点】

【技术特征摘要】
1.一种语音增强处理方法，包括：在第一时间段中，采集麦克风信号，并根据所述麦克风信号，提取噪音特征；在间隔第二时间段后，根据所述噪音特征更新波束形成器；使用更新后的波束形成器，对后续的麦克风信号进行语音增强处理。2.根据权利要求1所述的方法，其中，所述噪音特征包括噪音协方差矩阵，所述采集麦克风信号，并根据所述麦克风信号，提取噪音特征包括：采集多个连续的数据帧的麦克风信号；基于预设的遗忘因子，根据前一个数据帧对应的噪音协方差矩阵和当前数据帧的麦克风信号，计算当前数据帧对应的噪音协方差矩阵；将所述第一时间段中，最后一个数据帧对应的噪音协方差矩阵作为所述噪音特征。3.根据权利要求1所述的方法，其中，所述噪音特征包括噪音协方差矩阵，使用所述噪音特征更新波束形成器包括：根据预设的导向矢量和作为所述噪音特征的噪音协方差矩阵，对所述波束形成器的权重向量进行更新。4.根据权利要求3所述的方法，其中，所述导向矢量为定值。5.根据权利要求1所述的方法，其中，还包括：在间隔第三时间段后，进入新的噪声特征标定周期。6.根据权利要求1所述的方法，其中，所述根据所述麦克风信号，提取噪音特征包括：根据所述麦克风信号，提取多个频段的噪音特征；所述根据所述噪音特征更新波束形成器包括：根据所述多个频段的噪音特征，更新与该多个频段对应的波束形成器；或者，获取多个频段的噪音特征中的部分频段的噪音特征，更新与该部分频段对应的波束形成器。7.根据权利要求1所述的方法，其中，还包括：检测麦克风所在设备的运动数据，根据所述运动数据确定所述第二时间段的长度。8.一种语音增强处理装置，包括：噪音特征提取模块，用于在第一时间段中，采集麦克风信号，并根据所述麦克风信号，提取噪音特征；波束形成器更新模块，用于在间隔第...

【专利技术属性】
技术研发人员：纳跃跃，王子腾，刘章，李韵，乔刚，田彪，付强，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人