本申请涉及一种语音增强、交互方法、装置、程序产品及设备,其中,方法包括:在第一时间段中,采集麦克风信号,并根据麦克风信号,提取噪音特征;在间隔第二时间段后,根据噪音特征更新波束形成器;使用更新后的波束形成器,对后续的麦克风信号进行语音增强处理。本发明专利技术实施例利用在设备移动过程中,设备自身噪音信号特征变化较小,而外部的语音信号特征由于声源位置的变化而发生较大变化的特点,通过在噪音特征采集与波束形成器更新之间设置时间间隔的方式,来避免了有用的语音成分被消掉,从而提升语音增强的性能。升语音增强的性能。升语音增强的性能。
【技术实现步骤摘要】
语音增强、交互方法、装置、程序产品及设备
[0001]本申请涉及一种语音增强、交互方法、装置、程序产品及设备,属于计算机
技术介绍
[0002]语音增强是指当语音信号被各种各样的噪音干扰、甚至淹没后,从噪音背景中提取有用的语音信号,并抑制、降低噪音干扰的技术。语音增强广泛应用于各种需要基于语音识别的人机交互场景中。
[0003]扫地机器人作为智能家居中的一个重要设备,也在逐步向着语音化、智能化的方向发展。对于扫地机器人来说,直接对设备进行语音交互存在着很大的困难:一方面,扫地机工作时其自身发出的机械噪音、电机噪音、吸尘器噪音较大,然而,麦克风又安装在扫地机主体上,距离噪音声源较近,所以麦克风接收到的原始信号信噪比极低,并且,扫地机上能发出噪音的设备有多种,而且距离麦克风都比较近,属于多干扰源问题。另一方面,扫地机在工作过程中会移动,导致其接收到的信号是实时动态的,很难实时确定语音声源的方向,进而无法进行有效的降噪处理。上述的问题也同样存在于其他类似的需要人机交互的可移动的智能设备上,例如无人机。
技术实现思路
[0004]本专利技术实施例提供一种语音增强、交互方法、装置、程序产品及设备,以提高移动设备的语音增强效果。
[0005]为了实现上述目的,本专利技术实施例提供了一种语音增强处理方法,包括:
[0006]在第一时间段中,采集麦克风信号,并根据所述麦克风信号,提取噪音特征;
[0007]在间隔第二时间段后,根据所述噪音特征更新波束形成器;
[0008]使用更新后的波束形成器,对后续的麦克风信号进行语音增强处理。
[0009]本专利技术实施例还提供了一种语音增强处理装置,包括:
[0010]噪音特征提取模块,用于在第一时间段中,采集麦克风信号,并根据所述麦克风信号,提取噪音特征;
[0011]波束形成器更新模块,用于在间隔第二时间段后,根据所述噪音特征更新波束形成器;
[0012]语音增强处理模块,用于使用更新后的波束形成器,对后续的麦克风信号进行语音增强处理。
[0013]本专利技术实施例还提供了一种电子设备,包括:
[0014]存储器,用于存储程序;
[0015]处理器,用于运行所述存储器中存储的所述程序,以执行上述的语音增强处理方法。
[0016]本专利技术实施例还提供了计算机程序产品,包括计算机程序或指令,当所述计算机
程序或指令被处理器执行时,致使所述处理器实现前述的语音增强处理方法。
[0017]本专利技术实施例还提供了一种语音交互方法,包括:
[0018]采集声音信号;
[0019]对所述声音信号进行语音增强处理,在所述语音增强处理过程中,提取噪音特征,并在间隔一段时间后,根据所述噪音特征更新用于语音增强处理的波束形成器;
[0020]对经过语音增强处理后的声音信号,进行语音指令识别,并根据识别出的语音执行相应地处理。
[0021]本专利技术实施例还提供了一种语音交互设备,包括:
[0022]声音信号采集模块,用于采集声音信号;
[0023]语音增强处理模块,用于对所述声音信号进行语音增强处理,在所述语音增强处理过程中,提取噪音特征,并在间隔一段时间后,根据所述噪音特征更新用于语音增强处理的波束形成器;
[0024]指令识别及处理模块,用于对经过语音增强处理后的声音信号,进行语音指令识别,并根据识别出的语音执行相应地处理。
[0025]本专利技术实施例还提供了一种无人机,其中,该无人机包括前述的语音交互设备。
[0026]本专利技术实施例还提供了一种扫地机器人,其中,该扫地机器人包括前述的语音交互设备。
[0027]本专利技术实施例还提供了一种电子设备,包括:
[0028]存储器,用于存储程序;
[0029]处理器,用于运行所述存储器中存储的所述程序,以执行前述的语音交互方法。
[0030]本专利技术实施例还提供了一种计算机程序产品,包括计算机程序或指令,其特征在于,当所述计算机程序或指令被处理器执行时,致使所述处理器实现前述的语音交互方法。
[0031]本专利技术实施例的语音增强、交互方法、装置、程序产品及设备,利用在设备移动过程中,设备自身噪音信号特征变化较小,而外部的语音信号特征由于声源位置的变化而发生较大变化的特点,在噪音特征采集与波束形成器更新处理之间设置时间间隔,在该时间间隔中,设备会发生移动,从而导致语音声源位置的编号,通过该时间间隔所带来的语音声源的变化而设备自身噪音声源不变的特性,避免有用的语音成分被消掉,同时还能抑制设备自身的噪声。本专利技术实施例的语音增强处理技术,可以在极低信噪比、多干扰源、移动声源条件下有效抑制设备自身发出的噪声,实现有效的语音增强。
[0032]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0033]图1为本专利技术实施例的语音增强处理方法的应用场景示意图之一;
[0034]图2为本专利技术实施例的语音增强处理方法的应用场景示意图之二;
[0035]图3为本专利技术实施例的语音增强处理方法的流程示意图;
[0036]图4为本专利技术实施例的语音增强处理装置的结构示意图;
[0037]图5为本专利技术实施例的电子设备的结构示意图。
具体实施方式
[0038]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0039]如图1和图2所示,其为本专利技术实施例的语音增强处理方法的应用场景示意图,本专利技术实施例的语音增强处理方法可以应用在移动设备上,例如扫地机器人、无人机等。下面以扫地机器人作为示例,来说明语音增强处理方法的技术原理。在扫地机器人的应用场景中,噪音主要产生于扫地机器人自身,扫地机工作时由自身发出的机械噪音、电机噪音、吸尘器噪音等,这些自身产生的噪音相比用户发出的语音要大很多,而麦克风设置在扫地机器人,相比语音声源,与电机、吸尘器等噪音声源距离更近。此外,扫地机在工作过程中会移动,导致麦克风接收到的语音信号是实时动态,不过,由于噪音声源与麦克风的相对位置是固定的,麦克风接收到的噪音信号反而是相对稳定的。
[0040]本专利技术实施例利用了噪音和语音由于声源位置的不同,而产生的声音特征的差别来进行降噪处理。具体的做法为,将采集噪音的时间段和更新波束形成器的时间段进行间隔,利用扫地机器人的移动对语音声源和噪音声源产生影响不同的特点,进行降噪。
[0041]下面通过一些具体实施例来进一步说明本专利技术的技术方案。
[0042]实施例一
[0043]如本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音增强处理方法,包括:在第一时间段中,采集麦克风信号,并根据所述麦克风信号,提取噪音特征;在间隔第二时间段后,根据所述噪音特征更新波束形成器;使用更新后的波束形成器,对后续的麦克风信号进行语音增强处理。2.根据权利要求1所述的方法,其中,所述噪音特征包括噪音协方差矩阵,所述采集麦克风信号,并根据所述麦克风信号,提取噪音特征包括:采集多个连续的数据帧的麦克风信号;基于预设的遗忘因子,根据前一个数据帧对应的噪音协方差矩阵和当前数据帧的麦克风信号,计算当前数据帧对应的噪音协方差矩阵;将所述第一时间段中,最后一个数据帧对应的噪音协方差矩阵作为所述噪音特征。3.根据权利要求1所述的方法,其中,所述噪音特征包括噪音协方差矩阵,使用所述噪音特征更新波束形成器包括:根据预设的导向矢量和作为所述噪音特征的噪音协方差矩阵,对所述波束形成器的权重向量进行更新。4.根据权利要求3所述的方法,其中,所述导向矢量为定值。5.根据权利要求1所述的方法,其中,还包括:在间隔第三时间段后,进入新的噪声特征标定周期。6.根据权利要求1所述的方法,其中,所述根据所述麦克风信号,提取噪音特征包括:根据所述麦克风信号,提取多个频段的噪音特征;所述根据所述噪音特征更新波束形成器包括:根据所述多个频段的噪音特征,更新与该多个频段对应的波束形成器;或者,获取多个频段的噪音特征中的部分频段的噪音特征,更新与该部分频段对应的波束形成器。7.根据权利要求1所述的方法,其中,还包括:检测麦克风所在设备的运动数据,根据所述运动数据确定所述第二时间段的长度。8.一种语音增强处理装置,包括:噪音特征提取模块,用于在第一时间段中,采集麦克风信号,并根据所述麦克风信号,提取噪音特征;波束形成器更新模块,用于在间隔第...
【专利技术属性】
技术研发人员:纳跃跃,王子腾,刘章,李韵,乔刚,田彪,付强,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。