语音检测方法和装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：36101382 阅读：8 留言：0更新日期：2022-12-28 14:00

本申请公开了一种语音检测方法和装置、电子设备及计算机可读存储介质。该方法包括：获取由至少两个具有不同空间位置的麦克风组成的麦克风阵列采集的多个语音信号；对多个语音信号中的每一个在其接收方向上进行语音增强处理，以获得增强语音信号；将多个增强语音信号输入到预设模型，以生成语音特征序列；根据语音特征序列确定所述多个语音信号是否是来自多个声源。本申请实施例通过可以基于语音信号自身的语音特征和方位信息来生成语音特征序列，从而能够使得生成的语音特征序列更好地反映语音信号中的重叠语音特征，从而提高了重叠语音检测的准确率。叠语音检测的准确率。叠语音检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音检测方法和装置、电子设备及计算机可读存储介质

[0001]本申请涉及语音检测
，尤其涉及一种语音检测方法和装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着社会的发展，人们越来越多地通过会议上的讨论来解决复杂的问题，在这样的会议场景中，多个用户可以在同一个空间中甚至可以通过互联网技术而在不同的地点通过互联网进行实时的讨论，并且还可以进一步利用语音技术来提高用户会议的体验。例如通过语音识别技术来记录会议讨论的内容，或者是对用户的语音进行处理。但是不管是语音识别还是对用户语音进行处理，由于单人说话的音频信号和多人同时说话的音频信号特性不同，因此通常需要分别进行不同的针对性处理。换言之，如果使用单人语音检测方案对多人混合的语音进行检测，就会获得错误的结果，因此需要在应用语音检测方案之前先进行重叠语音检测，即检测音频信号中是否存在多个不同的说话人，之后再根据重叠语音检测的结果来选择单人语音检测方案还是多人语音检测方案。

技术实现思路

[0003]本申请实施例提供一种语音检测方法和装置、电子设备及计算机可读存储介质，以解决现有技术中重叠语音检测准确率低的缺陷。
[0004]为达到上述目的，本申请实施例提供了一种语音检测方法，包括：
[0005]获取由至少两个具有不同空间位置的麦克风组成的麦克风阵列采集的语音信号；
[0006]对语音信号在其接收方向上进行语音增强处理，以获得增强语音信号；
[0007]将所述增强语音信号输入到预设模型，以生成语音特征序列；<...

【技术保护点】

【技术特征摘要】
1.一种语音检测方法，包括：获取由至少两个具有不同空间位置的麦克风组成的麦克风阵列采集的语音信号；对语音信号在其接收方向上进行语音增强处理，以获得增强语音信号；将所述增强语音信号输入到预设模型，以生成语音特征序列；根据所述语音特征序列确定所述语音信号是否是来自多个声源。2.根据权利要求1所述的语音检测方法，其中，在所述将所述增强语音信号输入到预设模型，以生成语音特征序列之前，所述语音检测方法进一步包括：将所述增强语音信号按预定数量进行配对，以获得增强语音信号对，并且将所述增强语音信号输入到预设模型，以生成语音特征序列包括：将所述增强语音信号对输入到预设模型，以生成语音特征序列。3.根据权利要求2所述的语音检测方法，其中，所述将所述增强语音信号按预定数量进行配对，以获得增强语音信号对包括：将增强语音信号与接收方向与其接收方向相对的另一个增强语音信号配对，以获得增强语音信号对。4.根据权利要求3所述的语音检测方法，其中，所述将所述增强语音信号对输入到预设模型，以生成语音特征序列包括：将所述增强语音信号对分别输入到对应的编码器中，并且将编码器的输出进行拼接以获得所述语音特征序列。5.根据权利要求1所述的语音检测方法，其中，所述根据所述语音特征序列确定所述语音信号是否是来自多个声源包括：计算所述语音特征序列表示所述语音信号来自多个声源的概率；当所述概率大于预设阈值时确定所述语音信号来自多个声源。6.一种会议语音检测方法，包括：获取由至少两个具有不同空间位置的麦克风组成...

【专利技术属性】
技术研发人员：郑斯奇，索宏彬，
申请(专利权)人：阿里巴巴新加坡控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人