重叠语音识别方法、装置、计算机设备和麦克风阵列系统制造方法及图纸

技术编号：44556585 阅读：18 留言：0更新日期：2025-03-11 14:18

本申请涉及一种重叠语音识别方法、装置、计算机设备、存储介质和麦克风阵列系统。所述方法包括：获取第一麦克风和第二麦克风的时域信号，基于时域信号得到第一麦克风和第二麦克风之间的时间延迟，并根据时间延迟得到每个声源位置；基于时间延迟和概率密度函数，逐帧判断每个声源位置的语音状态；语音状态包括语音帧或静默帧；根据每个声源位置的语音状态，分离得到各声源位置的清洁语音。通过麦克风阵列结合空间定位信息和麦克风阵列中的时间延迟进行重叠语音识别，将同一声源位置的语音帧和静默帧进行分割，得到同一声源位置的清洁语音，实现高效的重叠语音识别与处理，提高了在各种复杂声学环境和实时语音应用场景的处理效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音信号处理，特别是涉及一种重叠语音识别方法、装置、计算机设备、存储介质、计算机可读存储介质和麦克风阵列系统。

技术介绍

1、在现代社交和工作环境中，多声源场景如会议、聚会和社交活动日益普遍。在这些场景中，多个说话人可能同时发言，导致语音信号重叠。这种重叠现象不仅使得听众难以辨别具体内容，也给语音处理技术带来了严峻的挑战。

2、传统的单麦克风录音技术在处理重叠语音时显得力不从心，因为不同说话人的声音往往在同一麦克风下被同时录制，造成信号混叠，显著降低了语音识别的准确性，尤其是对多说话人内容的精准识别。

3、基于麦克风阵列的技术成为解决重叠语音问题的有效手段，麦克风阵列由多个麦克风组成，能够同时捕捉来自不同方向的声音信号。然而现有麦克风阵列的重叠语音处理技术在低信噪比、高混响环境及多说话人场景下的表现仍需进一步优化。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够有效区分、分割多个同时说话人的声音，实现对重叠语音精准识别的重叠语音识别方法、装...

【技术保护点】

1.一种重叠语音识别方法，其特征在于，适用于麦克风阵列系统，所述麦克风阵列包括第一麦克风和第二麦克风；所述重叠语音识别方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取所述第一麦克风和所述第二麦克风的时域信号，基于所述时域信号得到所述第一麦克风和所述第二麦克风之间的时间延迟，并根据所述时间延迟得到每个声源位置包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述时间延迟和概率密度函数，逐帧判断每个所述声源位置的语音状态；所述语音状态包括语音帧或静默帧包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5....

【技术特征摘要】

1.一种重叠语音识别方法，其特征在于，适用于麦克风阵列系统，所述麦克风阵列包括第一麦克风和第二麦克风；所述重叠语音识别方法包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述时间延迟和概率密度函数，得到第一麦克...

【专利技术属性】
技术研发人员：张军，李吉玥，柳斌，童敬宇，
申请(专利权)人：天翼数字生活科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人