一种多路语音识别的语音采集方法、装置制造方法及图纸

技术编号：26480627 阅读：17 留言：0更新日期：2020-11-25 19:26

本发明专利技术公开了一种多路语音识别的语音采集方法，所述方法包括：获取用户第一语音信号；根据所述第一语音信号确定所述麦克风阵列的主音区以及至少两个辅助音区；采集所述麦克风阵列主音区以及至少两个辅助音区的语音信号；根据所述麦克风阵列的主音区以及至少两个辅助音区采集的语音信号，判断用户是否移动位置，如果用户移动位置，调整用户移动后位置区对应的音区为更新的主音区，基于所述更新的主音区确定至少两个更新的辅助音区。通过本发明专利技术的方法，能够优化多路语音识别中麦克风阵列的语音采集过程，提高了语音识别的准确性，提升了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种多路语音识别的语音采集方法、装置
本专利技术实施例涉及信息处理
，特别涉及一种多路语音识别的语音采集方法、装置。
技术介绍
语音识别的准确率一直是语音识别领域长期研究的问题，语音识别的准确率的提升通常包含两方面，一方面是对语音样本的富集以及训练模型的优化，一方面是获取的语音信号质量的提升。在目前的智能家居的场景中，一个智能家居设备，例如智能音箱往往是通过多麦克风阵列来采集声音的，例如通过一个N麦阵列将空间分为了N个音区，当用户在第1音区通过唤醒词唤醒设备时，多麦克风阵列只采集第1音区的声音，屏蔽剩余音区麦克风采集的信号，以提升语音信号质量。但是现有技术的弊端在于，当用户在第1音区唤醒设备，然后移动到第2音区后，设备无法自动判断，导致信号就无法采集或者采集不清晰，这时需要用户在第2音区通过唤醒词重新唤醒，或者通过重新采集全部音区的信号执行语音识别实现交互，从而导致用户使用体检较差。如何优化语音采集及语音识别成为一个亟待解决的问题。
技术实现思路
针对现有技术中的问题，本专利技术提供一种多路语音识别的语音采集方法、装置、终端设备和计算机可读存储介质。本专利技术提供一种多路语音识别的语音采集方法，其特征在于，所述方法包括：步骤100，获取用户第一语音信号；步骤101，根据所述第一语音信号确定所述麦克风阵列的主音区以及至少两个辅助音区；步骤102，采集所述麦克风阵列主音区以及至少两个辅助音区的语音信号；步骤103，根据所述麦克风阵列的主音区以及至少...

【技术保护点】
1.一种多路语音识别的语音采集方法，其特征在于，所述方法包括：/n步骤100，获取用户第一语音信号；/n步骤101，根据所述第一语音信号确定所述麦克风阵列的主音区以及至少两个辅助音区；/n步骤102，采集所述麦克风阵列主音区以及至少两个辅助音区的语音信号；/n步骤103，根据所述麦克风阵列的主音区以及至少两个辅助音区采集的语音信号，判断用户是否移动位置，如果用户移动位置，执行步骤104；/n步骤104，调整用户移动后位置区对应的音区为更新的主音区，基于所述更新的主音区确定至少两个更新的辅助音区。/n

【技术特征摘要】
1.一种多路语音识别的语音采集方法，其特征在于，所述方法包括：
步骤100，获取用户第一语音信号；
步骤101，根据所述第一语音信号确定所述麦克风阵列的主音区以及至少两个辅助音区；
步骤102，采集所述麦克风阵列主音区以及至少两个辅助音区的语音信号；
步骤103，根据所述麦克风阵列的主音区以及至少两个辅助音区采集的语音信号，判断用户是否移动位置，如果用户移动位置，执行步骤104；
步骤104，调整用户移动后位置区对应的音区为更新的主音区，基于所述更新的主音区确定至少两个更新的辅助音区。

2.根据权利要求1所述的方法，其特征在于，所述步骤101中根据所述第一语音信号确定所述麦克风阵列的主音区以及至少两个辅助音区具体包括：
步骤1011，基于所述麦克风阵列中多个麦克风采集的第一语音信号，利用声源到达方向(DOA)估计，确定用户当前位置；
步骤1012，基于用户当前位置，确定所述麦克风阵列的主音区；
步骤1013，基于所述麦克风阵列的主音区，确定与其相邻的至少两个辅助音区。

3.根据权利要求1所述的方法，其特征在于，步骤102，采集所述麦克风阵列主音区以及至少两个辅助音区的语音信号可以包括：
步骤1021，获取麦克风阵列主音区及至少两个辅助音区的语音信号，
步骤1022，获取多个音区的语音信号的信号强度，构建音区和信号强度的关系数据。

4.根据权利要求3所述的方法，其特征在于，步骤103中，所述监测所述麦克风阵列的主音区以及至少两个辅助音区采集的语音信号进一步包括：
步骤1031，基于预设周期，对主音区和辅助音区的信号强度进行监测，并更新所述关系数据；
步骤1032，根据所述音区和信号强度的关系数据，判断映射到不同音区的信号强度的大小。

5.根据权利要求4所述的方法，其特征在于，
如果主音区的信号强度大于所有辅助音区的信号强度，则判断用户未移动位置；
如果主音区的信号强度小于或等于任一相邻的第一辅助音区的信号强度，则触发周期变更标记，基于所述周期变更标记，将所述预设周期变更为第一周期，所述第一周期值小于预设周期值；
基于所述第一周期，更新所述音区和信号强度的关系数据；
判断所述主音区的信号强度与所述第一辅助音区的信号强度的差值是否大于或等于第一阈值；
如果所述主音区的信号强度与所述第一辅助音区的信号强度的差值大于或等于第一阈值，则确定用户满足第一触发条件；
根据所述第一辅助音区的语音信号，进行语音识别，根据识别结果，判断是否为有效内容，若为有效内容，则确定用户位置发生移动。

6.一种多路语音识别的语...

【专利技术属性】
技术研发人员：牛坤，赵晓朝，袁志伟，
申请(专利权)人：北京蓦然认知科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人