远场拾音的方法、装置、设备与存储介质制造方法及图纸

技术编号：40146860 阅读：4 留言：0更新日期：2024-01-24 00:29

本发明专利技术涉及语音识别的技术领域，公开了一种远场拾音的方法、装置、设备与存储介质；本发明专利技术根据麦克风阵列中各个麦克风的预设运动区域和当前位置信息构建出麦克风阵列的远场拾音预测模型，以判断目标声源是否处于麦克风阵列的最佳拾音区域，并根据目标声源的实际位置推算出该如何调节麦克风阵列中各个麦克风的位置，以使得目标声源处于麦克风阵列的最佳拾音区域，从而确保麦克风阵列的拾音效果，解决了现有技术中麦克风阵列在远场声源位置不断变化的场景中远场拾音效果相对不佳的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别的，尤其是一种远场拾音的方法、装置、设备与存储介质。

技术介绍

1、麦克风是一种应用于音声领域的人机交互设备，可用于对人声进行采集，目标麦克风的拾音技术可大致分为近场拾音技术和远场拾音技术，一般超过一米之外就可以认为是属于远场拾音技术的范围。

2、在现有技术中，为了减少环境噪声的影响，通常使用麦克风阵列来进行远场拾音，麦克风阵列是一种通过设置多个麦克风进行音声采集的技术，当远场声源的位置较为固定时，麦克风阵列进行有效的声音采集，但在远场声源位置不断进行变换的场景（例如舞台表演、教学展示等）中，麦克风阵列的远场拾音效果会有所下降。

技术实现思路

1、本专利技术的目的在于提供一种远场拾音的方法、装置、设备与存储介质，旨在解决现有技术中麦克风阵列在远场声源位置不断变化的场景中远场拾音效果相对不佳的问题。

2、本专利技术是这样实现的，第一方面，本专利技术提供一种远场拾音的方法，包括：

3、获取麦克风阵列的各个麦克风的预设运动区域和当前位置信息，根据所述麦克风阵列的各个麦克风的预设运动区域和当前位置信息构建远场拾音预测模型；所述远场拾音预测模型用于描述所述麦克风阵列中各个麦克风的当前位置信息和所述麦克风阵列的最佳拾音区域之间的对应关系；

4、获取目标声源的位置信息，并将所述目标声源的位置信息代入至所述远场拾音预测模型中，以判断所述目标声源是否处于所述麦克风阵列的最佳拾音区域；

5、若判断的结果显示所述目标声源未

6、优选地，获取麦克风阵列的各个麦克风的预设运动区域和当前位置信息，根据所述麦克风阵列的各个麦克风的预设运动区域和当前位置信息构建远场拾音预测模型的步骤包括：

7、获取所述麦克风阵列的各个麦克风的预设运动区域，根据所述麦克风阵列的各个麦克风的预设运动区域构建各个拾音单元预设区域和对应各个所述拾音单元预设区域的拾音效果区域，并在各个所述拾音单元预设区域中建立用于代表麦克风的拾音单元模型；所述拾音效果区域用于描述所述拾音单元模型在所述拾音单元预设区域中对外部不同位置的拾音效果；

8、持续对所述麦克风阵列的各个麦克风的当前位置信息进行采集，并根据采集的结果确定各个所述拾音单元模型在对应的所述拾音单元预设区域中的位置；

9、根据各个所述拾音单元模型在对应的所述拾音单元预设区域中的位置确定对应各个所述拾音单元模型的所述拾音效果区域；

10、将各个所述拾音效果区域进行叠加处理，得到所述最佳拾音区域，以构建远场拾音预测模型。

11、优选地，将所述目标声源的位置信息设定为目标拾音区域，并将所述目标拾音区域代入至所述远场拾音预测模型中，以得到对应所述目标拾音区域的所述麦克风阵列的各个麦克风在各自预设运动区域内的目标位置信息的步骤包括：

12、将所述目标声源的位置信息设定为目标拾音区域，并将所述目标拾音区域代入至所述远场拾音预测模型中；

13、以令所述目标拾音区域成为所述最佳拾音区域为目标，对各个所述拾音单元模型的所述拾音效果区域进行调节，获取当所述目标拾音区域为所述最佳拾音区域时，各个所述拾音单元模型在所述拾音单元预设区域中的位置信息，并将所述位置信息作为所述麦克风阵列的各个麦克风在各自预设运动区域的目标位置信息。

14、优选地，还包括：

15、将所述目标声源的位置信息代入至所述远场拾音预测模型，计算所述目标声源的预期拾音音量；

16、获取所述麦克风阵列接收到的实际拾音音量，并将所述实际拾音音量与所述预期拾音音量进行对比分析，获取所述目标声源的实际拾音音量与预期拾音音量的差值，并根据差值对所述远场拾音预测模型中各个所述拾音效果区域进行对应调整。

17、优选地，所述拾音效果区域包括水平拾音区域和垂直拾音区域，所述水平拾音区域由所述麦克风在所述预设运动区域的位置决定，所述垂直拾音区域由所述麦克风的朝向角度决定。

18、第二方面，本专利技术提供一种远场拾音的装置，包括：

19、模型构建单元，用于获取麦克风阵列的各个麦克风的预设运动区域和当前位置信息，根据所述麦克风阵列的各个麦克风的预设运动区域和当前位置信息构建远场拾音预测模型；所述远场拾音预测模型用于描述所述麦克风阵列中各个麦克风的当前位置信息和所述麦克风阵列的最佳拾音区域之间的对应关系；

20、实时判断单元，用于获取目标声源的位置信息，并将所述目标声源的位置信息代入至所述远场拾音预测模型中，以判断所述目标声源是否处于所述麦克风阵列的最佳拾音区域；

21、拾音调节单元，用于当判断的结果显示所述目标声源未处于所述麦克风阵列的最佳拾音区域，则将所述目标声源的位置信息设定为目标拾音区域，并将所述目标拾音区域代入至所述远场拾音预测模型中，以得到对应所述目标拾音区域的所述麦克风阵列的各个麦克风在各自预设运动区域内的目标位置信息，并根据所述麦克风阵列的各个麦克风在各自预设运动区域内的目标位置信息对所述麦克风阵列的各个麦克风进行位置调节。

22、第三方面，本专利技术提供一种远场拾音的设备，包括：

23、信息采集装置、数据处理装置、麦克风调节装置；

24、所述数据处理装置分别与所述信息采集装置和所述麦克风调节装置电连接，所述数据处理装置用于实现第一方面任意一项的一种远场拾音的方法，所述信息采集装置用于对目标声源的位置信息进行采集，所述麦克风调节装置用于设置麦克风并对麦克风进行位置调节。

25、第四方面，本专利技术提供一种远场拾音的存储介质，用于存储第一方面任意一项所述的一种远场拾音的方法。

26、本专利技术提供了一种远场拾音的方法，具有以下有益效果：

27、本专利技术根据麦克风阵列中各个麦克风的预设运动区域和当前位置信息构建出麦克风阵列的远场拾音预测模型，以判断目标声源是否处于麦克风阵列的最佳拾音区域，并根据目标声源的实际位置推算出该如何调节麦克风阵列中各个麦克风的位置，以使得目标声源处于麦克风阵列的最佳拾音区域，从而确保麦克风阵列的拾音效果，解决了现有技术中麦克风阵列在远场声源位置不断变化的场景中远场拾音效果相对不佳的问题。

本文档来自技高网...

【技术保护点】

1.一种远场拾音的方法，其特征在于，包括：

2.如权利要求1所述的一种远场拾音的方法，其特征在于，获取麦克风阵列的各个麦克风的预设运动区域和当前位置信息，根据所述麦克风阵列的各个麦克风的预设运动区域和当前位置信息构建远场拾音预测模型的步骤包括：

3.如权利要求2所述的一种远场拾音的方法，其特征在于，将所述目标声源的位置信息设定为目标拾音区域，并将所述目标拾音区域代入至所述远场拾音预测模型中，以得到对应所述目标拾音区域的所述麦克风阵列的各个麦克风在各自预设运动区域内的目标位置信息的步骤包括：

4.如权利要求2所述的一种远场拾音的方法，其特征在于，还包括：

5.如权利要求2所述的一种远场拾音的方法，其特征在于，所述拾音效果区域包括水平拾音区域和垂直拾音区域，所述水平拾音区域由所述麦克风在所述预设运动区域的位置决定，所述垂直拾音区域由所述麦克风的朝向角度决定。

6.一种远场拾音的装置，其特征在于，包括：

7.一种远场拾音的设备，其特征在于，包括：

8.一种远场拾音的存储介质，其特征在于，用于存储权利要求

...

【技术特征摘要】

1.一种远场拾音的方法，其特征在于，包括：

3.如权利要求2所述的一种远场拾音的方法，其特征在于，将所述目标声源的位置信息设定为目标拾音区域，并将所述目标拾音区域代入至所述远场拾音预测模型中，以得到对应所述目标拾音区域的所述麦克风阵列的各个麦克风在各自预设运动区域内的目标位置信息的步骤包括：...

【专利技术属性】
技术研发人员：熊悦，李庆余，熊晨阳，黄智，
申请(专利权)人：深圳市声菲特科技技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人