一种声源定位方法、装置及存储介质制造方法及图纸

技术编号：21769990 阅读：41 留言：0更新日期：2019-08-03 21:07

本申请公开了一种声源定位方法、装置及存储介质，涉及定位技术领域，用以解决现有技术中，由于在定位声源时，需要计算各麦克风之间的时延差，从而导致现有的声源定位的方法计算量大，处理时间长的问题。该方法中，将通过预先构建好的环形麦克风阵列接收的待定位音频信号，和预先存储的延时差系数表中各声源位置对应的延时差系数集输入到声源方位代价函数中，得到输出结果；将输出结果为最大值时对应的声源位置作为待定位音频信号的声源位置。这样，通过查找延时差系数表可以节省了计算时间，使得处理速度变快；同时的，通过环形麦克风阵列可以使获取的音频信号更加清晰，使得到的声源位置更加准确。

A Sound Source Location Method, Device and Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
一种声源定位方法、装置及存储介质
本申请涉及定位
，尤其涉及一种声源定位方法、装置及存储介质。
技术介绍
对声音的定位与跟踪是人机交互研究中的重要课题，在安全部门的监控识别、视频会议系统、多媒体系统以及机器人等领域有着广泛的应用。通常，视觉是人们获取信息的主要途径，但在很多情况下，视觉不能提供目标的完整信息，和听觉相比有一定的局限性，人脸跟踪方法容易受到视频遮挡以及光照、姿态变化等因素的影响。和受限的视觉范围相比，听觉系统是全向的，不受角度和位置的限制。人们能够接听到来自于三维空间中任意方位的声音，较好地补充了视觉信息的不足之处。而在现有技术中，由于在定位声源时，需要计算各麦克风之间的时延差，从而导致现有的声源定位的方法计算量大，处理时间长。
技术实现思路
申请实施例提供一种声源定位方法、装置及存储介质，用以解决现有技术中，由于在定位声源时，需要计算各麦克风之间的时延差，从而导致现有的声源定位的方法计算量大，处理时间长的问题。第一方面，本申请实施例提供一种声源定位方法，该方法包括：通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号；获取所述待定位音频信号中...

【技术保护点】
1.一种声源定位方法，其特征在于，所述方法包括：通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号；获取所述待定位音频信号中的有效数据信息；以及，从预先存储的延时差系数表中获取各声源位置对应的延时差系数集，并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中，得到各声源位置各自对应的输出结果；其中，所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系，其中一个声源位置对应多个延时差系数，且同一环形麦克风阵列中任两个麦克风对应一个延时差系数；确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置。

【技术特征摘要】
1.一种声源定位方法，其特征在于，所述方法包括：通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号；获取所述待定位音频信号中的有效数据信息；以及，从预先存储的延时差系数表中获取各声源位置对应的延时差系数集，并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中，得到各声源位置各自对应的输出结果；其中，所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系，其中一个声源位置对应多个延时差系数，且同一环形麦克风阵列中任两个麦克风对应一个延时差系数；确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置。2.根据权利要求1所述的方法，其特征在于，所述环形麦克风阵列具有至少两个时，所述至少两个环形麦克风阵列为同心圆。3.根据权利要求2所述的方法，其特征在于，每个环形麦克风阵列对应一张延时差系数表；所述从预先存储的延时差系数表中获取各声源位置对应的延时差系数集，并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中，得到各声源位置各自对应的输出结果，具体包括：针对除半径最大的环形麦克风阵列之外的每个环形麦克风阵列，按照半径由小到大的顺序、依序对每个环形麦克风阵列执行如下操作：根据环形麦克风阵列的延时差系数表，确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围；针对半径最大的环形麦克风阵列，根据该环形麦克风阵列及对应的延时差系数表，得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集；将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数，得到半径最大的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果。4.根据权利要求3所述的方法，其特征在于，针对除半径最大的环形麦克风阵列之外的每个环形麦克风阵列，按照半径由小到大的顺序、依序根据该环形麦克风阵列的延时差系数表，确定所述待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围，具体包括：从半径最小的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集；并，将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数，得到各声源位置对应的输出结果；选择最大的输出结果对应的声源位置；以选择的声源位置为基准，确定下一环形麦克风阵列的参考声源位置范围；将半径最小和半径最大的环形麦克风阵列之外的每个环形麦克风阵列，按照半径由小到大的顺序依序对每个环形麦克风阵列执行：从当前环形麦克风阵列对应的延时差系数表中获取的当前麦克风阵列的参考声源位置范围内的各声源位置对应的延时差系数集，并返回执行将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数，得到各声源位置对应的输出结果的步骤，直至得到半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果。5.根据权利要求3所述的方法，其特征在于，所述确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置，具体包括：从半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果中选择最大值；将最大值对应的声源位置确定为所述待定位音频信号的声源位置。6.根据权利要求2所述的方法，其特征在于，每个环形麦克风阵列对应一张延时差系数表；所述从预先存储的延时差系数表中获取各声源位置对应的延时差系数集，并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中，得到各声源位置各自对应的输出结果，具体包括：针对除半径最小的环形麦克风阵列之外的每个环形麦克风阵列，按照半径由大到小的顺序、依序对每个环形麦克风阵列执行如下操作：根据环形麦克风阵列的延时差系数表，确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围；针对半径最小的环形麦克风阵列，根据该环形麦克风阵列及对应的延时差...

【专利技术属性】
技术研发人员：陈烈，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人