一种校准麦克风阵列的方法、声源定位方法及相关设备技术

技术编号:21735322 阅读:30 留言:0更新日期:2019-07-31 18:53
本申请提供一种校准麦克风阵列的方法、声源定位方法及相关设备,用于提高获得的麦克风的校准值的准确性。该方法包括:通过麦克风阵列中的N个麦克风采集来自设定声源点的声音数据;其中,N个麦克风到设定声源点的距离均相同;根据N个麦克风的声音数据,采用预设相关系数算法获得N个麦克风中每两个麦克风的相关系数;根据相关系数中小于预设的相关系数阈值的那部分相关系数,确定出相关联的对应M个麦克风;基于N个麦克风中除了M个麦克风之外的其余麦克风中每两个麦克风的声音数据,获得其余麦克风中每两个麦克风采集的声音数据的时延差;基于时延差,确定出其余麦克风中需要进行校准的每个麦克风对应的时延校准值。

A Method of Calibrating Microphone Array, Sound Source Location Method and Related Equipment

【技术实现步骤摘要】
一种校准麦克风阵列的方法、声源定位方法及相关设备
本申请涉及声源定位
,尤其涉及一种校准麦克风阵列的方法、声源定位方法及相关设备。
技术介绍
在众多语音交互相关的场合中,如语音助手以及完成语音通信的手机等消费类电子产品中,普遍使用麦克风阵列根据用户的声音确定用户的位置,对该位置上的声音进行语音增强。在设备出厂之前,通常需要对麦克风阵列进行校准。现有技术中,对麦克风阵列进行校准的方法一般为:测试单个麦克风的校准参数,以单个麦克风的参数之和作为麦克风阵列的校准结果。该声源定位校准方式获得校准结果的方式忽略了各个麦克风的性能参数变化的影响,且忽略了各个麦克风之间的相关性,因此,该校准方式获得的校准结果的准确性差。
技术实现思路
本申请实施例提供一种麦克风阵列校准方法、声源定位方法及相关设备,用于提高获得的麦克风的校准值的准确性。第一方面,提供一种校准麦克风阵列的方法,包括:通过麦克风阵列中的N个麦克风采集来自设定声源点的声音数据;其中,所述N个麦克风到所述设定声源点的距离均相同,N为大于或等于3的整数;根据所述N个麦克风的声音数据,采用预设相关系数算法获得所述N个麦克风中每两个麦克风的相关系数;根据所述相关系数中小于预设的相关系数阈值的那部分相关系数,确定出相关联的对应M个麦克风;其中,M为小于N的整数;基于所述N个麦克风中除了所述M个麦克风之外的其余麦克风中每两个麦克风的声音数据,获得所述其余麦克风中每两个麦克风采集的声音数据的时延差;基于所述时延差,确定出所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值。在上述方案中,根据麦克风阵列中每两个麦克风的相关系数,确定异常的麦克风,再根据麦克风阵列中除了异常的麦克风之外的麦克风来计算时延差校准值,避免了异常的麦克风影响校准结果,提高校准结果的准确性。且,巧妙利用相关系数排除麦克风阵列中的异常麦克风,可以对产品的品质进行检测。在一种可能的设计中,据所述N个麦克风的声音数据,采用预设相关系数算法获得所述N个麦克风中每两个麦克风的相关系数,包括:截取预设长度的所述N个麦克风中每两个麦克风中每个麦克风声音数据,得到截取后的所述N个麦克风中每两个麦克风的声音数据;对截取后的所述N个麦克风中每两个麦克风的声音数据进行归一化处理,得到所述N个麦克风中每两个麦克风的相关系数。在上述方案中,对每两个麦克风的声音数据进行截取处理,一方面可以保证了相关计算的声音数据的长度相同,使得计算出的相关系数更具有参考价值,在一种可能的设计中,基于所述N个麦克风中除了所述M个麦克风之外的其余麦克风中每两个麦克风的声音数据,获得所述其余麦克风中每两个麦克风采集的声音数据的时延差,包括:构建所述其余麦克风中每两个麦克风的声音数据之间的代价函数;基于预设时延差取值范围,获得所述其余麦克风中每两个麦克风的代价函数的最大值;确定以所述最大值对应的时延差为所述其余麦克风中每两个麦克风采集的声音数据的时延差。在上述方案中,通过遍历代价函数,获得每两个麦克风的代价函数来获得每两个麦克风的声音数据的时延差,可以使得更多帧的声音数据参与计算,避免某一帧声音数据异常而对结果造成影响,使得获得的每两个麦克风的声音数据的时延差更准确。在一种可能的设计中,基于所述时延差,确定出所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值,包括:确定所述时延差中与所述时延差的平均值之间的差值大于预设差值的至少两个时延差;根据所述平均值,以及所述至少两个时延差,确定出与所述至少两个时延差关联的至少一个麦克风对应的一个校准值,从而获得所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值。在上述方案中,根据多个时延差的平均值与每个时延差之间的差值来确定某个时延差是否偏差较大,依据平均值以及时延差确定对应麦克风的校准值,也就是说,根据多个麦克风的时延一致性的原则,能够相对准确地获得时延校准值。第二方面,提供一种声源定位方法,包括:根据通过第一方面及一种可能的设计中任意一种的方法获得的其余麦克风中需要进行校准的每个麦克风对应的时延校准值,对所述其余麦克风采集来自待测声源点的目标声音数据进行补偿;基于所述其余麦克风中除了补偿后的麦克风之外的麦克风的目标声音数据,以及补偿后的麦克风的目标声音数据,获得所述待测声源点的位置。上述方案中,在对待测声源进行定位的基础上,根据麦克风对应的准确的时延校准值,对该麦克风的声音数据进行补偿,进而获得待测声源点的位置,由于麦克风对应的时延校准值准确,因此使得获得的待测声源点的位置相对也更准确。第三方面,提供一种校准麦克风阵列的设备,包括:检测模块,用于通过麦克风阵列中的N个麦克风采集来自设定声源点的声音数据;其中,所述N个麦克风到所述设定声源点的距离均相同,N为大于或等于3的整数;处理模块,用于根据所述N个麦克风的声音数据,采用预设相关系数算法获得所述N个麦克风中每两个麦克风的相关系数;所述处理模块,还用于根据所述相关系数中小于预设的相关系数阈值的那部分相关系数,确定出相关联的对应M个麦克风;其中,M为小于N的整数;所述处理模块,还用于基于所述N个麦克风中除了所述M个麦克风之外的其余麦克风中每两个麦克风的声音数据,获得所述其余麦克风中每两个麦克风采集的声音数据的时延差;所述处理模块,还用于基于所述时延差,确定出所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值。在一种可能的设计中,处理模块具体用于:截取预设长度的所述N个麦克风中每两个麦克风中每个麦克风声音数据,得到截取后的所述N个麦克风中每两个麦克风的声音数据;对截取后的所述N个麦克风中每两个麦克风的声音数据进行归一化处理,得到所述N个麦克风中每两个麦克风的相关系数。第四方面,提供一种声源定位设备,包括:补偿模块,用于通过第一方面中的方法获得的其余麦克风中需要进行校准的每个麦克风对应的时延校准值,对所述其余麦克风采集来自待测声源点的目标声音数据进行补偿;处理模块,用于基于所述其余麦克风中除了补偿后的麦克风之外的麦克风的目标声音数据,以及补偿后的麦克风的目标声音数据,获得所述待测声源点的位置。第五方面,提供一种智能设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如第一方面或第二方面中所述的方法。第六方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如第一方面或第二方面中所述的方法。附图说明图1为本申请实施例提供的一种麦克风阵列的排布示意图;图2为本申请实施例提供的一种校准麦克风阵列的方法的流程示意图;图3为本申请实施例提供的声音数据的一种示意图;图4为本申请实施例提供的一种声源定位方法的流程图;图5为本申请实施例提供的一种校准麦克风阵列的设备的结构示意图;图6为本申请实施例提供的一种声源定位装置的结构示意图;图7为本申请实施例提供的一种智能设备的结构示意图。具体实施方式为了更好的理解本申请实施例提供的技术方案,下面将结合说明书附图以及具体的实施方式进行详细的说明。为了提高获得的准麦克风阵列的校准值的准确性,本申请实施涉及一种校准本文档来自技高网...

【技术保护点】
1.一种校准麦克风阵列的方法,其特征在于,包括:通过麦克风阵列中的N个麦克风采集来自设定声源点的声音数据;其中,所述N个麦克风到所述设定声源点的距离均相同,N为大于或等于3的整数;根据所述N个麦克风的声音数据,采用预设相关系数算法获得所述N个麦克风中每两个麦克风的相关系数;根据所述相关系数中小于预设的相关系数阈值的那部分相关系数,确定出相关联的对应M个麦克风;其中,M为小于N的整数;基于所述N个麦克风中除了所述M个麦克风之外的其余麦克风中每两个麦克风的声音数据,获得所述其余麦克风中每两个麦克风采集的声音数据的时延差;基于所述时延差,确定出所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值。

【技术特征摘要】
1.一种校准麦克风阵列的方法,其特征在于,包括:通过麦克风阵列中的N个麦克风采集来自设定声源点的声音数据;其中,所述N个麦克风到所述设定声源点的距离均相同,N为大于或等于3的整数;根据所述N个麦克风的声音数据,采用预设相关系数算法获得所述N个麦克风中每两个麦克风的相关系数;根据所述相关系数中小于预设的相关系数阈值的那部分相关系数,确定出相关联的对应M个麦克风;其中,M为小于N的整数;基于所述N个麦克风中除了所述M个麦克风之外的其余麦克风中每两个麦克风的声音数据,获得所述其余麦克风中每两个麦克风采集的声音数据的时延差;基于所述时延差,确定出所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值。2.如权利要求1所述的方法,其特征在于,据所述N个麦克风的声音数据,采用预设相关系数算法获得所述N个麦克风中每两个麦克风的相关系数,包括:截取预设长度的所述N个麦克风中每两个麦克风中每个麦克风声音数据,得到截取后的所述N个麦克风中每两个麦克风的声音数据;对截取后的所述N个麦克风中每两个麦克风的声音数据进行归一化处理,得到所述N个麦克风中每两个麦克风的相关系数。3.如权利要求1或2所述的方法,其特征在于,基于所述N个麦克风中除了所述M个麦克风之外的其余麦克风中每两个麦克风的声音数据,获得所述其余麦克风中每两个麦克风采集的声音数据的时延差,包括:构建所述其余麦克风中每两个麦克风的声音数据之间的代价函数;基于预设时延差取值范围,获得所述其余麦克风中每两个麦克风的代价函数的最大值;确定以所述最大值对应的时延差为所述其余麦克风中每两个麦克风采集的声音数据的时延差。4.如权利要求1所述的方法,其特征在于,基于所述时延差,确定出所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值,包括:确定所述时延差中与所述时延差的平均值之间的差值大于预设差值的至少两个时延差;根据所述平均值,以及所述至少两个时延差,确定出与所述至少两个时延差关联的至少一个麦克风对应的一个校准值,从而获得所述其余麦克风中需要进行校准的每个麦克风对应的时延校准值。5.一种声源定位方法,其特征在于,包括:根据通过权利要求1-4任一的方法获得的其余麦克风中需要进行校准的每个麦克风对应的时延校准值,对所述其余麦克风采集...

【专利技术属性】
技术研发人员:陈烈
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1