多移动终端的MIC阵列自校准方法、装置及服务器制造方法及图纸

技术编号:21456197 阅读:34 留言:0更新日期:2019-06-26 05:30
本发明专利技术提供一种多移动终端的MIC阵列自校准方法、装置及服务器。所述方法包括:控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳;接收所述多个移动终端上传的所拾取的音频流;控制所述多个移动终端分别播放特定音频序列;在接收到的音频流中匹配所述特定音频序列,并提取时间戳;根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数;使用所述校准参数对MIC阵列算法进行优化。本发明专利技术能够实现多移动终端的MIC阵列的校准和空间定位,估算移动终端的拾音延迟,简化后处理算法,提升拾音效果。

【技术实现步骤摘要】
多移动终端的MIC阵列自校准方法、装置及服务器
本专利技术涉及语言信号处理
,尤其涉及一种多移动终端的MIC阵列自校准方法、装置及服务器。
技术介绍
早在20世纪70、80年代,MIC(麦克风)阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于MIC阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。MIC阵列从字面上,指的是MIC的排列。也就是说由一定数目的声学传感器(一般是MIC)组成,用来对声场的空间特性进行采样并处理的装置。目前,在非多移动终端的分布式MIC阵列中,也有利用MIC拾音做空间定位的方案。但是,在使用移动终端做MIC阵列时,考虑到不同移动终端上的MIC频率传输曲线有很大不同,使用常见的功率谱方式无法在这种情况下完成MIC阵列的空间定位。另外,不同移动终端存在不同的拾音延迟,这种延迟也会影响到后续的MIC阵列处理算法的效果。常规分布式MIC阵列的处理方式未考虑移动终端上的复杂性,即使完成了空间定位,并不能保证多终端采集的音频数据的同步,对后续阵列处理算法存在不利影响。
技术实现思路
本专利技术提供的多移动终端的MIC阵列自校准方法、装置及服务器,能够实现多移动终端的MIC阵列的校准和空间定位,估算移动终端的拾音延迟,简化后处理算法,提升拾音效果。第一方面,本专利技术提供一种多移动终端的MIC阵列自校准方法,包括:控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳;接收所述多个移动终端上传的所拾取的音频流;控制所述多个移动终端分别播放特定音频序列;在接收到的音频流中匹配所述特定音频序列,并提取时间戳;根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数;使用所述校准参数对MIC阵列算法进行优化。可选地,当所述移动终端的个数为3个时,所述根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数包括:按照如下公式计算出t1、t2、t3、d12、d13、d23,作为校准参数:T1+t1=T11T1+t2+d12/v=T12T1+t3+d13/v=T13T2+t2=T22T2+t1+d12/v=T21T2+t3+d13/v=T23T3+t3=T33T3+t2+d23/v=T32T3+t1+d13/v=T31其中,T1、T2、T3分别为各移动终端播放特定音频序列的时刻,t1、t2、t3分别为各移动终端的拾音延迟,d12、d13、d23为两两移动终端间的距离,T11、T12、T13为第一移动终端采集到的时间戳,T22、T21、T23为第二移动终端采集到的时间戳,T33、T32、T31为第三移动终端采集到的时间戳,v为声音传播的速度。可选地,所述方法还包括:通过在录音中插播音频序列的方式检测是否需要重新校准MIC阵列。可选地,所述插播音频序列的时机为:当服务器MIC阵列算法失效时,或者当移动终端通过传感器检测到明显移动时,或者当预定时间到来时。可选地,所插播的音频序列为19K以上超声波音频序列。第二方面,本专利技术提供一种多移动终端的MIC阵列自校准装置,包括:第一控制单元,用于控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳;接收单元,用于接收所述多个移动终端上传的所拾取的音频流;第二控制单元,用于控制所述多个移动终端分别播放特定音频序列;匹配单元,用于在接收到的音频流中匹配所述特定音频序列,并提取时间戳;计算单元,用于根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数;校准单元,用于使用所述校准参数对MIC阵列算法进行校准。可选地,当所述移动终端的个数为3个时,所述计算单元,用于按照如下公式计算出t1、t2、t3、d12、d13、d23,作为校准参数:T1+t1=T11T1+t2+d12/v=T12T1+t3+d13/v=T13T2+t2=T22T2+t1+d12/v=T21T2+t3+d13/v=T23T3+t3=T33T3+t2+d23/v=T32T3+t1+d13/v=T31其中,T1、T2、T3分别为各移动终端播放特定音频序列的时刻,t1、t2、t3分别为各移动终端的拾音延迟,d12、d13、d23为两两移动终端间的距离,T11、T12、T13为第一移动终端采集到的时间戳,T22、T21、T23为第二移动终端采集到的时间戳,T33、T32、T31为第三移动终端采集到的时间戳,v为声音传播的速度。可选地,所述装置还包括:插播单元,用于通过在录音中插播音频序列的方式检测是否需要重新校准MIC阵列。可选地,所述插播音频序列的时机为:当服务器MIC阵列算法失效时,或者当移动终端通过传感器检测到明显移动时,或者当预定时间到来时。可选地,所插播的音频序列为19K以上超声波音频序列。第三方面,本专利技术提供一种服务器,所述服务器包括上述多移动终端的MIC阵列自校准装置。本专利技术实施例提供的多移动终端的MIC阵列自校准方法、装置及服务器,控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳,接收所述多个移动终端上传的所拾取的音频流,控制所述多个移动终端分别播放特定音频序列,在接收到的音频流中匹配所述特定音频序列,并提取时间戳,根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数;使用所述校准参数对MIC阵列算法进行优化。与现有技术相比,本专利技术能够实现多移动终端的MIC阵列的校准和空间定位,估算移动终端的拾音延迟,简化后处理算法,提升拾音效果。附图说明图1为本专利技术一实施例多移动终端的MIC阵列自校准方法的流程图;图2为本专利技术一实施例多移动终端的MIC阵列自校准装置的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供一种多移动终端的MIC阵列自校准方法,如图1所示,所述方法包括:S11、控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳。S12、接收所述多个移动终端上传的所拾取的音频流。S13、控制所述多个移动终端分别播放特定音频序列。S14、在接收到的音频流中匹配所述特定音频序列,并提取时间戳。S15、根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数。S16、使用所述校准参数对MIC阵列算法进行优化。本专利技术实施例提供的多移动终端的MIC阵列自校准方法,控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳,接收所述多个移动终端上传的所拾取的音频流,控制所述多个移动终端分别播放特定音频序列,在接收到的音频流中匹配所述特定音频序列,并提取时间戳,根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数;使用所述校准参数对MIC阵列算法进行优化。与现有技术相比,本专利技术能够实现多移动终端的MIC阵列的校准和空本文档来自技高网...

【技术保护点】
1.一种多移动终端的MIC阵列自校准方法,其特征在于,包括:控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳;接收所述多个移动终端上传的所拾取的音频流;控制所述多个移动终端分别播放特定音频序列;在接收到的音频流中匹配所述特定音频序列,并提取时间戳;根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数;使用所述校准参数对MIC阵列算法进行优化。

【技术特征摘要】
1.一种多移动终端的MIC阵列自校准方法,其特征在于,包括:控制多个移动终端发起拾音,并指示所述多个移动终端在拾音同时为拾取的音频流加入时间戳;接收所述多个移动终端上传的所拾取的音频流;控制所述多个移动终端分别播放特定音频序列;在接收到的音频流中匹配所述特定音频序列,并提取时间戳;根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数;使用所述校准参数对MIC阵列算法进行优化。2.根据权利要求1所述的方法,其特征在于,当所述移动终端的个数为3个时,所述根据所提取的时间戳对所述多个移动终端进行空间定位和延迟校准,得到校准参数包括:按照如下公式计算出t1、t2、t3、d12、d13、d23,作为校准参数:T1+t1=T11T1+t2+d12/v=T12T1+t3+d13/v=T13T2+t2=T22T2+t1+d12/v=T21T2+t3+d13/v=T23T3+t3=T33T3+t2+d23/v=T32T3+t1+d13/v=T31其中,T1、T2、T3分别为各移动终端播放特定音频序列的时刻,t1、t2、t3分别为各移动终端的拾音延迟,d12、d13、d23为两两移动终端间的距离,T11、T12、T13为第一移动终端采集到的时间戳,T22、T21、T23为第二移动终端采集到的时间戳,T33、T32、T31为第三移动终端采集到的时间戳,v为声音传播的速度。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:通过在录音中插播音频序列的方式检测是否需要重新校准MIC阵列。4.根据权利要求3所述的方法,其特征在于,所述插播音频序列的时机为:当服务器MIC阵列算法失效时,或者当移动终端通过传感器检测到明显移动时,或者当预定时间到来时。5.根据权利要求3所述的方法,其特征在于,所插播的音频序列为19K以上超声波音频序列。6.一种多移动终端的MIC阵列自校准装置,其特征在于,包括:第一控制单元,用...

【专利技术属性】
技术研发人员:李晨涛张治廖仁亿
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1