一种音频同步方法以及相关装置制造方法及图纸

技术编号:39430912 阅读:11 留言:0更新日期:2023-11-19 16:15
本申请公开了一种音频同步方法以及相关装置,该方法应用于包含第一采集端和第二采集端的麦克风采集系统,包括:获取所述第一采集端采集到的第一频域信号、以及所述第二采集端采集到的第二频域信号;获取所述第一频域信号和所述第二频域信号在多个预设频率下的相位角信息,基于所述相位角信息确定所述第一频域信号与所述第二频域信号之间的相位差均值和时间差均值;基于所述相位差均值和所述时间差均值,对所述第一采集端和所述第二采集端的采集时延进行调节。通过上述方式,本申请能够节省计算成本并提高音频同步效率。省计算成本并提高音频同步效率。省计算成本并提高音频同步效率。

【技术实现步骤摘要】
一种音频同步方法以及相关装置


[0001]本申请涉及音频处理
,特别是涉及一种音频同步方法以及相关装置。

技术介绍

[0002]在音频采集领域,由于麦克风采集系统中不同采集端与声源之间的距离存在差异,导致不同采集端采集到的音频数据不同步,从而影响后续对不同采集端采集到的音频数据进行混音的效果。目前对于不同采集端采集到的音频数据进行同步的方法主要通过对不同音频数据进行逐帧调节,以使得音频数据同步,该方式需要实时对采集到的音频数据进行处理,计算资源消耗量较大、效率较低。有鉴于此,如何提出一种计算资源消耗较少、效率较高的音频同步方法,成为亟待解决的问题。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种音频同步方法以及相关装置,能够节省计算成本并提高音频同步效率。
[0004]为解决上述技术问题,本申请采用的一个技术方案是:提供一种音频同步方法,所述方法应用于包含第一采集端和第二采集端的麦克风采集系统,所述方法包括:获取所述第一采集端采集到的第一频域信号、以及所述第二采集端采集到的第二频域信号;获取所述第一频域信号和所述第二频域信号在多个预设频率下的相位角信息,基于所述相位角信息确定所述第一频域信号与所述第二频域信号之间的相位差均值和时间差均值;基于所述相位差均值和所述时间差均值,对所述第一采集端和所述第二采集端的采集时延进行调节。
[0005]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种音频同步装置,所述装置应用于包含第一采集端和第二采集端的麦克风系统,包括:获取模块,用于获取所述第一采集端采集到的第一频域信号、以及所述第二采集端采集到的第二频域信号;处理模块,获取所述第一频域信号和所述第二频域信号在多个预设频率下的相位角信息,基于所述相位角信息确定所述第一频域信号与所述第二频域信号之间的相位差均值和时间差均值;时延模块,基于所述相位差均值和所述时间差均值,对所述第一采集端和所述第二采集端的采集时延进行调节。
[0006]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种电子设备,包括:相互耦接的存储器和处理器,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行如上述技术方案中所述的音频同步方法。
[0007]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机可读存储介质,其上存储有程序数据,所述程序数据被处理器执行时实现如上述技术方案中所述的音频同步方法。
[0008]本申请的有益效果是:区别于现有技术的情况,本申请提出一种应用于包含第一采集端和第二采集端的麦克风采集系统的音频同步方法,通过获取第一采集端采集到的第
一频域信号以及第二采集端采集到的第二频域信号,以确定第一频域信号和第二频域信号在多个预设频率下相位角信息,并根据相位角信息确定第一频域信号和第二频域信号之间的相位差均值和时间差均值。从而仅通过第一采集端和第二采集端完成对后续采集到的音频数据的调整,无需对第一采集端和第二采集端采集到的每帧数据进行对齐处理,提高了音频同步的效率,并节省了计算成本。
附图说明
[0009]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
[0010]图1是本申请音频同步方法对应一实施方式的流程示意图;
[0011]图2是步骤S102对应一实施方式的流程示意图;
[0012]图3是步骤S102对应另一实施方式的流程示意图;
[0013]图4是步骤S103对应另一实施方式的流程示意图
[0014]图5是本申请音频同步装置对应一实施方式的结构示意图;
[0015]图6是本申请电子设备一实施方式的结构示意图;
[0016]图7是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
[0017]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0018]请参阅图1,图1是本申请音频同步方法对应一实施方式的流程示意图。本申请提出的音频同步方法应用于麦克风采集系统,该麦克风采集系统包含第一采集端、第二采集端以及与第一采集端和第二采集端耦接的接收端,该第一采集端和第二采集端分别用于采集音频数据,并将采集到的音频数据发送至接收端,第二采集端的数量可以一个或者多个。由于第一采集端和第二采集端与声源之间的距离不相同,导致第一采集端采集到的音频数据与第二采集端采集到的音频数据不同步。为了使得每个第二采集端采集到的音频数据与第一采集端采集到的音频数据同步,以下方法以接收端的处理器为执行主体,具体包括:
[0019]S101:获取第一采集端采集到的第一频域信号、以及第二采集端采集到的第二频域信号。
[0020]在一实施方式中,步骤S101包括:响应于第一采集端和第二采集端分别采集到的音频数据后,将对应的音频数据发送至接收端,并使得接收端对接收到的音频数据进行处理,以得到第一采集端采集到的当前帧音频数据的第一频域信号、以及第二采集端采集到的当前帧音频数据的第二频域信号。其中,当前帧音频数据为对应的采集端在当前时刻采集到的音频数据,且每帧音频数据的具体时长可以根据实际需求进行设置。
[0021]在一实施场景中,在接收到第一采集端和第二采集端分别采集到的当前帧的音频
数据后,对第一采集端对应的当前帧音频数据进行快速傅里叶变换,以得到第一频域信号;以及,对第二采集端对应的当前帧音频数据进行快速傅里叶变换,以得到第二频域信号。
[0022]在一具体应用场景中,为减少频谱泄露,在对上述第一采集端和第二采集端对应的当前帧数据进行快速傅里叶变换之前,利用汉宁窗函数对当前帧音频数据进行处理。具体计算公式如下:
[0023]w[n]=0.5*(1

cos2πn/(N

1))
[0024]x_windowed[n]=x[n]*w[n][0025]其中,w[n]表示汉宁窗函数,N表示汉宁窗函数的总长度,x[n]表示当前帧音频数据,x_windowed[n]表示处理后的当前帧音频数据。
[0026]进一步地,对处理后的当前帧音频数据进行快速傅里叶变换,以得到第一频域信号以及第二频域信号。其中,第一频域信号或第二频域信号的公式如下所示:
[0027][0028]f=k*fs/N
[0029]其中,X[k]表示第一频域信号或第二频域信号,A[k]表示频率k处的幅度,表示频率k处的相位角;k表示频率索引,其数值为k=0,1,2,...,N

1;f表示k对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频同步方法,其特征在于,所述方法应用于包含第一采集端和第二采集端的麦克风采集系统,所述方法包括:获取所述第一采集端采集到的第一频域信号、以及所述第二采集端采集到的第二频域信号;获取所述第一频域信号和所述第二频域信号在多个预设频率下的相位角信息,基于所述相位角信息确定所述第一频域信号与所述第二频域信号之间的相位差均值和时间差均值;基于所述相位差均值和所述时间差均值,对所述第一采集端和所述第二采集端的采集时延进行调节。2.根据权利要求1所述的方法,其特征在于,多个所述预设频率对应多个第一频率,获取所述第一频域信号和所述第二频域信号在多个预设频率下的相位角信息,基于所述相位角信息确定所述第一频域信号与所述第二频域信号之间的相位差均值,包括:获取所述第一频域信号中每个所述第一频率对应的第一相位角,以及获取所述第二频域信号中每个所述第一频率对应的第二相位角;获取每个所述第一频率对应的所述第一相位角与所述第二相位角之间的第一差值;将所有所述第一频率对应的所述第一差值的平均值作为所述第一频域信号与所述第二频域信号之间的所述相位差均值。3.根据权利要求1所述的方法,其特征在于,多个所述预设频率对应多个第二频率,获取所述第一频域信号和所述第二频域信号在多个预设频率下的相位角信息,基于所述相位角信息确定所述第一频域信号与所述第二频域信号之间的时间差均值,包括:获取所述第一频域信号中每个所述第二频率对应的第三相位角,以及获取所述第二频域信号中每个所述第二频率对应的第四相位角;获取每个所述第二频率对应的所述第三相位角与所述第四相位角之间的第二差值;基于所述第二频率以及对应的所述第二差值,得到每个所述第二频率对应的时间差;基于所有所述第二频率对应的所述时间差,得到所述第一频域信号与所述第二频域信号之间的所述时间差均值。4.根据权利要求3所述的方法,其特征在于,所述基于所有所述第二频率对应的所述时间差,得到所述第一频域信号与所述第二频域信号之间的所述时间差均值,包括:基于所述第二频率所处的频率区间,确定每个所述第二频率的预设权重;其中,多个所述频率区间匹配有各自的所述预设权重,所述预设权重与所述频率区间内的数值负相关;针对每个所述第二频率,获取所述第二差值与所述预设权重的第一乘积;基于所有所述第二频率对应的所述第一乘积和所述预设权重,得到所述第一频域信号与所述第二频域信号之间的所述时间差均值。5.根据权利要求1所述的方法,其特征在于,所述基于所述相位差均值和所述时间差均值,对所述第一采集端和所述第二采集端的采集时延进行调节,包括:响应于所述相位差均值小于或等于预设阈值,基于所述时间差均值确定所述第一采集端的第一目标时延以及所述第二采集端的第二目标时延;基于所述第一目标时延对所述第一采集端采集到的当前时刻之后预设帧数内的音频数据进行调节,以及基于所述第二目标时延对所述第二采集端采集到的当前时刻之后预设
帧...

【专利技术属性】
技术研发人员:匡志敏孙国峰王莹赵新莹
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1