一种多通道语音信号同步方法及装置制造方法及图纸

技术编号：13797089 阅读：125 留言：0更新日期：2016-10-06 17:29

本发明专利技术提供一种多通道语音信号同步方法及装置。方法包括：选定通道作为模板通道，生成相应的语音信号能量包络模板；分别将各其他通道的语音信号与所述能量包络模板进行匹配，以分别确定所述各其他通道的语音信号与所述模板通道的语音信号之间的偏移值；根据所述偏移值，分别将所述各其他通道的语音信号与所述模板通道的语音信号进行同步。本发明专利技术解决了现有技术采用人工手动调整的方式，对多通道语音信号进行同步不仅浪费人力资源，而且效率很低的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及语音信号处理领域，尤其涉及一种多通道语音信号同步方法及装置。
技术介绍
目前，在语音信号处理领域，经常需要从多通道分别采集语音信号，以用于抗噪、语音识别等方面的研究，其中，所述多通道中包含的每一个通道均可以是任意语音采集设备提供的一个语音信号输入或输出通道。但是，在实际应用中，从多通道分别采集到的语音信号(以下简称为：多通道语音信号)相互之间可能并不是同步的(也即，在时间轴上可能未对齐)。例如，为了研究在远场与近场对同一个声源的感知关系，可以用一个语音采集设备(如手机)在距离该声源较近的地方进行录音，并用另一个语音采集设备(如麦克风)在距离该声源较远的地方进行录音，但是，由于该手机和麦克风可能不会同时开始录音，因此，从手机的通道与麦克风的通道采集到的语音信号可能是不同步的。而将诸如上例中的不同步的多通道语音信号用于后续研究，可能会降低研究结果的可靠性。针对上述问题，在现有技术中，一般采用人工手动调整的方式，对不同步的多通道语音信号进行同步，具体的，研究者可以分别观察多通道语音信号中各个通道的语音信号的波形，然后根据波形的形状手动地将多通道信号同步。但是，这种同步方法不仅浪费人力资源，而且效率很低。
技术实现思路
本专利技术实施例提供一种多通道语音信号同步方法及装置，用以解决现有技术采用人工手动调整的方式，对多通道语音信号进行同步不仅浪费人力资源，而且效率和精确度很低的问题。本专利技术实施例提供一种多通道语音信号同步方法，包括：选定通道作为模板通道，生成相应的语音信号能量包络模板；分别将各其他通道的语音信号的能量包络与所述能量包络模板进行匹...

【技术保护点】
一种多通道语音信号同步方法，其特征在于，包括：选定通道作为模板通道，生成相应的语音信号能量包络模板；分别将各其他通道的语音信号的能量包络与所述能量包络模板进行匹配，以分别确定所述各其他通道的语音信号与所述模板通道的语音信号之间的偏移值；根据所述偏移值，分别将所述各其他通道的语音信号与所述模板通道的语音信号进行同步。

【技术特征摘要】
1.一种多通道语音信号同步方法，其特征在于，包括：选定通道作为模板通道，生成相应的语音信号能量包络模板；分别将各其他通道的语音信号的能量包络与所述能量包络模板进行匹配，以分别确定所述各其他通道的语音信号与所述模板通道的语音信号之间的偏移值；根据所述偏移值，分别将所述各其他通道的语音信号与所述模板通道的语音信号进行同步。2.根据权利要求1所述的方法，其特征在于，生成相应的语音信号能量包络模板，具体包括：从所述模板通道的语音信号中截取波形片段；对所述波形片段进行采样抽取，确定出第一设定数量个采样点；将选定滑动窗在所述波形片段中按照设定方式滑动，根据滑动过程中所述选定滑动窗内包含的各所述采样点，计算所述波形片段的能量向量，作为生成的相应的语音信号能量包络模板。3.根据权利2要求所述的方法，其特征在于，针对每个所述其他通道的语音信号，按照如下方法，确定所述其他通道的语音信号与所述模板通道的语音信号之间的偏移值：从所述其他通道的语音信号的起始处开始，采用从所述模板通道的语音信号中截取的波形片段所使用的方法，依次截取第二设定数量个的、长度与从所述模板通道的语音信号中截取的波形片段的长度相同的波形片段；采用所述模板通道的波形片段的采样抽取以及能量包络计算方法分别对所述第二设定数量个的波形片段进行采样抽取，并计算对应的能量包络；在所述第二设定数量个的波形片段中，确定对应的能量包络与从所述模板通道的语音信号中截取的波形片段的能量包络最匹配的波形片段；确定所述能量包络最匹配的波形片段与从所述模板通道的语音信号中截取的波形片段在时间轴上的差值，作为所述其他通道的语音信号与所述模板通道的语音信号之间的偏移值。4.根据权利要求2所述的方法，其特征在于，将选定滑动窗在所述波形片段中按照设定方式滑动，根据滑动过程中所述选定滑动窗内包含的各所述采
\t样点，计算所述波形片段的能量向量，具体包括：将选定滑动窗按照设定滑动步长在所述波形片段中滑动m次，生成所述波形片段的m维能量向量，其中，所述m维能量向量中的第i维的取值为所述选定滑动窗在第i次滑动后，所述选定滑动窗内包含的各所述采样点的平均能量，m，i为正整数，i小于等于m。5.根据权利要求4所述的方法，其特征在于，在所述第二设定数量个的波形片段中，确定对应的能量包络与从所述模板通道的语音信号中截取的波形片段的能量包络最匹配的波形片段，具体包括：将从所述模板通道的语音信号中截取的波形片段对应的m维能量向量记作[x1,x2,...,xm]，将在所述第二设定数量个的波形片段中，第n个波形片段对应的m维能量向量记作[yn1,yn2,...,ynm]，其中，n等于所述第二设定数量；计算[yn1,yn2,...,ynm]与kn×[x1,x2,...,xm]之间的距离，其中，kn为能量增益系数， k n = Σ i ...

【专利技术属性】
技术研发人员：王育军，
申请(专利权)人：乐视致新电子科技天津有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人