音频比对方法、装置和设备制造方法及图纸

技术编号:21774604 阅读:34 留言:0更新日期:2019-08-03 22:23
本发明专利技术涉及一种音频比对方法、装置和设备,包括:接收需要比对的至少两路音频信号;对每路音频信号进行预处理,使每路音频信号均包含M个音频帧;基于每路音频信号中每个音频帧对应的特征信息,确定每路音频信号的特征序列;根据特征序列,计算相关函数序列;根据相关函数序列,确定任意两路音频信号之间的延迟时间;若延迟时间小于参考延迟时间,根据相关函数序列计算任意两路音频信号的相关系数;若相关系数大于预设系数,则确定至少两路音频信号为相同的信号。本方案提取需要比对的音频信号的多个特征,综合多个特征进行多维度比对,因此即使在噪声较大、干扰较大的场合也能获得较高的正确率,实用性高。

Audio comparison methods, devices and equipment

【技术实现步骤摘要】
音频比对方法、装置和设备
本专利技术涉及信号处理
,具体涉及一种音频比对方法、装置和设备。
技术介绍
当前,音频广播已成为最为普及的大众宣传和娱乐媒体。广播电台的节目播出及媒体资源管理等都涉及到音频比对方面的需求,即对两个音频进行比较,判断二者是否相同或相似。现有技术中的音频比对方法,都是基于梅尔倒频谱系数(MelFrequencyCepstrumCoefficient,MFCC)序列这一特征,通过MFCC算法提取音频特征参数,再根据音频特征参数的欧氏距离来判定音频的相似性,但是这种方式仅仅适用于音频质量较高的情况,如果音频质量不高,存在噪声,使用场合有一定的干扰,则会有较高的误报率。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种音频比对方法、装置和设备,以克服目前如果音频质量不高,存在噪声,使用场合有一定的干扰,则会有较高的误报率的问题。为实现以上目的,本专利技术采用如下技术方案:一种音频比对方法,包括:接收需要比对的至少两路音频信号;对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;根据所述特征序列,计算相关函数序列;根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;比较所述延迟时间与参考延迟时间的大小;若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。进一步地,以上所述音频比对方法,所述对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧,包括:分别重采样并取长度为N的采样序列;所述N为正整数;对每路所述采样序列进行预加重和归一化处理,得到目标采样序列;对每路所述目标采样序列进行音频帧划分,使每路所述目标采样序列包含M个音频帧。进一步地,以上所述音频比对方法,所述根据所述特征序列,计算相关函数序列,包括:分别对每路所述特征序列进行离散傅里叶变换,得到第一中间序列和第二中间序列;获取所述第一中间序列的复数共轭,将所述复数共轭与所述第二中间序列逐元素相乘得到第三中间序列;对所述第三中间序列进行逆离散傅里叶变换,得到中间相关函数序列;将所述中间相关函数序列的第一部分与第二部分重新拼接,得到所述相关函数序列。进一步地,以上所述音频比对方法,所述基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列,包括:获取每路所述音频信号中每个所述音频帧对应的谱质心序列;获取每路所述音频信号中每个所述音频帧对应的时域序列;获取每路所述音频信号中每个所述音频帧对应的过零率序列;和获取每路所述音频信号中每个所述音频帧对应的梅尔倒谱系数MFCC序列。进一步地,以上所述音频比对方法,所述获取每路所述音频信号中每个所述音频帧对应的谱质心序列,包括:分别对每路所述音频信号中每个所述音频帧进行傅里叶变换,得到初始谱质心;将所述初始谱质心归一化处理,获取谱质心,每路所述音频信号中每个所述音频帧的所述谱质心组成每路所述谱质心序列;获取每路所述音频信号中每个所述音频帧对应的过零率序列,包括:提取每路所述音频信号中每个所述音频帧的包络序列;获取所述包络序列的过零率,每路所述音频信号中每个所述音频帧的所述过零率组成每路所述过零率序列;所述获取每路所述音频信号中每个所述音频帧对应的MFCC序列,包括:对每路所述音频信号中每个所述音频帧进行快速傅立叶变换,获取所述音频帧的频率谱;根据所述频率谱,计算所述音频帧的幅度谱和离散功率谱;将所述离散功率谱通过预设的梅尔Mel滤波器;根据所述幅度谱求得所述Mel滤波器的输出;将所述输出取对数,将所述对数作离散余弦变换,得到每路所述音频信号中每个所述音频帧对应的MFCC,每路所述音频信号中每个所述音频帧的所述MFCC组成每路所述MFCC序列。进一步地,以上所述音频比对方法,所述相关函数序列包括谱质心相关函数序列、时域相关函数序列、过零率相关函数序列和MFCC相关函数序列;所述根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间,包括:获取所述谱质心相关函数序列的第一最大位置和第一中点位置,求得所述第一最大位置和所述第一中点位置的第一差值,将所述第一差值乘以所述音频信号的采样频率,获得第一延迟时间;获取所述过零率相关函数序列的第二最大位置和第二中点位置,求得所述第二最大位置和所述第二中点位置的第二差值,将所述第二差值乘以所述采样频率,获得第二延迟时间;获取所述MFCC相关函数序列的第三最大位置和第三中点位置,求得所述第三最大位置和所述第三中点位置的第三差值,将所述第三差值乘以所述采样频率,获得第三延迟时间;计算所述第一延迟时间、所述第二延迟时间和所述第三延迟时间的平均值,将所述平均值作为所述延迟时间。进一步地,以上所述音频比对方法,还包括:若所述延迟时间大于或等于所述参考延迟时间,则将所述延迟时间剪切,重新对齐所述音频信号,以便再次对至少两路所述音频信号进行比对。进一步地,以上所述音频比对方法,根据所述相关函数序列计算任意两路所述音频信号的相关系数,包括:获取所述谱质心相关函数序列的最大值,作为谱质心相关系数,获取所述时域相关函数序列的最大值,作为时域相关系数,获取所述过零率相关函数序列的最大值,作为过零率相关系数,获取所述MFCC相关函数序列的最大值,作为MFCC相关系数;将所述谱质心相关系数、所述时域相关系数、所述过零率相关系数和所述MFCC相关系数的加权求和值作为所述相关系数。本专利技术还提供了一种音频比对装置,包括:接收模块、预处理模块、计算模块、比较模块和确定模块;所述接收模块,用于接收需要比对的至少两路音频信号;所述预处理模块,用于对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;所述确定模块,用于基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;所述计算模块,用于根据所述特征序列,计算相关函数序列;所述确定模块,还用于根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;所述比较模块,用于比较所述延迟时间与参考延迟时间的大小;所述计算模块,还用于若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;所述确定模块,还用于若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。本专利技术还提供了一种音频比对设备,所述设备包括:处理器以及与所述处理器相连的存储器;所述存储器用于存储计算机程序,所述计算机程序至少用于以上任一所述的音频比对方法;所述处理器用于调用并执行所述计算机程序。本专利技术的音频比对方法、装置和设备,包括接收需要比对的至少两路音频信号;对每路音频信号进行预处理,使每路音频信号均包含M个音频帧;M为正整数;基于每路音频信号中每个音频帧对应的特征信息,确定每路音频信号的特征序列;根据特征序列,计算相关函数序列;根据相关函数序列,确定任意两路音频信号之间的延迟时间;比较延迟时间与参考延迟时间的大小;若延迟时间小于参考延迟时间,根据相关函数序列计算任意两路音频信号的相关系数;若相关系数大于本文档来自技高网...

【技术保护点】
1.一种音频比对方法,其特征在于,包括:接收需要比对的至少两路音频信号;对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;根据所述特征序列,计算相关函数序列;根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;比较所述延迟时间与参考延迟时间的大小;若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。

【技术特征摘要】
1.一种音频比对方法,其特征在于,包括:接收需要比对的至少两路音频信号;对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;根据所述特征序列,计算相关函数序列;根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;比较所述延迟时间与参考延迟时间的大小;若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。2.根据权利要求1所述音频比对方法,其特征在于,所述对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧,包括:分别重采样并取长度为N的采样序列;所述N为正整数;对每路所述采样序列进行预加重和归一化处理,得到目标采样序列;对每路所述目标采样序列进行音频帧划分,使每路所述目标采样序列包含M个音频帧。3.根据权利要求1所述音频比对方法,其特征在于,所述根据所述特征序列,计算相关函数序列,包括:分别对每路所述特征序列进行离散傅里叶变换,得到第一中间序列和第二中间序列;获取所述第一中间序列的复数共轭,将所述复数共轭与所述第二中间序列逐元素相乘得到第三中间序列;对所述第三中间序列进行逆离散傅里叶变换,得到中间相关函数序列;将所述中间相关函数序列的第一部分与第二部分重新拼接,得到所述相关函数序列。4.根据权利要求3所述音频比对方法,其特征在于,所述基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列,包括:获取每路所述音频信号中每个所述音频帧对应的谱质心序列;获取每路所述音频信号中每个所述音频帧对应的时域序列;获取每路所述音频信号中每个所述音频帧对应的过零率序列;和获取每路所述音频信号中每个所述音频帧对应的梅尔倒谱系数MFCC序列。5.根据权利要求4所述音频比对方法,其特征在于,所述获取每路所述音频信号中每个所述音频帧对应的谱质心序列,包括:分别对每路所述音频信号中每个所述音频帧进行傅里叶变换,得到初始谱质心;将所述初始谱质心归一化处理,获取谱质心,每路所述音频信号中每个所述音频帧的所述谱质心组成每路所述谱质心序列;获取每路所述音频信号中每个所述音频帧对应的过零率序列,包括:提取每路所述音频信号中每个所述音频帧的包络序列;获取所述包络序列的过零率,每路所述音频信号中每个所述音频帧的所述过零率组成每路所述过零率序列;所述获取每路所述音频信号中每个所述音频帧对应的MFCC序列,包括:对每路所述音频信号中每个所述音频帧进行快速傅立叶变换,获取所述音频帧的频率谱;根据所述频率谱,计算所述音频帧的幅度谱和离散功率谱;将所述离散功率谱通过预设的梅尔Mel滤波器;根据所述幅度谱求得所述Mel滤波器的输出;将所述输出取对数,将所述对数作离散余弦变换,得到每路所述音频信号中每个所述音频帧...

【专利技术属性】
技术研发人员:王健周凯王小稳付润豪赵爱国
申请(专利权)人:国家广播电视总局中央广播电视发射二台北京国广电科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1