【技术实现步骤摘要】
音频比对方法、装置和设备
本专利技术涉及信号处理
,具体涉及一种音频比对方法、装置和设备。
技术介绍
当前,音频广播已成为最为普及的大众宣传和娱乐媒体。广播电台的节目播出及媒体资源管理等都涉及到音频比对方面的需求,即对两个音频进行比较,判断二者是否相同或相似。现有技术中的音频比对方法,都是基于梅尔倒频谱系数(MelFrequencyCepstrumCoefficient,MFCC)序列这一特征,通过MFCC算法提取音频特征参数,再根据音频特征参数的欧氏距离来判定音频的相似性,但是这种方式仅仅适用于音频质量较高的情况,如果音频质量不高,存在噪声,使用场合有一定的干扰,则会有较高的误报率。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种音频比对方法、装置和设备,以克服目前如果音频质量不高,存在噪声,使用场合有一定的干扰,则会有较高的误报率的问题。为实现以上目的,本专利技术采用如下技术方案:一种音频比对方法,包括:接收需要比对的至少两路音频信号;对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;根据所述特征序列,计算相关函数序列;根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;比较所述延迟时间与参考延迟时间的大小;若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。进一步地,以上所述音频比对方法,所述对每路所述音频信号进 ...
【技术保护点】
1.一种音频比对方法,其特征在于,包括:接收需要比对的至少两路音频信号;对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;根据所述特征序列,计算相关函数序列;根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;比较所述延迟时间与参考延迟时间的大小;若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。
【技术特征摘要】
1.一种音频比对方法,其特征在于,包括:接收需要比对的至少两路音频信号;对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;根据所述特征序列,计算相关函数序列;根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;比较所述延迟时间与参考延迟时间的大小;若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。2.根据权利要求1所述音频比对方法,其特征在于,所述对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧,包括:分别重采样并取长度为N的采样序列;所述N为正整数;对每路所述采样序列进行预加重和归一化处理,得到目标采样序列;对每路所述目标采样序列进行音频帧划分,使每路所述目标采样序列包含M个音频帧。3.根据权利要求1所述音频比对方法,其特征在于,所述根据所述特征序列,计算相关函数序列,包括:分别对每路所述特征序列进行离散傅里叶变换,得到第一中间序列和第二中间序列;获取所述第一中间序列的复数共轭,将所述复数共轭与所述第二中间序列逐元素相乘得到第三中间序列;对所述第三中间序列进行逆离散傅里叶变换,得到中间相关函数序列;将所述中间相关函数序列的第一部分与第二部分重新拼接,得到所述相关函数序列。4.根据权利要求3所述音频比对方法,其特征在于,所述基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列,包括:获取每路所述音频信号中每个所述音频帧对应的谱质心序列;获取每路所述音频信号中每个所述音频帧对应的时域序列;获取每路所述音频信号中每个所述音频帧对应的过零率序列;和获取每路所述音频信号中每个所述音频帧对应的梅尔倒谱系数MFCC序列。5.根据权利要求4所述音频比对方法,其特征在于,所述获取每路所述音频信号中每个所述音频帧对应的谱质心序列,包括:分别对每路所述音频信号中每个所述音频帧进行傅里叶变换,得到初始谱质心;将所述初始谱质心归一化处理,获取谱质心,每路所述音频信号中每个所述音频帧的所述谱质心组成每路所述谱质心序列;获取每路所述音频信号中每个所述音频帧对应的过零率序列,包括:提取每路所述音频信号中每个所述音频帧的包络序列;获取所述包络序列的过零率,每路所述音频信号中每个所述音频帧的所述过零率组成每路所述过零率序列;所述获取每路所述音频信号中每个所述音频帧对应的MFCC序列,包括:对每路所述音频信号中每个所述音频帧进行快速傅立叶变换,获取所述音频帧的频率谱;根据所述频率谱,计算所述音频帧的幅度谱和离散功率谱;将所述离散功率谱通过预设的梅尔Mel滤波器;根据所述幅度谱求得所述Mel滤波器的输出;将所述输出取对数,将所述对数作离散余弦变换,得到每路所述音频信号中每个所述音频帧...
【专利技术属性】
技术研发人员:王健,周凯,王小稳,付润豪,赵爱国,
申请(专利权)人:国家广播电视总局中央广播电视发射二台,北京国广电科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。