【技术实现步骤摘要】
本专利技术一般涉及音频信号处理。更具体地,本专利技术的实施例涉及用于在音频帧序列中检测重复模式的方法及设备。
技术介绍
音频信号,尤其是音乐信号,通常显示出重复的特性在音频信号中,一个音频部分在后面将会重复。对音频信号中这些重复部分的检测已引起很多关注,因为这种检测是一个基础性步骤,并且可以用于各种应用,诸如音乐检测、音乐副歌检测、音乐缩略或音乐概括以及音乐结构分析。关于术语“重复部分”,在不同文献中可以使用具有类似含义的不同术语,诸如“反·复出现”、“重复”、“重复模式”或“反复模式”。在本公开中,可以互换地使用这些术语,而不会引起任何混淆。为了检测重复部分,各种方案能够涉及计算相似度(或距离)矩阵,并在矩阵中找到重复模式。相似度矩阵包括帧t与t+Ι之间的相似度值s(t,l),其中I代表相似度值s(t,I)的偏移。一般的思路是,估计固定阈值并用它将矩阵二值化。即,对于相似度矩阵中的每个像素,如果其相似度值大于固定阈值,则将该像素二值化为1,表明该像素表示重复;否则,将该像素设置为O。二值化之后,通过在每个偏移中检测包含连续“I”的线,可容易地检测重复模式(参见 ...
【技术保护点】
一种在音频帧序列中检测重复模式的方法,包括:计算该序列的第一相似度矩阵的相似度值,所述第一相似度矩阵具有第一分辨率;根据所述相似度值估计自适应阈值,用于将所述相似度值分类为重复或非重复;以及针对具有高于所述第一分辨率的第二分辨率的第二相似度矩阵的一个或更多个偏移中的每一个,计算所述第二相似度矩阵中与该偏移相对应的相似度值;利用所述自适应阈值对计算出的相似度值进行分类,以获得二值化数据;以及从所述二值化数据中检测所述重复模式。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。