用于在音频帧序列中检测重复模式的方法及设备技术

技术编号:8387594 阅读:184 留言:0更新日期:2013-03-07 08:17
描述了用于在音频帧序列中检测重复模式的方法及设备。计算该序列的具有第一分辨率的第一相似度矩阵的相似度值。根据相似度值估计自适应阈值,用于将相似度值分类为重复或非重复。针对第二相似度矩阵的一个或更多个偏移中的每一个,计算第二相似度矩阵中与该偏移相对应的相似度值,其中第二相似度矩阵具有高于第一分辨率的第二分辨率。然后,利用自适应阈值对计算出的相似度值进行分类,以获得二值化数据。最后,从二值化数据中检测重复模式。由于在重复模式检测中存储的数据更少,因此可以减小对存储器的要求。

【技术实现步骤摘要】

本专利技术一般涉及音频信号处理。更具体地,本专利技术的实施例涉及用于在音频帧序列中检测重复模式的方法及设备
技术介绍
音频信号,尤其是音乐信号,通常显示出重复的特性在音频信号中,一个音频部分在后面将会重复。对音频信号中这些重复部分的检测已引起很多关注,因为这种检测是一个基础性步骤,并且可以用于各种应用,诸如音乐检测、音乐副歌检测、音乐缩略或音乐概括以及音乐结构分析。关于术语“重复部分”,在不同文献中可以使用具有类似含义的不同术语,诸如“反·复出现”、“重复”、“重复模式”或“反复模式”。在本公开中,可以互换地使用这些术语,而不会引起任何混淆。为了检测重复部分,各种方案能够涉及计算相似度(或距离)矩阵,并在矩阵中找到重复模式。相似度矩阵包括帧t与t+Ι之间的相似度值s(t,l),其中I代表相似度值s(t,I)的偏移。一般的思路是,估计固定阈值并用它将矩阵二值化。即,对于相似度矩阵中的每个像素,如果其相似度值大于固定阈值,则将该像素二值化为1,表明该像素表示重复;否则,将该像素设置为O。二值化之后,通过在每个偏移中检测包含连续“I”的线,可容易地检测重复模式(参见 M. Goto. 本文档来自技高网...

【技术保护点】
一种在音频帧序列中检测重复模式的方法,包括:计算该序列的第一相似度矩阵的相似度值,所述第一相似度矩阵具有第一分辨率;根据所述相似度值估计自适应阈值,用于将所述相似度值分类为重复或非重复;以及针对具有高于所述第一分辨率的第二分辨率的第二相似度矩阵的一个或更多个偏移中的每一个,计算所述第二相似度矩阵中与该偏移相对应的相似度值;利用所述自适应阈值对计算出的相似度值进行分类,以获得二值化数据;以及从所述二值化数据中检测所述重复模式。

【技术特征摘要】

【专利技术属性】
技术研发人员:芦烈程斌
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利