用于在音频帧序列中检测重复模式的方法及设备技术

技术编号:8387594 阅读:167 留言:0更新日期:2013-03-07 08:17
描述了用于在音频帧序列中检测重复模式的方法及设备。计算该序列的具有第一分辨率的第一相似度矩阵的相似度值。根据相似度值估计自适应阈值,用于将相似度值分类为重复或非重复。针对第二相似度矩阵的一个或更多个偏移中的每一个,计算第二相似度矩阵中与该偏移相对应的相似度值,其中第二相似度矩阵具有高于第一分辨率的第二分辨率。然后,利用自适应阈值对计算出的相似度值进行分类,以获得二值化数据。最后,从二值化数据中检测重复模式。由于在重复模式检测中存储的数据更少,因此可以减小对存储器的要求。

【技术实现步骤摘要】

本专利技术一般涉及音频信号处理。更具体地,本专利技术的实施例涉及用于在音频帧序列中检测重复模式的方法及设备
技术介绍
音频信号,尤其是音乐信号,通常显示出重复的特性在音频信号中,一个音频部分在后面将会重复。对音频信号中这些重复部分的检测已引起很多关注,因为这种检测是一个基础性步骤,并且可以用于各种应用,诸如音乐检测、音乐副歌检测、音乐缩略或音乐概括以及音乐结构分析。关于术语“重复部分”,在不同文献中可以使用具有类似含义的不同术语,诸如“反·复出现”、“重复”、“重复模式”或“反复模式”。在本公开中,可以互换地使用这些术语,而不会引起任何混淆。为了检测重复部分,各种方案能够涉及计算相似度(或距离)矩阵,并在矩阵中找到重复模式。相似度矩阵包括帧t与t+Ι之间的相似度值s(t,l),其中I代表相似度值s(t,I)的偏移。一般的思路是,估计固定阈值并用它将矩阵二值化。即,对于相似度矩阵中的每个像素,如果其相似度值大于固定阈值,则将该像素二值化为1,表明该像素表示重复;否则,将该像素设置为O。二值化之后,通过在每个偏移中检测包含连续“I”的线,可容易地检测重复模式(参见 M. Goto. “A chorus-section detecting method for musicalaudio signals,,,Proc. Acoustics, Speech, and Signal Processing, 2003,其通过弓I用并入于此以用于全部目的)。本章节中描述的方案是能够采用的方案,但不一定是先前已经构思或采用的方案。因此,除非另外指出,不应仅因为被包含在本章节中就假定本章节描述的任何方案适合作为现有技术。类似地,根据本章节而关于一个或更多个方案发现的问题不应被假定为任何现有技术中已经认识到的问题,除非另外指出。
技术实现思路
根据本专利技术的一个实施例,提供了一种在音频帧序列中检测重复模式的方法。根据该方法,计算该序列的具有第一分辨率的第一相似度矩阵的相似度值。根据相似度值估计自适应阈值,用于将相似度值分类为重复或非重复。针对第二相似度矩阵的一个或更多个偏移中的每一个,计算第二相似度矩阵中与该偏移相对应的相似度值,其中第二相似度矩阵具有高于第一分辨率的第二分辨率。利用自适应阈值对计算出的相似度值进行分类,以获得二值化数据。从二值化数据中检测重复模式。根据本专利技术的另一实施例,提供了一种用于在音频帧序列中检测重复模式的设备。该设备包括计算器、估计器以及检测器。计算器计算该序列的具有第一分辨率的第一相似度矩阵的相似度值。估计器根据相似度值估计自适应阈值,用于将相似度值分类为重复或非重复。检测器针对具有高于第一分辨率的第二分辨率的第二相似度矩阵的一个或更多个偏移中的每一个,计算第二相似度矩阵中与该偏移相对应的相似度值,利用自适应阈值对计算出的相似度值进行分类以获得二值化数据,并从二值化数据中检测重复模式。根据本专利技术的另一实施例,提供了一种记录有计算机程序指令的计算机可读介质。这些指令在由处理器执行时使得该处理器能够进行一种在音频帧序列中检测重复模式的方法。根据该方法,计算该序列的具有第一分辨率的第一相似度矩阵的相似度值。根据相似度值估计自适应阈值,用于将相似度值分类为重复或非重复。针对第二相似度矩阵的一个或更多个偏移中的每一个,计算第二相似度矩阵中与该偏移相对应的相似度值,其中第二相似度矩阵具有高于第一分辨率的第二分辨率。利用自适应阈值对计算出的相似度值进行分类,以获得二值化数据。从二值化数据中检测重复模式。根据本专利技术的另一实施例,提供了一种在音频帧序列中检测重复模式的方法。计算该序列的第一相似度矩阵的相似度值。针对第一相似度矩阵的各偏移中的每一个,基于第一相似度矩阵中与该偏移相对应的、计算出的相似度值,计算重要性得分,所述重要性得分用于评估检测到与该偏移相对应的重复模式的可能性。将重要性得分与和该偏移相关联 的阈值进行比较。如果重要性得分大于所述阈值,则将该偏移确定为重要偏移。在缓冲器中存储第一相似度矩阵中与重要偏移相对应的相似度值。根据相似度值估计自适应阈值,用于将相似度值分类为重复或非重复。针对与第一相似度矩阵具有相同分辨率的第二相似度矩阵,从缓冲器读取第一相似度矩阵中对应于重要偏移的相似度值,以作为第二相似度矩阵中要计算的相似度值。利用自适应阈值对读取出的相似度值进行分类,以获得二值化数据。从二值化数据中检测重复模式。根据本专利技术的另一实施例,提供了一种在音频帧序列中检测重复模式的设备。设备包括计算器、估计器以及检测器。计算器计算该序列的第一相似度矩阵的相似度值。针对第一相似度矩阵的各偏移中的每一个,计算器基于第一相似度矩阵中与该偏移相对应的、计算出的相似度值,计算重要性得分,所述重要性得分用于评估检测到与该偏移相对应的重复模式的可能性。计算器也将重要性得分与和该偏移相关联的阈值进行比较。如果重要性得分大于阈值,则计算器将该偏移确定为重要偏移。计算器还在缓冲器中存储第一相似度矩阵中与重要偏移相对应的相似度值。估计器根据相似度值估计自适应阈值,用于将相似度值分类为重复或非重复。针对与第一相似度矩阵具有相同分辨率的第二相似度矩阵,检测器从缓冲器读取第一相似度矩阵中对应于重要偏移的相似度值,以作为第二相似度矩阵中要计算的相似度值。检测器利用自适应阈值对读取出的相似度值进行分类,以获得二值化数据,并且从二值化数据中检测所述重复模式。下面参考附图详细描述本专利技术的进一步特性和优点,以及本专利技术各个实施例的结构和操作。应当注意,本专利技术不限于这里描述的具体实施例。在这里出现这样的实施例只是出于说明的目的。相关领域技术人员根据这里包含的指导会想到其它实施例。附图说明在附图的各图中通过示例来图解本专利技术,但这些示例不对本专利技术产生限制,附图中类似的附图标记表示类似的元件,其中图1(a)图示相似度矩阵的示例,且图1(b)图示从图1(a)所示的矩阵转换得到的时滞相似度矩阵的示例;图2是图示根据本专利技术实施例的用于在音频帧序列中检测重复模式的示例设备的框图;图3是图示根据本专利技术实施例的在音频帧序列中检测重复模式的示例方法的流程图;以及图4是图示用于实施本专利技术的各个方面的示例性系统的框图。具体实施例方式下面参考附图描述本专利技术实施例。应注意,为清楚起见,在附图和描述中省略了关于本领域技术人员已知但是与本专利技术无关的组件和过程的陈述和描述。本领域的技术人员可以理解,本专利技术的各方面可以被实施为系统(例如在线数字媒体商店、云计算服务、流媒体服务、电信网络等)、装置(例如蜂窝电话、便携媒体播放器、个人计算机、电视机顶盒、或数字录像机、或任意其它媒体播放器)、方法或计算机程序 产品。因此,本专利技术的各方面可以采取以下形式完全硬件实施例、完全软件实施例(包括固件、驻留软件、微代码等)或组合软件部分与硬件部分的实施例,本文可以一般地称之为“电路”、“模块”或“系统”。此外,本专利技术的各方面可以采取体现为一个或更多个计算机可读介质的计算机程序产品的形式,该计算机可读介质上体现有计算机可读程序代码。可以使用一个或更多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质例如可以是(但不限于)电的、磁的、光的、电磁的本文档来自技高网
...

【技术保护点】
一种在音频帧序列中检测重复模式的方法,包括:计算该序列的第一相似度矩阵的相似度值,所述第一相似度矩阵具有第一分辨率;根据所述相似度值估计自适应阈值,用于将所述相似度值分类为重复或非重复;以及针对具有高于所述第一分辨率的第二分辨率的第二相似度矩阵的一个或更多个偏移中的每一个,计算所述第二相似度矩阵中与该偏移相对应的相似度值;利用所述自适应阈值对计算出的相似度值进行分类,以获得二值化数据;以及从所述二值化数据中检测所述重复模式。

【技术特征摘要】

【专利技术属性】
技术研发人员:芦烈程斌
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利