导出音频输入信号的一个特征集的方法技术

技术编号：3040567 阅读：284 留言：0更新日期：2012-04-11 18:40

本发明专利技术描述一种导出音频输入信号（Ｍ）的一个特征集（Ｓ）的方法，该方法包括：识别音频输入信号（Ｍ）的大量第一阶特征（ｆ↓［１］，ｆ↓［２］，…，ｆ↓［ｆ］），从至少部分第一阶特征（ｆ↓［１］，ｆ↓［２］，…，ｆ↓［ｆ］）产生大量的相关值（ρ↓［１］，ρ↓［２］，…，ρ↓［Ｉ］），使用相关值（ρ↓［１］，ρ↓［２］，…，ρ↓［Ｉ］）编辑音频输入信号（Ｍ）的所述特征集（Ｓ）。本发明专利技术还描述将音频输入信号（Ｍ）分类成组的方法，以及比较音频输入信号（Ｍ，Ｍ’）以确定音频输入信号（Ｍ，Ｍ’）之间的相似性程度的方法。本发明专利技术还描述用于导出音频输入信号（Ｍ）的一个特征集（Ｓ）的系统（１），用于将音频输入信号（Ｍ）分类成组的分类系统（４），以及比较音频输入信号（Ｍ，Ｍ’）以确定音频输入信号（Ｍ，Ｍ’）之间的相似性程度的比较系统（５）。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】导出音频输入信号的一个特征集的方法本专利技术涉及导出音频输入信号的一个特征集的方法，和导出音频输入信号的一个特征集的系统。本专利技术还涉及对音频输入信号进行分类的方法和系统，以及比较音频输入信号的方法和系统。数字内容的存储能力正在显著地增加。在不久的未来期望可以获得具有至少一千兆字节存储容量的硬盘。作为对此的补充，诸如MPEG标准的多媒体内容的压缩算法的演进，显著地减小每个音频或视频文件所需存储容量的数量。结果是消费者将会能够在单个硬盘或其他存储介质上存储许多小时的视频和音频内容。能够从数量不断增加的电台和电视台记录视频和音频。消费者能够通过简单地从万维网即一种正在变得曰益流行的工具，下载视频和音频内容容易地增加他的收集。而且，具有大存储容量的便携式音乐播放器是买得起的和实际的，它允许用户在任何时间能够访问从其进行选择的音乐的广泛选择。但是，从其进行选择的可用视频和音频数据的巨量选择不是没有问题。例如，从具有成千上万音乐乐曲(musictrack)的大型音乐数据库组织和选择音乐是困难并且耗时的。通过包括元数据能够部分地解决该问题，该元数据能够被理解成以某种方式附加到实际音频数据文件的附加信息标记。元数据有时被提供给音频文件，但是并不总是这样。当面对耗时和令人不愉快的检索和分类问题时，用户非常可能会放弃，或者完全不操心。在解决音乐信号的分类问题中已经作出了一些尝试，例如，WO 01/20609 A2提出一种分类系统，在该系统中根据某些诸如节奏复杂度、清晰度、感染力等等的特征或变量对音频信号，即多首音乐或音乐乐曲进行分类。给...

【技术保护点】
一种导出音频输入信号（Ｍ）的一个特征集（Ｓ）的方法，该方法包括：　　　　－识别音频输入信号（Ｍ）的大量第一阶特征（ｆ↓［１］，ｆ↓［２］，…，ｆ↓［ｆ］）；　　　　－从至少部分第一阶特征（ｆ↓［１］，ｆ↓［２］，…，ｆ↓［ｆ］）产生大量的相关值（ρ↓［１］，ρ↓［２］，…，ρ↓［Ｉ］）；　　　　－使用相关值（ρ↓［１］，ρ↓［２］，…，ρ↓［Ｉ］）编辑音频输入信号（Ｍ）的所述特征集（Ｓ）。

【技术特征摘要】
【国外来华专利技术】EP 2005-10-17 05109648.51.一种导出音频输入信号(M)的一个特征集(S)的方法，该方法包括-识别音频输入信号(M)的大量第一阶特征(f1，f2，...，ff)；-从至少部分第一阶特征(f1，f2，...，ff)产生大量的相关值(ρ1，ρ2，...，ρI)；-使用相关值(ρ1，ρ2，...，ρI)编辑音频输入信号(M)的所述特征集(S)。2. 根据权利要求1所述的方法，其中，从音频输入信号(M)的给定域中的一个或多个部分(tn t2， ...， t!)提取第一阶特征(fP f2,ff, fa, fb),相关值(p,, p2, Pi, P )的产生包括使用该域中的相应部分的第一阶特征(f\, f2, ff, fa, fb)对执行相关。3. 根据权利要求2所述的方法，其中，从音频输入信号(M)的不同时间帧(t!, t2, ...，提取第一阶特征(f!, f2, ff, fa, fb),相关值(p,, p2,Pi, p )的产生包括使用不同时间帧(t t2，...，t!)的第一阶特征(f f2,…，ff， fa, fb)执行相关。4. 根据权利要求3所述的方法，其中，对于多个时间帧中的每个时间帧(t!, t2， ...， t!)，提取作为时间的函数的第一阶特征向量(fvl, fv2, fvI)，相关值(P!,P2，…，Pt)的产生包括在大量的特征向量(fvl, fv2, ...， fvl)上执行特征向量(fvl, fv2,…，fvl)的某些元素之间的互相关。5. 根据权利要求3所述的方法，其中，对于多个时间帧中的每个时间帧(tp t2, t!),提取作为频率的函数的第一阶特征向量(fvl,fv2, fvI)，相关值(P,,P2， ...，P!)的产生包括在频率上执行两个时间帧(th ti+1)的特征向量(fvl, fv2, fvl)的某些元素之间的互相关。6. 根据前述权利要求任何之一所述的方法，其中，在产生相关值(PP2, P!)之前用相应的第一阶特征(fl, f2，…，ff)的平均值调节在产生相关值(PP2, P!)中使用的第一阶特征f2, ff)。7. 根据前述权利要求任何之一所述的方法，其中，所述特征集(S)包括大量的相关值(P!，P2, P!)和至少大量第一阶特征(f!,f2， ...， ff)的导出量。8. —种将音频输入信号(M)分类成组，并基于音频输入信号(M) 的所述特征集(S)确定音频输入信号(M)落入大量组的任何一个组内的概率的方法，这里每个组表示特定...

【专利技术属性】
技术研发人员：DJ布里巴特，MF麦金尼，
申请(专利权)人：皇家飞利浦电子股份有限公司，
类型：发明
国别省市：NL[荷兰]

全部详细技术资料下载我是这个专利的主人