计算音乐速度估计制造技术

技术编号:5438861 阅读:342 留言:0更新日期:2012-04-11 18:40
本发明专利技术的各种方法和系统实施例涉及数字编码的音乐片段的音乐 速度的计算估计。在下文所述的本发明专利技术的有些实施例中,对音乐片段的 一小部分加以分析来确定音乐片段的音乐速度。数字编码的音乐片段采 样被计算地变换以产生对应于该采样的功率频谱,接着被变换来产生二 维起奏强度矩阵(618)。二维起奏强度矩阵随后被变换(806)成一组 对应的频带(704-707)中的每个的起奏强度/时间函数(716)的组。 随后分析起奏强度/时间函数来求出最可靠的起奏间隔(808,8100), 该最可靠的起奏间隔被变换成由分析(812)返回的估计的音乐速度。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及信号处理和信号表征,尤其涉及用于估计与音乐作品的 一小部分相对应的音频信号的音乐速度的方法和系统。
技术介绍
随着个人计算机和计算机系统的处理能力、数据容量和功能性的增 强,与其他个人计算机互连的个人计算机以及高端计算机系统已变成用 于各种不同类型的信息和包括音乐的娱乐节目传送的主要媒介。个人计 算机的使用者能从因特网下载大量不同的、数字编码的音乐片段,将数 字编码的音乐片段存储在个人计算机内的大容量存储设备上或者与个 人计算机关联的大容量存储设备上,并且能通过音频播放软件、固件和 硬件部件来取回和播放音乐片段。个人计算机使用者能通过因特网从数 以千计的不同无线电台和其他音频广插-机构接收实况的,流式音频广 播。在用户开始积累了大量的音乐片段,并且开始体验到需要管理和搜 索他们积累的音乐片段时,软件和计算机厂家开始提供各种软件工具来 使得使用者能够组织、管理和浏览存储的音乐片段。对于音乐片段存储 和浏览操作来说,或者通过依靠使用者或者音乐片段提供商与数字编码 的音乐片段关联的、包括标题和缩略说明的文本编码的属性,或者通常 更期望地,通过对数字编码的音乐片段进行分析从而确定音乐片段的各 种特征,来表征音乐片段是经常需要的。作为一个示例,使用者可尝试 通过大量音乐参数值来表征音乐片段从而将类似的音乐一起放置在特 定目录或子目录树内,并且可将音乐参数值输入音乐片段浏览器从而减 小并集中对特定音乐片段的搜索。更复杂的音乐片段浏览软件可采用音 乐片段表征技术来提供本地存储和远程存储的音乐片段的更复杂的自 动搜索和浏览。演奏或广播音乐片段的音乐速度是一种通常遇到的音乐参数。收听 者通常能容易地而且通过直觉来为音乐片段分配音乐速度,或者主要察6觉的速度,尽管音乐速度的分配一般来说不是明确的,并且给定的收听 者可给在不同音乐上下文中存在的相同音乐片段分配不同的音乐速度。 然而,由大量收听者分配的给定音乐片段的按照每分钟的节拍的主要速 度或音乐速度一般落入一个或几个离散的窄频带中。而且,察觉的音乐 速度一般对应于代表了音乐片段的音频信号的信号特征。因为音乐速度 是通常被认识的并且是基本的音乐参数,所以计算机使用者、软件厂家、 音乐提供商和音乐广播公司都已经认识到对于确定给定的音乐片段的 音乐速度值的有效计算方法的需要,该音乐速度值可用作用于对数字编 码的音乐片段进行组织、存储、取回以及搜索的参数。
技术实现思路
本专利技术的各种方法和系统实施例涉及对数字编码的音乐片段的音 乐速度进行计算估计。在如下所述的本专利技术的某些实施例中,对音乐片 段的 一 小部分进行分析来确定音乐片段的音乐速度。对数字编码的音乐 片段按照计算方法进行变换来得到对应于该采样的功率语,依次变换来 得到二维起奏强度矩阵。随后针对一组对应的频带,将二维起奏强度矩 阵变换成 一组起奏强度/时间函数。随后分析起奏强度/时间函数以得到 最可靠的起奏间隔,该起奏间隔被变换成通过分析所返回的被估计的音 乐速度。附图说明图1A-图1G示出了产生音频波形的多个分量音频信号或分量波形 的组合。图2示出了将复杂波形分解成分量波形频率的数学方法。 图3示出了加入幅度相对于频率和时间的三维标绘图的第 一频域标 绘图。图4示出了三维频率、时间和幅度标绘图,其中两列绘出的数据符合时间zl和r2处的时间轴。图5示出了由对于图2-图4所述方法产生的频谱图。图6A-图6C示出了本专利技术的方法实施例中使用的频谱图的两种变换中的第一种。图7A-图7B示出了针对一组频带的起奏强度/时间函数的计算。7图8是示出了本专利技术的 一 音乐速度估计方法实施例的流程控制图。图9A-图9D示出了起奏间隔和相位的概念。图10示出了由图8中的步骤810所表示的搜索的状态空间。图11示出了根据本专利技术的实施例,在D(t,b)值的邻域内的波顶D(t, b)值的选择。图12示出了在通过连续考虑沿时间轴的起奏间隔的代表性D(t,b)值来计算可靠度的过程的一个步骤。图13示出了根据起奏间隔中的可能的、更高阶频率或音乐速度的识别减'J、或降低起奏间隔的可靠度。具体实施例方式本专利技术的各种方法和系统实施例涉及针对数字编码的音乐片段的 估计音乐速度的计算确定。如下详细地所述,对音乐片段的小部分进行 变换来产生多个起奏强度/时间函数,被分析以确定估计的音乐速度。 在以下讨论中,首先概括地讨论了音频信号,随后讨论本专利技术的方法实 施例中所使用的,用于产生一组频带的起奏强度/时间函数的各种变换。 随后利用图形说明和流程控制图来描述起奏强度/时间函数的分析。图1A-图1G示出了产生音频波形的多个分量音频信号或分量波形 的组合。尽管图U-图1G示出了的波形分量是一般波形分量的特殊情 况,但是示例示出 一 般复杂音频波形可以由多个简单的单 一 频率波形分 量组成。图1A示出了六个简单分量波形的第一个的一部分。音频信号 基本上是通过空间传播的振荡气压扰动。当在空间中的特定点处随时间 观察时,气压关于一中值气压规则地振荡。图1A中的波形102是正弦 波形,沿竖轴画出气压并沿横轴画出时间,以图形方式显示了在空间特 定点处作为时间的函数的气压。声波强度与声波的气压幅度的平方成比 例。通过按时测量沿从特定距离处的声源发出的直线的空间中各个点处 的气压也得到类似波形。返回到空间特定点处一段时间内的气压的波形 表现形式,在波形中任意两个波顶之间的距离,诸如波顶106和108之 间的距离104,是在气压扰动中连续的振荡之间的时间。该时间的倒数 是波形的频率。认为图1A所示的分量波形具有基频尸,图1B-图1F所 示的波形表示基频的各个高阶谐波。谐波频率是基频的整数倍。因此, 例如,图1B所示的分量波形的频率2尸,是图1A所示基频的频率的两倍,因为在具有基频f的分量波形中发生一个周期的同时,在图IB所示的分量波形中发生了两个完整的周期。图1C-图1F的分量波形的频率分别 是;3/,4/, ^和ef。图1A-图IF所示的六个波形的总和产生图1G所示 的音频波形110。音频波形可以表示在弦乐器或管乐器上演奏的单个音。 音频波形具有比图1A-图1F所示的正弦、单一频率、分量波形更复杂的 形状。然而,音频波形可被看成以基频尸重复,并且展现出在更高频率 处的规则模式。与复杂音乐片段相对应的波形,诸如乐队或管弦乐队演奏的歌曲, 可以是极复杂的由好几百个不同的分量波形组成。如在图1A-图1G的示 例中所看到的,通过目测或直觉^^图1G中所示的波形110分解成图1A-图1F所示的分量波形将会非常困难。对于代表演奏的音乐分量的非常 复杂的波形来说,通过目测或直觉进行分解实际上是不可能的。已经开 发出数学方法来将复杂波形分解成分量波形频率。图2示出了将复杂波 形分解成分量波形频率的数学方法。在图2中,示出了相对于时间绘制 的复杂波形202的幅度。该波形能利用短时傅立叶变换方法进行数学变 换,来产生针对给定短时间段在一频率范围内的每个频率处的分量波形 的幅度的绘图。图2示出了连续短时傅立叶变换204:其中,^是一时间点, ^(是描绘波形的函数, —是时间窗函数, 是所选频率,以及^V)是波形W。中频率在时间5的分量波形的幅度、压力或能量。和短时傅立叶变换的离散形式206本文档来自技高网
...

【技术保护点】
一种计算估计音乐片段的音乐速度的方法(图8),该方法包括: 选择音乐片段的一部分; 针对音乐片段的所选择的部分来计算(804)频谱图(502); 针对一组对应的频带(704-707),将频谱图变换(806)成一组起奏强度/ 时间函数(716); 通过对起奏间隔长度范围内的每个起奏间隔长度(906-912)的可能相位进行分析,包括对与每个起奏间隔长度对应的更高频率谐波进行分析,来分析该组起奏强度/时间函数,以确定最可靠的起奏间隔长度(808,8100),以 及 根据最可靠的起奏间隔长度来计算音乐速度估计(812)。

【技术特征摘要】
【国外来华专利技术】2006.9.11 US 11/519,5451. 一种计算估计音乐片段的音乐速度的方法(图8),该方法包括选择音乐片段的一部分;针对音乐片段的所选择的部分来计算(804)频谱图(502);针对一组对应的频带(704-707),将频谱图变换(806)成一组起奏强度/时间函数(716);通过对起奏间隔长度范围内的每个起奏间隔长度(906-912)的可能相位进行分析,包括对与每个起奏间隔长度对应的更高频率谐波进行分析,来分析该组起奏强度/时间函数,以确定最可靠的起奏间隔长度(808,8100),以及根据最可靠的起奏间隔长度来计算音乐速度估计(812)。2. 如权利要求1所述的方法,其中针对一组对应的频带(704-707 ), 将频语图(502 )变换成一组起奏强度/时间函数(716)还包括将频镨图(502 )变换成二维起奏强度矩阵(618);选择一组频带;以及针对每个频带,计算起奏强度/时间函数。3. 如权利要求2所述的方法,其中将频谱图(502 )变换成二维起 奏强度矩阵(618 )还包括针对频语图中由采样时间t和频率f索引的每个内部点值^n, 计算针对采样时间t和频率f的起奏强度值^m, 将所计算出的起奏强度值^^,f)包括在以t和f为索引的二维 起奏强度矩阵单元中;其中针对对应的频谙图内部点值n,起奏强度值〃,n被计算为 d, /) =max/) , / pU—/)) —p/7, /)其中/7/7(t' /') = p(t + 1, /);其中,选择一组频带(704-707 )还包括将频谱图中包括的频率范 围分割成多个频带;并且其中针对频带b来计算起奏强度/时间函数还包括针对每个采样时间~,通过将二维起奏强度矩阵(618 )中t = ~ 并且f处在与频带b相关联的频率范围内的起奏强度值〃(f)求和,来计算起奏强度值U,, 6)。4. 如权利要求l所述的方法,其中通过对在起奏间隔长度范围内的每个起奏间隔长度的可能相 位进行分析,包括对每个起奏间隔长度的更高频率谐波进行分析,来分析该组起奏强度/时间函数(716),以确定最可靠的起奏间隔长度 (906-912 )还包括针对与频带b对应的每个起奏强度/时间函数,对于起奏间隔长度范围内的每个起奏间隔长度的每个可能的相位 计算可靠度,对针对每个起奏间隔长度计算出的可靠度在频带(704-707 )上求和,以得到针对每个起奏间隔长度的最终计算出的可靠度,并且选择具有最大的最终计算出的可靠度的起奏间隔长度为最终的最 可靠的起奏间隔长度;并且其中,根据最可靠的起奏间隔长度来计算音乐速度估计还包括,利 用每个固定时间段收集的用于得到频语图(502 )的采样点的固定数量, 以及利用每个采样点所代表的时间间隔,从以采样点为单位的最可靠的 起奏间隔长度来计算按照每分钟的节拍的音乐速度。5. 如权利要求4所述的方法,其中计算一特定相位下的一起奏间 隔长度(906-912 )的可靠度还包括初始化该起奏间隔长度的可靠度变量和损失变量; 从距起奏强度/时间函数(716)的原点移位了该相位的采样时间开始,并且继续到已经考虑了在起奏强度/时间函数内的采样点的全部起奏间隔长度为止选择采样点的下 一 当前考虑的起奏间隔长度,对于采样点的该选择出的下 一起奏间隔长度,从起奏强度/时 间函数中选择代表性U,扮值,当选择的代表性扮值大于阈值时,将可靠度变量递增一数值,当在采样点的该当前考虑的起奏间隔长度内检测出可能的更 高次节拍频率时,将损失变量递增一数值,以及当选择的代表...

【专利技术属性】
技术研发人员:Y·Y·常R·萨马达尼T·张S·维道森
申请(专利权)人:惠普开发有限公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1