音频信号分析方法和设备技术

技术编号:3040965 阅读:181 留言:0更新日期:2012-04-11 18:40
一种用于确定音频信号的音调的方法,该方法包括以下步骤:    对于多个信号分段中的每一个,分析(104)该分段以标识(108)音符,其中标识出至少一个音符:    确定(110)与该音符或每个音符相关的强度;和    生成(112)一个数据记录,该数据记录包含该音符或每个音符的标识、与该音符或每个音符相关的强度和该分段的标识;    对于每条数据记录,如果与所标识的音符相关的强度小于与所述数据记录中包含的任何所标识的音符相关的最大强度的预定分数,则忽略(118)所述强度;    从所述被标识音符中确定(124)第一音符作为它们各自的强度的函数;    从所述被标识音符中选择(128)至少第二和第三音符作为该第一音符的函数;和    基于对所述至少第二和第三音符的各自强度的比较来确定(130)音调。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于确定音频信号的特征(尤其是音调)的方法和设备。随着更廉价存储和对因特网的访问的出现,消费者可以访问和积累包括视频、音频、文本和图形的大量信息和内容。为了有助于消费者对这些内容进行查找和访问,人们已经认识到了对于分类的需要。在音频环境中,分类可以基于音乐流派、艺术家、作曲人等等来进行。然而当基于情绪或其它特定感情标准而进行选择的时候,这些分类可能是有限制的。例如浪漫音乐可以被认为涵盖了古典、流行和其他音乐传统在内的作曲人和音乐风格的范围。情感音乐的特征在于其内在的音乐特征,包括声级、节奏和音调,其中的每一个都与特定的流派、作曲人或相似的分类无关。在Tsuruta等人的美国专利5,038,658中,公开了一种能够确定声学信号的音调的自动音乐转录方法和设备。实施该方法的缺点是需要对声学信号进行多次分割以便确定对于确定音调所必需的音程(musicalinterval),包括基于所获取的功率信息变化、基于标准音符长度和基于在连续区间中的所标识片段的音程是否一致的分割。该方法的另一个缺点是需要通过自相关提取时域中的音高信息。在论文“Querying Large Collections of Music for Similarity”(Welsh etal,UC Berkeley Technical Report UCB/CSD-00-1096,November,1999)中,给出了一种能够实现对大型数字音乐档案进行查询的系统,其中使用了基于一组预处理音乐档案的特征提取器的技术。一个特征提取器产生跨越一个音阶的音符的频率幅度的直方图,直方图的每个条柱对应于所分析的音乐样本的跨越5个八度(octave)的特定音符(例如升C)的平均幅度。其中记载了这种信息可以用于帮助确定演奏该音乐所用的音调,但是没有公开其方法。该方法的另一缺点是可能比较难于将那些与该音乐音调相关的音符与平均音符数据区别开来。本专利技术的一个目的是改进已知技术。根据本专利技术的第一方面,提供一种用于确定音频信号音调的方法,该方法包括以下步骤对于多个信号分段(portion)中的每个分段,分析该分段以标识音符,其中至少一个音符被标识确定与该音符或每个音符相关的强度;和生成包含该音符或每个音符的标识、与该音符或每个音符相关的强度以及该分段的标识的数据记录;对于每个数据记录,如果与所标识的音符相关的强度小于与该数据记录中包含的任何所标识的音符相关的最大强度的预定分数,则忽略所述强度;从所标识的音符中确定第一音符作为它们各自强度的函数;从所标识的音符中选择至少第二和第三音符作为第一音符的函数;和基于对所述至少第二和第三音符的各自强度的比较来确定音调。根据本专利技术的第二方面,提供一种用于确定音频信号音调的设备,该设备包括可用于接收信号的输入装置;数据处理设备,用于对于多个信号分段中的每个分段,分析该分段以标识音符,其中至少一个音符被标识确定与该音符或每个音符相关的强度;和生成包含该音符或每个音符的标识、与该音符或每个音符相关的强度和该分段的标识的数据记录;对于每个数据记录,如果与所标识的音符相关的强度小于与该数据记录中包含的任何所标识的音符相关的最大强度的预定分数,则忽略所述强度;从所标识的音符中确定第一音符作为它们各自强度的函数;从所标识的音符中选择至少第二和第三音符作为第一音符的函数;和基于对所述至少第二和第三音符的各自强度的比较来确定音调。根据本专利技术,可以以高效、准确的方式确定音频信号的音调。该音频信号可以是一段音乐的数字或模拟记录。优选地,每个分段是相同大小的,并且每个分段具有相同的时间长度。有利地,该分段的大小是音频信号的节奏的函数。这些分段可以是连续的。优选地,该预定分数依赖于音频信号的内容来确定。理想地,该预定分数在十分之一到二分之一的范围内,该预定分数的一个优选实施例是七分之一。有利地,分析所述分段以标识音符的步骤包括以下步骤将该分段转换为频域表示;将该频域表示细分为多个八度;对于每个包含最大幅度的八度确定在最大幅度处的频率值;和根据该频率值选择音阶的音符名称;和根据在多于一个八度中选择的相同音符名称来标识音符。在本实施例中,优选地通过傅里叶变换来将该分段变换到频域表示。该音阶理想地为平均律音阶(equal tempered scale)。在一个优选实施例中,确定与音符相关的强度的步骤包括以下步骤确定该音符的每个频率分量的幅度;和对这些幅度求和。有利地,确定第一音符的步骤包括以下步骤对于每个所标识的音符,对各数据记录中的与该音符相关的强度求和;和确定具有最大强度和的所标识音符为第一音符。在一个优选实施例中,该第一音符是该音调的主音。本专利技术的优点是可以随意选择用于分析的音频信号分段,从而这种选择与音频信号的内容无关。并且,本专利技术的方法依赖于检测与音频信号音调相关的音符的存在,优选地检测源于特定类型的音乐源(例如乐器)的音符。有利地,确定音符的定时和持续时间与该方法无关。另一个优点是应用滤波来消除无关音符(和噪音)的影响,否则所述无关音符会干扰确定感兴趣音符的标识的过程。而且,本专利技术的方法适于以廉价硬件和/或软件来实现,从而可以应用于大量消费产品中。现在仅通过示例并参照附图对本专利技术的各实施例进行说明,其中附图说明图1是用于确定音频信号音调的方法的流程图;图2是图1的方法中用于分析音频信号的一个分段的步骤的流程图;图3a是一系列显示音频信号的一个分段的频域表示的示例的曲线图;图3b是显示对应于包含图3a中的分段的音频信号的各分段的一组数据记录表;图4a是显示对应于音频信号各分段的一组数据记录的表;图4b是显示与从图4a的表中的数据得到的所标识音符相关的总强度的表;和图5是用于确定音频信号音调的设备的示意性表示。图1显示了用于确定音频信号音调的方法的流程图。一般地,音频信号通过执行该方法的设备(500,图5)的输入装置(510,图5)接收。该方法一般用100表示,从102开始,分析(104)音频信号的一个分段以标识音符(如下面所详细说明的)。优选地,使用所标识的低音音符来确定音调。这些音符的特征在于,它们的基波分量位于该低音音域(bass register)内并且具有一个或多个相关的谐波频率分量,所述分量与所识别的音阶相关。这些音符可以由标定了音高的乐器(即能够根据音阶来发出一个或多个音符的声音的乐器)来发声,例如低音吉他或低音提琴。其中对于该分段已经标识出至少一个音符,然后该方法确定(110)与该一个或多个音符相关的强度。该强度作为所标识音符的一个或多个频率分量的幅度的函数而被确定。一旦已经确定了与一个分段中的每个音符相关的强度,就会产生(112)数据记录120,该数据记录120包括该一个或多个音符的标识、与每个音符相关的强度以及该分段的标识。然后该方法检查(116)以确认已经对将被处理的音频信号的所有分段106执行了步骤104、108、110和112。要注意的是,所述分段可以仅包含总接收音频信号的一部分,并且所述分段可以是连续或不连续的。对所得到的该组数据记录114中的每条数据记录120进行检查,以忽略(118)该记录中任何小于与包含在该组数据记录中的任何记录中的任何标识的音符相关的最大强度的预定分数(例如七分之一)的本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于确定音频信号的音调的方法,该方法包括以下步骤对于多个信号分段中的每一个,分析(104)该分段以标识(108)音符,其中标识出至少一个音符确定(110)与该音符或每个音符相关的强度;和生成(112)一个数据记录,该数据记录包含该音符或每个音符的标识、与该音符或每个音符相关的强度和该分段的标识;对于每条数据记录,如果与所标识的音符相关的强度小于与所述数据记录中包含的任何所标识的音符相关的最大强度的预定分数,则忽略(118)所述强度;从所述被标识音符中确定(124)第一音符作为它们各自的强度的函数;从所述被标识音符中选择(128)至少第二和第三音符作为该第一音符的函数;和基于对所述至少第二和第三音符的各自强度的比较来确定(130)音调。2.权利要求1所述的方法,其中每个分段是相同大小的。3.权利要求1所述的方法,其中每个分段包含相同的时间长度。4.权利要求1所述的方法,其中分段的大小是音频信号的节奏的函数。5.权利要求1-4中的任何一项所述的方法,其中所述分段是连续的。6.权利要求1-5中的任何一项所述的方法,其中该预定分数根据音频信号的内容来确定。7.权利要求1-6中的任何一项所述的方法,其中该预定分数在十分之一到二分之一的范围内。8.权利要求7所述的方法,其中该预定分数是七分之一。9.权利要求1-8中的任何一项所述的方法,其中分析所述分段以标识音符的步骤包括以下步骤将该分段转换(204)为频域表示;将该频域表示细分(206)为多个八度;对于每个包含最大幅度的八度确定(208)在该最大幅度处的频率值;和基于该频率值选择(210)音阶的音符名称;和基于在多于一个八度中选择的相同的音符名称来标识(216)音符。10.权利要求9所述的方法,其中通过傅里叶变换来将该分段转换为频域表示。11.权利要求9或10所述的方法,其中所述音阶是平均律音阶。12.权利要求1-11中的任何一项所述的方法,其中确定与所述音符或每个音符相关的强度的步骤包括以下步骤确定该音符的每个频率分量的幅度;和对这些幅度求和。13.权利要求1-12中的任何一项所述的方法,其中确定该第一音符的步骤包括以下步骤对于每个被标识音符,对各数据记录中与该音符相关的强度进行求和;和确定第一音符为具有最大强度和的那个被标识音符。14.权利要求1-13中的任何一项所述的方法,其中所述第一音符是音调的主音。15.一种用于确定音频信...

【专利技术属性】
技术研发人员:C·托尔内R·S·科勒
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利