一种提取歌曲副歌的方法、装置和系统制造方法及图纸

技术编号:8272082 阅读:341 留言:1更新日期:2013-01-31 04:32
本发明专利技术实施例公开了一种提取歌曲副歌的方法、装置和系统。本发明专利技术实施例采用对获取到的音频信号进行节拍追踪,然后根据节拍追踪结果,以节拍为单位提取chroma特征向量,根据chroma特征向量选择副歌估计片段,再根据预置条件对副歌估计片段进行评分,根据评分结果从副歌估计片段中选择副歌。由于该方案可以对歌曲的节拍进行跟踪,并基于歌曲的节拍来进行后续的chroma特征向量提取,以实现对副歌的提取,所以相对现在技术所采用的传统方法而言,更能贴合不同节拍的歌曲的需求,可以更灵活和准确地提取副歌。

【技术实现步骤摘要】
本专利技术涉及通信
,具体涉及一种提取歌曲副歌的方法、装置和系统
技术介绍
通常,一首歌曲是由一定结构性的段落组成,包括前奏、主歌、副歌、间奏等。而其中的副歌,一般会重复2至3次,其旋律和歌词都非常相似,形成了流行歌曲中通常最容易被人记忆的部分,给予听者一种歌曲达到“高潮”的感觉。因此,副歌可以称为一首歌曲当中“最具代表性”和“最吸引人”的部分。另外,副歌片段的长度明显短于整个歌曲的长度,因此副歌片段可以作为一首歌曲的有效标志。作为一首歌曲的标志,如果能够准确的提取副歌部分将会在音乐概要和彩铃等方面有很广阔的商业应用前景。但是,一首歌曲音频文件中信号的复杂性和不同歌曲之间的差异性为副歌提取带来很多的困难。现有技术中具有很多提取副歌的方法,但是其效果均·不太理想,基于音高特征分布向量(即chroma特征向量)的副歌提取方法是其中的一种较为常用的方法,其方案具体可以如下第一步,将音频信号分为等长的片段,每一片段称为帧,从片段中提取12维的chroma特征向量,其中,这12维的chroma特征向量代表12个不同半音量值的分布。第二步,计算chroma特征向量的相似性。第三步,通过比较不同两个片段的相似性,得到重复片段。第四步,对得到的重复片段进行分类和整合。第五步,对第四步中得到的整合后的重复片段进行修正。比如在第四步中没有考虑到基音的变化(即变调),则此时需要对第四步得到的重复片段提高音高再去提取重复片段。第六部,选择副歌部分。比如,当一个重复片段在两个较长的重复片段之间时更有可能为副歌部分;又比如,副歌部分一般含有两个重复的子部分,如果一个重复片段有两个重复子片段时更有可能为副歌部分。将这些假设设置为条件,根据条件对重复片段进行打分,得分高的即为副歌部分。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,现有技术主要采用固定分帧的方法,在默认节奏是固定的情况下,将歌曲分割成等长度的片段(即帧)。但实际上,歌曲的节拍并不是固定的,所以采用该方案并不能准确地提取副歌部分。
技术实现思路
本专利技术实施例提供一种提取歌曲副歌的方法、装置和系统;可以较为准确地提取歌曲的副歌部分。一种提取歌曲副歌的方法,包括获取音频信号;对所述音频信号进行节拍追踪,得到节拍追踪结果;根据节拍追踪结果,以节拍为单位提取音高特征分布向量chroma特征向量;根据chroma特征向量选择副歌估计片段;根据预置条件对副歌估计片段进行评分,得到评分结果;根据评分结果从副歌估计片段中选择副歌。一种副歌提取设备,包括获取单元,用于获取音频信号;节拍追踪单元,用于对获取单元获取到的音频信号进行节拍追踪,得到节拍追踪结果;特征提取单元,用于根据节拍追踪单元得到的节拍追踪结果,以节拍为单位提取 音高特征分布向量chroma特征向量;估计单元,用于根据特征提取单元提取到的chroma特征向量选择副歌估计片段;评分单元,用于根据预置条件对估计单元选择出的副歌估计片段进行评分,得到评分结果;选择单元,用于根据评分单元得到的评分结果从副歌估计片段中选择副歌。本专利技术实施例采用对获取到的音频信号进行节拍追踪,然后根据节拍追踪结果,以节拍为单位提取音高特征分布向量chroma特征向量,根据chroma特征向量选择副歌估计片段,再根据预置条件对副歌估计片段进行评分,根据评分结果从副歌估计片段中选择副歌;由于该方案可以对歌曲的节拍进行跟踪,并基于歌曲的节拍来进行后续的chroma特征向量提取,实现对副歌进行提取,所以相对现有技术所采用的固定分帧方法而言,更能贴合不同节拍的歌曲的需求,可以更灵活和准确地提取副歌。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I是本专利技术实施例提供的提取歌曲副歌的方法的流程图;图2是本专利技术实施例提供的提取歌曲副歌的方法的另一流程图;图3是本专利技术实施例提供的副歌提取设备的结构示意图;图4是本专利技术实施例提供的副歌提取设备的另一结构示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。副歌提取在日常生活中具有很广泛的应用首先,由于手机铃声以及彩铃在时间长度上的限制性,一般不可能使用整首歌曲。因此对于任意给定的流行音乐歌曲,如果可以自动生成手机铃声以及彩铃的话,则可以为用户提供更加丰富的个性化服务,为用户带来更好的使用体验。而副歌的提取则可以满足该需求,副歌的提取可以应用于手机铃声以及彩铃的自动生成,用户可以在大量的提取出的副歌数据库选择自己喜欢的副歌作为手机铃声或彩铃,也可以利用该副歌提取方法制作自己喜欢的手机铃声以及彩铃。其次,在大规模的音乐数据库中,可以通过副歌提取来制作示范片段,使得用户可以通过欣赏提取出的较少的副歌部分来决定是否下载,从而可以避免直接下载整首歌曲,以节省网络带宽。最后,副歌提取技术可以应用在音乐版权的管理和保护中。当然,副歌的提取也可以有其他的应用,在此不再赘述。本专利技术实施例提供一种提取歌曲副歌的方法、装置和系统。以下分别进行详细说明。实施例一、本实施例将从副歌提取设备的角度进行描述。该副歌提取设备具体可以为计算机。一种提取歌曲副歌的方法,包括获取音频信号,对该音频信号进行节拍追踪,得到节拍追踪结果,根据节拍追踪结果,以节拍为单位提取音色(chroma)特征向量,根据chroma特征向量选择副歌估计片段,根据预置条件对副歌估计片段进行评分,得到评分结果,根据评分结果从副歌估计片段中选择副歌。如图I所示,具体流程可以如下101、获取音频信号;例如,读取一个音频文件,比如一首流行歌曲,该音频文件具体可以由系统自动读取,也可以由用户输入。102、对获取到的音频信号进行节拍追踪,得到节拍追踪结果;例如,可以对音频信号进行音符开端检测(Onset Detection),得到音符开端检测结果,然后根据音符开端检测结果进行节拍追踪,使得节拍的开端尽可能与音符开端重合,并且使得两个节拍之间的时间长度恒定。如下(I)对音频信号进行音符开端检测,得到音符开端检测结果,具体可以如下将音频信号划分为第一预置长度的帧;对划分为帧的音频信号通过短时傅立叶变换(STFT, Short-time Fourier Transform)映射到频域;对映射到频域的音频信号进行频谱分析,得到音符开端检测函数(此时音符开端检测函数即为音符开端检测结果)。其中,第一预置长度的大小可以根据实际应用的需求进行设置,一般为了保证短时傅里叶变换中的信号相对稳定,可以对音频信号进行固定长度的分帧,即第一预置长度为一固定的值,比如可以设置第一预置长度为32毫秒(ms),且每次以4ms为单位进行推进一进行分巾贞。例如,如果一音频信号的长度为60ms,则可以划分为1ms 32ms为第一中贞,5ms 36ms为第二巾贞,9ms 40ms为第三巾贞,13ms 44m本文档来自技高网
...

【技术保护点】
一种提取歌曲副歌的方法,其特征在于,包括:获取音频信号;对所述音频信号进行节拍追踪,得到节拍追踪结果;根据节拍追踪结果,以节拍为单位提取音高特征分布向量chroma特征向量;根据chroma特征向量选择副歌估计片段;根据预置条件对副歌估计片段进行评分,得到评分结果;根据评分结果从副歌估计片段中选择副歌。

【技术特征摘要】
1.一种提取歌曲副歌的方法,其特征在于,包括 获取音频信号; 对所述音频信号进行节拍追踪,得到节拍追踪结果; 根据节拍追踪结果,以节拍为单位提取音高特征分布向量chroma特征向量; 根据chroma特征向量选择副歌估计片段; 根据预置条件对副歌估计片段进行评分,得到评分结果; 根据评分结果从副歌估计片段中选择副歌。2.根据权利要求I所述的方法,其特征在于,所述根据chroma特征向量选择副歌估计片段包括 利用chroma特征向量进行自距离矩阵计算; 根据自距离矩阵中每一个元素所表示的距离大小对自距离矩阵进行二值化处理,得到二值化结果; 根据二值化结果选择副歌估计片段。3.根据权利要求2所述的方法,其特征在于, 所述利用chroma特征向量进行自距离矩阵计算包括根据音频信号的总节拍数和chroma特征向量定义自距离矩阵,从自距离矩阵的主对角线开始向左下方平移,计算每一条子对角线上所有矩阵元素的平均值,得到元素平均值,计算第一函数的极小值,其中,第一函数为一个以k为自变量,元素平均值为函数值的函数; 则所述根据自距离矩阵中每一个元素所表示的距离大小对自距离矩阵进行二值化处理,得到二值化结果包括根据第一函数的极小值获取对应的子对角线,将获取到的对角线上的矩阵元素与预置第一阈值进行比较,若矩阵元素大于所述第一阈值,则将矩阵元素设置为0,若矩阵元素小于等于所述第一阈值,则将矩阵元素设置为I ; 所述根据二值化结果选择副歌估计片段包括若连续出现I的音频信号片段的长度大于预置的第二阈值,则确定该音频信号片段为副歌估计片段。4.根据权利要求I至3中任一项所述的方法,其特征在于,所述对音频信号进行节拍追踪具体为 对音频信号进行音符开端检测,得到音符开端检测结果; 根据音符开端检测结果进行节拍追踪,使得节拍的开端尽可能与音符开端重合,并且使得两个节拍之间的时间长度恒定。5.根据权利要求4所述的方法,其特征在于,所述对音频信号进行音符开端检测,得到音符开端检测结果具体为 将音频信号划分为第一预置长度的帧; 对划分为帧的音频信号通过短时傅立叶变换映射到频域; 对映射到频域的音频信号进行频谱分析,得到音符开端检测函数。6.根据权利要求5所述的方法,其特征在于,所述根据音符开端检测结果进行节拍追踪,使得节拍的开端尽可能与音符开端重合,并且使得两个节拍之间的时间长度恒定包括 将音符开端检测函数与预置的衡量标准函数的和作为目标函数,所述衡量标准函数为用于衡量速率的一个标准;计算可以使得所述目标函数的值最大的节拍序列; 则所述根据节拍追踪结果,以节拍为单位提取chroma特征向量具体为根据所述节拍序列,以节拍为单位提取chroma特征向量。7.根据权利要求I至3中任一项所述的方法,其特征在于,所述根据节拍追踪结果,以节拍为单位提取chroma特征向量包括 将音频信号划分为第二预置长度的帧; 将每一帧内的音频信号通过傅里叶变换由时域映射到频域; 在频域中将对应于不同八度但对应同一音名频率的部...

【专利技术属性】
技术研发人员:李伟梁达文顾旻玮杨素娟
申请(专利权)人:华为技术有限公司复旦大学
类型:发明
国别省市:

网友询问留言 已有1条评论
  • 来自[北京市百度蜘蛛] 2014年12月10日 15:22
    前奏过后跟着来的有音乐的主歌Verse副歌Chorus音乐过门及结尾IntrumentalandEnding主歌可以说是内容是每首音乐的主干而音乐的结构是有一特定型式的此结构型式在乐理上称之为Form一般的歌曲大多作AA'BA'FormA代表主歌而B段是副歌亦即是说通常一首歌的构造就是由前奏两段主歌一段副歌过门音乐再来一次的副歌和主歌以及结尾音乐顺序地连接而成的
    0
1