数字音乐旋律的跨越式高速匹配方法组成比例

技术编号:2855560 阅读:395 留言:0更新日期:2012-04-11 18:40
一种数字音乐旋律的跨越式高速匹配方法,步骤包括:标准旋律特征读取和匹配检索控制步骤;旋律分段位置检测和移动匹配控制步骤;旋律分段旋律分段匹配步骤;旋律匹配检索结果显示步骤。旋律特征由表征音符特征的音高差、时间矢量的序列来描述,“音高差”指与前一个音符频率的差值,以半音为单位;“时间”指该音符的开始时刻,其表达了旋律的节奏特征,在进行输入旋律片段的音符特征序列与整首乐曲的标准旋律的音符特征序列的模式匹配时,以检测到的整首乐曲旋律中的旋律分段为匹配移动单位来进行跨越式移动匹配的控制。本发明专利技术可用于卡拉OK系统歌曲点播,在教育方面可用于多媒体教学等。

【技术实现步骤摘要】

本专利技术涉及的是一种计算机应用
的方法,具体是一种。
技术介绍
基于哼唱输入的数字音乐检索方式简称哼唱检索(QBHQuery by Humming),它允许用户通过哼唱的形式来检索所需要的歌曲。用户只要能回忆起其中的片段旋律,并通过麦克风哼唱出来,QBH检索系统就能为用户找到其所需要的歌曲。在哼唱检索方面,由于用户凭借自己的记忆哼唱,再加之为非特定人哼唱,如何有效地对查询输入的旋律模式进行规整化,如何提高旋律匹配检索时的鲁棒性,以及如何实现面向大规模乐曲的检索高速化等,这些问题还没有得到很好的解决,许多关键技术都还有待于进一步深入研究。针对哼唱检索,国内外已提出的面向旋律匹配的技术包括有近似符号串比较算法,典型的如DP(Dynamic Programming)法和快速近似匹配法,音高轮廓几何匹配法和线性对齐近似旋律匹配算法LAN(Linear Alignment Mahcing)。在这些面向旋律匹配的方法中,旋律特征模式由音符特征序列来描述,而音符特征则一般由音符音高(或相对音高差)及音符长度(相对音符长度比)来表征;在对哼唱旋律片段与整首乐曲旋律之间进行非等长音符特征序列的模式匹配时,都是按照音符移动单位将输入旋律片段的音符序列沿着整首乐曲旋律的标准音符序列方向来进行逐一连续移动匹配的。经对现有技术的文献检索发现,刊登在《计算机研究与发展》2003年11月第40卷第11期,pp.1554-1560上的文章“线性对齐近似旋律匹配算法”,设当输入旋律片段沿着标准旋律的音符序列进行移动匹配并移动至第K个音符时,则该算法的核心步骤是(1)先将输入旋律片段的头部音符与标准旋律的第K个音符对齐,并从以第K个音符为起点的标准旋律中取出长度为输入旋律片段长度1.3倍长的音符序列段作为在该头部音符对齐下的标准旋律匹配段;(2)在时间轴上进行两旋律匹配段的线性对齐近似旋律匹配,即将输入旋律片段线性延展到与标准旋律的音符序列段相同的长度,并在一定的误差范围内对齐发生时刻接近的音符,计算旋律在节奏上的相似度,同时继续比较两段等长旋律在每个时间点上的音高差异,计算旋律在音高上的相似度,最后,综合考虑节奏和音高两方面的相似度,给出输入旋律片段与该标准旋律音符序列段的匹配得分。接着,输入旋律片段的头部音符将继续沿着标准旋律的音符序列向后移动一个音符,并重复上述基于核心步骤的旋律音符序列段的匹配,直至移动到最后为止。线性对齐近似旋律匹配算法具有节奏容错性好、匹配精度高的优点,但是由于这种基于音符移动单位的移动匹配方式响应时间较长,不适于用作大规模数字音乐库的检索匹配。因此,随着数字音乐库的规模日益增大,面向旋律匹配检索的响应速度和检索精度之间的矛盾将会日益突出,成为基于哼唱输入的数字音乐检索系统迈向实用化的一大瓶颈。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种高性能的,使得在保持对用户哼唱输入的容错性的同时,还能大幅度地提高对哼唱输入的匹配检索速度。本专利技术是通过以下技术方案实现的,本专利技术包括以下步骤(1)标准旋律特征读取和匹配检索控制步骤控制保存在旋律特征提取结果存储部的输入旋律的音符特征序列和保存在标准旋律特征库中的整首标准旋律的音符特征序列的读取及其匹配检索进程;(2)旋律分段位置检测和移动匹配控制步骤检测乐曲标准旋律中表征各旋律分段位置的特征音符,标准旋律中每两个特征音符间的音符特征序列即被定义为一个旋律特征分段;同时,控制输入旋律片段与乐曲标准旋律中的各旋律分段进行匹配时的跨越式移动方式,以及输出整首旋律匹配结果;(3)旋律分段匹配步骤进行输入旋律片段与乐曲标准旋律中某一旋律分段间的模式匹配,旋律分段的匹配结果将返回所述旋律分段位置检测和移动匹配控制步骤的控制进程; (4)旋律匹配检索结果显示步骤显示基于输入旋律片段的最终标准旋律匹配检索的结果,包括与前N位匹配的乐曲旋律特征曲线的比较视图及其相关乐曲的文本属性;所述的旋律特征由表征音符特征的(音高差、时间)矢量的序列来描述。其中,“音高差”指与前一个音符音高(基本频率)的差值,以适应不同旋律的起调和非特定人哼唱,并以半音(Semitone)为单位;“时间”指该音符的开始时刻,其表达了旋律的节奏特征。之所以选用音符起始时刻而非音符持续时间长度来作为表征旋律的节奏参数,是考虑到用户哼唱旋律时的节奏特征。用户在进行哼唱时,一般比较容易把握音符的出现时刻,而对各个音符的持续长度不怎么敏感或差异较大。而若仅仅采用音高信息而忽略时间这一节奏信息,随着音乐库规模的扩大,匹配成功率势必会随之下滑,将变得越来越低。另外,考虑到单以音高信息为参数匹配的局限性,本专利技术选择(音高差,时间)的矢量序列来描述旋律的特征。在进行输入旋律片段的音符特征序列与整首乐曲旋律的标准音符特征序列的模式匹配时,不是像传统的旋律移动匹配方式那样,即按照音符移动单位将输入旋律片段的音符序列沿着整首乐曲旋律的音符序列方向进行逐一连续移动匹配的控制,而是以检测到的整首乐曲旋律中的各旋律分段的特征音符位置为匹配移动单位来实现跨越式移动匹配的控制,从而为实现大幅度提高基于内容的音乐检索匹配速度提供了一种切实可性的解决方法。在本专利技术方法对音符数为N的输入哼唱旋律片段进行匹配检索时,同现有按音符单位逐一移动匹配法,如线性对齐近似旋律匹配法LAN相比较,针对某一音符数为M的乐曲旋律分段的匹配,采用LAN法需要|M-N|K+K/2次,即至少需要|M-N|K次,这里的K为采用LAN法时标准旋律分段对输入旋律片段音符序列长度的容错范围,其单位是音符数。而本专利技术所述方法,最多需2K次,其中,第1次为输入旋律片段头部与乐曲旋律分段头部对齐下的K次线性对齐匹配;而第2次是为了考虑用户哼唱片段在其起始部存在音符脱落现象,而将输入旋律片段的头部延乐曲旋律分段音符序列方向向后移动一个音符,即相当于将输入旋律片段头部与乐曲旋律分段头部的下一个音符对齐下的K次线性对齐匹配。由此可见,在针对乐曲旋律分段的匹配检索方面,本专利技术所述匹配法的速度至少要比LAN法快|M-N|/2倍;而针对某一音符数为R、并含有L个旋律分段的整首乐曲旋律的匹配,采用LAN法需要(R-N)K+K/2次,即至少要进行(R-N)K次匹配,而采用本专利技术所述方法则最多需要2LK次,故本专利技术所述匹配检索法的速度至少要比LAN法快|R-N|/2L倍。因此,由于引入了旋律分段检测并以旋律分段为移动匹配单位的概念,使得能通过检测表征分段特征的音符位置来实现大幅度的跨越式移动匹配,从而解决旋律检索高速化的问题。整首乐曲旋律的标准音符序列越长则越能体现本专利技术所述方法的优越性。本专利技术所述的旋律分段位置检测和移动匹配控制步骤,为避免过多的无意义的分段,先由消除可忽略静音段(等效于休止符)步骤搜索标准旋律的音符特征序列,若查找的音符长度小于某一预先设定的静音段长度阈值则将该音符加以删除,并将此段并入前一个音符的发音段。由于静音段长度阈值一般设得较低(如八分音符长度),所以这种删除在匹配检索时对结果几乎没有影响。在删除了可忽略的静音段后,则由特征音符的检测步骤根据音符类别特征及其音符长度特征来对标准旋律中的每个音符进行检测。特征音符类别分为定位类音符和休止类音符,对于这两类本文档来自技高网
...

【技术保护点】
一种数字音乐旋律的跨越式高速匹配方法,其特征在于,包括以下步骤:(1)标准旋律特征读取和匹配检索控制步骤:控制保存在旋律特征提取结果存储部的输入旋律的音符特征序列和保存在标准旋律特征库中的整首标准旋律的音符特征序列的读取及其匹配检索 进程;(2)旋律分段位置检测和移动匹配控制步骤:检测乐曲标准旋律中表征各旋律分段位置的特征音符,标准旋律中每两个特征音符间的音符特征序列即被定义为一个旋律特征分段;同时,用于控制输入旋律片段与乐曲标准旋律中的各旋律分段进行匹配时的跨 越式移动方式,以及输出整首旋律匹配结果;(3)旋律分段匹配步骤:输入旋律片段与乐曲标准旋律中某一旋律分段间的模式匹配,旋律分段的匹配结果将返回所述旋律分段位置检测和移动匹配控制步骤的控制进程;(4)旋律匹配检索结果显示步骤: 显示基于输入旋律片段的最终标准旋律匹配检索的结果,包括与前N位匹配的乐曲旋律特征曲线的比较视图及其相关乐曲的文本属性;旋律特征由表征音符特征的音高差、时间矢量的序列来描述,其中,“音高差”指与前一个音符频率的差值,以适应旋律的起调和 非特定人哼唱,并以半音为单位;“时间”指该音符的开始时刻,其表达了旋律的节奏特征,在进行输入旋律片段的音符特征序列与整首乐曲的标准旋律的音符特征序列的模式匹配时,以检测到的整首乐曲旋律中的旋律分段为匹配移动单位来进行跨越式移动匹配的控制。...

【技术特征摘要】
1.一种数字音乐旋律的跨越式高速匹配方法,其特征在于,包括以下步骤(1)标准旋律特征读取和匹配检索控制步骤控制保存在旋律特征提取结果存储部的输入旋律的音符特征序列和保存在标准旋律特征库中的整首标准旋律的音符特征序列的读取及其匹配检索进程;(2)旋律分段位置检测和移动匹配控制步骤检测乐曲标准旋律中表征各旋律分段位置的特征音符,标准旋律中每两个特征音符间的音符特征序列即被定义为一个旋律特征分段;同时,用于控制输入旋律片段与乐曲标准旋律中的各旋律分段进行匹配时的跨越式移动方式,以及输出整首旋律匹配结果;(3)旋律分段匹配步骤输入旋律片段与乐曲标准旋律中某一旋律分段间的模式匹配,旋律分段的匹配结果将返回所述旋律分段位置检测和移动匹配控制步骤的控制进程;(4)旋律匹配检索结果显示步骤显示基于输入旋律片段的最终标准旋律匹配检索的结果,包括与前N位匹配的乐曲旋律特征曲线的比较视图及其相关乐曲的文本属性;旋律特征由表征音符特征的音高差、时间矢量的序列来描述,其中,“音高差”指与前一个音符频率的差值,以适应旋律的起调和非特定人哼唱,并以半音为单位;“时间”指该音符的开始时刻,其表达了旋律的节奏特征,在进行输入旋律片段的音符特征序列与整首乐曲的标准旋律的音符特征序列的模式匹配时,以检测到的整首乐曲旋律中的旋律分段为匹配移动单位来进行跨越式移动匹配的控制。2.如权利要求1所述的数字音乐旋律的跨越式高速匹配方法,其特征是,所述的旋律分段位置检测和移动匹配控制步骤,分为消除可忽略静音段和检测旋律分段特征音符两个步骤进行,消除可忽略静音段步骤为搜索标准旋律的音符特征序列,查找音符长度小于某一预先设定的静音段长度阈值的音符并将其删除,然后将此段长度并入前一个音符的发音段,即将前一个音符长度延长一个已被决定要删除的静音段;检测旋律分段特征音符为基于音符类别特征及其音符长度特征来进行的,特征音符类别分为定位类特征和休止类特征音符,对于这两类音符均按其各自的音符长度是否超过事先所设定的阈值来确定该音符是否为分段特征音符,在整首标准旋律中每两个特征音符间的音符特征序列即被定义为一个旋律特征分段。3.如权利要求2所述的数字音乐旋律的跨越式高速匹配方法,其特征是,对于音符类音符的设定为其音符长度若大于或等于2分音符长时则将该音符确定为分段特征音符;对于休止符类音符的设定为其音符长度若大于或等于8分音符长时则将该类音符确定为分段特征音符。4.如权利要求1...

【专利技术属性】
技术研发人员:吴亚栋赵芳
申请(专利权)人:上海交通大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1