一种演唱的评分系统和方法技术方案

技术编号:3048253 阅读:398 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种演唱的评分系统和方法,通过对演唱语音信号进行音符切分、量化,搜索歌曲中的对应演唱歌曲片段,计算多种距离,并综合得到演唱评分。通过应用本发明专利技术,使得只要演唱数据在旋律上与原声有较好的一致性,就可以得到较准确的评价得分,同时,本发明专利技术的评价系统无需演唱与伴奏完全同步,而是利用定位技术进行匹配,使得本发明专利技术可以对演唱者的演唱片断进行评价,不依赖于同步信息的输入或要求演唱者从歌曲的开始唱到结尾。

【技术实现步骤摘要】

本专利技术涉及语音信号处理
,更具体地说,本专利技术涉及一种演 唱的评分系统和方法。
技术介绍
旋律是歌曲最重要的特征,能够代表歌曲大部分的信息量。旋律由各 个音符组成,通过音符的前后连接顺序与变化的节奏快慢来体现。更具体 地说,旋律可以视为由多个具有不同属性(通常为音高和音长)的音符连 接组成的音符序列。音高,是指音符的基音频率的高低。不同的音符是指具有不同音高的音乐基本单位。音高可以以赫兹(Hz)为单位来衡量,但通常所用的衡量 单位是半音程(semitone),特别是在一些用记录的旋律来代表歌曲的文 件格式中,半音程更为常见,例如MIDI文件。音长,是指音符持续的时间长度, 一般以秒(s )或者亳秒(ms )为单位。对于演唱的评价方法,目前常见的是卡拉OK的评分系统,这种评分系统计算演唱者的演唱和数据库中原声(或者可以视为原声的数据)两者之 间一些简单物理特征的差异,例如比较演唱信号与目标信号采样点间距离, 比较声平曲线间的距离,比^&频序列之间的距离等差异,将这些差异作 为评价标准。这种评分系统仅在简单的物理特征层面上进行比对,当用户的演唱和数据库中的原声在这些物理特征上有较大差异,但从旋律角度上却又比较匹配时,卡拉OK的评分系统就会表现很不稳定。所以,基于简单 物理特征差异的评分方法并不适合于演唱的声乐评价。另外,现有的评分方法是针对演唱内容与伴奏内容完全同步(或假设 完全同步)的情况,如果实际情况的演唱与伴奏不同步,就会出现评分很 不准确的问题。基于这样的同步假设,现有的评分方法都只能对于整首歌 曲给出一个演唱得分,对于演唱片段却不能给出实际的、准确的评分。
技术实现思路
为克服现有技术中演唱评分不准确并且需要演唱内容与伴奏内容完全同步的缺陷,;^专利技术提供了。本专利技术的一个方面,提供一种演唱的评分系统,包括输入模块,任意选取需要打分的演唱语音信号;评分模块,比较演唱语音信号在旋律上与目标歌曲的差异,获得对演 唱语音信号与目标歌曲相似度评价的得分。所述的评分系统,还可以包括音符切分量化模块,对所述输入模块选取的所述演唱语音信号进行音 符切分并量化;定位模块,基于音符切分量化模块中量化后的所述音符,建立演唱语 音信号的音高差序列,在目标歌曲库中搜索、定位演唱语音数据的对应段;距离计算模块,将定位模块中得到的所述对应段与演唱语音数据的音 高差序列进行多种距离计算,所述多种距离是指演唱语音信号与目标歌曲 之间在旋律上的距离,包括音高序列距离,音长序列距离,整体匹配距离。其中,所述定位模块还可以包括根据所述演唱语音信号的音高差序列,以及从目标歌曲数据库中取得目标歌曲的音高差序列,应用动态时间规整(DTW)算法,实现演唱语音信号的准确定位,同时得到演唱语音信号 和目标歌曲之间具体的匹配关系。其中,所述应用动态时间规整算法优选地包括利用滑动窗截取目标 歌曲音高差序列,将其与演唱语音信号的音高差序列进行DTW比对,得到 代表不相似度的代价值,取代价值最小的滑动窗位置对应的目标歌曲片断 作为演唱的匹配段。其中,所述滑动窗的大小不小于演唱音符序列的长度,优选的是,一 般取2倍于演唱音符序列长度作为滑动窗大小。本专利技术的另一方面,提供一种演唱的评分方法,包括步骤IO)、任意选取需要打分的演唱语音信号;步骤20)、比较演唱语音信号在旋律上与目标歌曲的差异,获得对演 唱语音信号与目标歌曲相似度评价的评分。其中,步骤20)还可以包括 '步骤210)、对步骤IO)中选取的所述演唱语音信号进行音符切分并量化;步骤220 )、基于步骤210)中量化后的所述音符,建立演唱语音信号 的音高差序列,在目标歌曲库中搜索、定位演唱语音数据的对应段;步骤230 )、将步骤220)中得到的所述对应段与演唱语音数据的音高 差序列进行多种距离计算,所述的多种距离是指演唱语音信号与目标歌曲 之间在旋律上的距离,包括音高序列距离,音长序列距离,整体匹配距离;步骤240 )、将步骤230 )中计算得到的所述多种距离进行综合,得到 评分。其中,步骤220 )进一步包括才艮据所述演唱语音信号的音高差序列,以及从目标歌曲数据库中取得目标歌曲的音高差序列,应用动态时间规整(DTW)算法,实现演唱语音信号的准确定位,同时得到演唱语音信号和目 标歌曲之间具体的匹配关系。其中,所述应用动态时间规整算法优选地包括利用滑动窗截取目标 歌曲音高差序列,将其与演唱语音信号的音高差序列进行DTW比对,得到 代表不相似度的代价值,取代价值最小的滑动窗位置对应的目标歌曲片断 作为演唱的匹配段。通过应用本专利技术,使得演唱语音信号相对于目标歌曲有较好的一致性, 并可以得到准确的评分,同时,本专利技术的评价系统无需演唱与伴奏完全同 步,而是利用定位技术进行匹配,使得本专利技术可以对演唱者的演唱片断进 行评价,不依赖于同步信息的输入或要求演唱者从歌曲的开始唱到结尾。附图说明图l是本专利技术一个实施例的演唱评分系统组成图2是本专利技术一个实施例的演唱评分流程图3是本专利技术实施例用到的动态时间规整(DTW)的路径约束图。具体实施例方式下面结合附图及具体实施方式对本专利技术做进一步地描述。 如图1所示,在本专利技术的一个优选实施例中,包括输入模块和评分模 块,输入模块任意选取需要打分的演唱语音信号;评分模块主要通过比较 演唱语音信号在旋律上与目标歌曲的差异,来获得对演唱语音信号与目标 歌曲相似度评价的评分。评分模块进一步包括,音符切分量化模块、定位 模块和距离计算模块。同时结合图2所示的本实施例的演唱评分流程图。首先在输入模块中,输入演唱的语音数据,可以是完M曲的语音数 据,也可以^1歌曲的呼唱语音片段。然后,在音符切分量化模块中,对该输入的语音数据进行音符切分。 在本实施例中,采用的语音数据格式为16K采样率,每个采样点用16比特 数(Bit)来表示,实际应用中,本专利技术不限于只处理1616Bit数据,可 以釆用任何格式的采样率。使用基于突出度的音符切分方法(参见中国发 明专利申请, 一种基于能量的音符切分方法,公开号为CN1963919 )进行 音符切分。基于突出度的音符切分方式是一种简单可靠的基于能量的音符 切分方法,通过谐波和能量突出度曲线,得到其有效极值点,从而找到音 符切分的位置。对于音符的切分方法,也可以采用本领域的其他音符切分 方法。在音符切分点确定的情况下,进行音符音高和音长的量化,在量化过 程中去掉因为呼吸气引起的不确定语音段,增加了音符序列的有效性。音 高量化单位为半音程(semitone),音长量化单位为亳秒(ms)。具体量 化方式为音高的量化首先由音符切分点确定音符的起始位置和终止位置,假 设为?;,7;;提取基频(基频提取方法的一个实施例可以参见文献1、 Dik Hermes,谐波和基频检测方法,美国声学学报,1988年1月,第257页-第 264页;2、李明,温源,俞铁城,基于声调特征提取的高性能基频提取方 法,国际汉语计算会汉,2001年,笫162页-第166页),然后在t; t;范围内确定基频变化率较小的稳定部分,将此稳定部分的基频的平均值作为 该音符的基频值/。,然后再量化到半音程单位上,具体公式如下iV(/0) = 69 + 121og24,w(/j就是量化后的音高值本文档来自技高网
...

【技术保护点】
一种演唱的评分系统,包括: 输入模块,任意选取需要打分的演唱语音信号; 评分模块,比较演唱语音信号在旋律上与目标歌曲的差异,获得对演唱语音信号与目标歌曲相似度评价的得分。

【技术特征摘要】
1、一种演唱的评分系统,包括输入模块,任意选取需要打分的演唱语音信号;评分模块,比较演唱语音信号在旋律上与目标歌曲的差异,获得对演唱语音信号与目标歌曲相似度评价的得分。2、 权利要求l的评分系统,还可以包括音符切分量化模块,对所述输入模块选取的所述演唱语音信号进行音 符切分并量化;定位模块,基于音符切分量化模块中量化后的所述音符,建立演唱语 音信号的音高差序列,在目标歌曲库中搜索、定位演唱语音数据的对应段;距离计算模块,将定位模块中得到的所述对应段与演唱语音数据的音 高差序列进行多种距离计算,所述多种距离是指演唱语音信号与目标歌曲 之间在旋律上的距离,包括音高序列距离,音长序列距离,整体匹配距离。3、 权利要求2的评分系统,其中,所述定位模块还可以包括根据所 述演唱语音信号的音高差序列,以及从目标歌曲数据库中取得目标歌曲的 音高差序列,应用动态时间规整(DTW)算法,实现演唱语音信号的准确定 位,同时得到演唱语音信号和目标歌曲之间具体的匹配关系。4、 权利要求3的评分系统,其中,所述应用动态时间规整算法优选地 包括利用滑动窗截取目标歌曲音高差序列,将其与演唱语音信号的音高 差序列进行DTW比对,得到代表不相似度的代价值,取代价值最小的滑动 窗位置对应的目标歌曲片断作为演唱的匹配段。5、 权利要求4的评分系统,其中,所述滑动窗的大小不小于演唱音符 序列的长度,优选的是, 一般取2倍于演唱音符序列长度作为滑动窗大小。6、 一种演唱的评分方法,包括步骤IO)、任...

【专利技术属性】
技术研发人员:颜永红李明曹川刘建潘接林
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1