一种唱歌评测方法及系统技术方案

技术编号:14053852 阅读:88 留言:0更新日期:2016-11-26 09:54
本发明专利技术公开了一种唱歌评测方法及系统,属于语音信号处理技术领域。该唱歌评测方法包括:获取用户演唱歌曲的录音数据;在所述录音数据的起始端点和结束端点之间的不同位置开始依次截取多段设定长度的录音数据,得到多个数据段;逐一计算每个所述数据段与歌曲的标准音频数据的音高差值,并将音高差值最小的数据段的起始端点作为检测起始点;计算从所述检测起始点开始的数据段与所述歌曲的标准音频数据的相似度得分;将所述相似度得分作为评测结果。该唱歌评测方法及系统,计算过程简单、评分准确,能够满足实时打分的应用需求。

【技术实现步骤摘要】

本专利技术涉及语音信号处理
,特别涉及一种唱歌评测方法及系统
技术介绍
在卡拉OK唱歌评测系统中,为评价用户唱歌水平的高低,通常先要预设歌曲的标准音高,形成一条关于时间的标准音高曲线。在获取用户演唱歌曲的录音数据的音高曲线后,将其与标准音高曲线进行比较,通过计算其与标准音高曲线的面积误差来对用户唱歌水平进行评测,用户演唱录音数据的音高曲线与标准音高曲线越接近(也即,曲线面积误差越小),则表明用户唱歌水平越高。为了增强用户体验,唱歌评测系统通常会采用实时打分模式,使用户在演唱过程中能够即时获取反馈结果。在实时打分模式下,用户每演唱一句,系统就要在较短的响应时间内给出该句的评分结果。该模式在用户演唱歌曲的录音数据与标准音高数据的起始时间点不一致的情况下,例如,录音设备本身的缺陷、数据传输的网络问题等,造成用户录音数据的延迟或偏差,容易导致评分过低,从而无法反映用户真实的唱歌水平。现有技术中,通常采用动态时间规整(Dynamic Time Warping,DTW)算法,来解决用户录音数据与标准音高数据之间因时间不对应而引起的评分误差问题。DTW算法是把时间规整和距离测度计算结合在一起的非线性规整技术,通过寻找距离测度最小值的时间规整方式来确定用户录音信号(待测信号)与标准信号(模板信号)序列的时间对应关系。具体而言,在衡量两个时间长度相同的信号序列(也即“模板信号”和“待测信号”)的相似度时,通常采用欧氏距离计算方法找到合适的时间规整函数,使得待测信号按照这个
函数规整之后,与模板信号的距离最小。如果这两个序列的时间长度不一致,需要先将待测信号拉长或缩短,即在时间轴上进行扭曲,然后与模板信号一一对应之后,再进行欧氏距离计算。假设模板信号和待测信号的长度分别为m、n,首先构造一个m*n的矩阵,矩阵元素(i,j)表示模板信号的第i个点与待测信号的第j个点之间的欧氏距离。时间规整函数实际上就是一条从(1,1)到(m,n)的路径,路径上的点(i,j)表示将待测信号的第j个点与模板信号的第i个点对齐。对于每条路径,累加其通过的所有点的值得到一个累积距离,所有路径中累积距离最小的那条路径就对应了所要求的时间规整函数。通过欧氏距离计算求得时间规整函数,能够在一定程度上解决用户录音数据与标准音高数据之间因时间不对应而引起的评分误差问题,但由于计算量大、计算过程复杂,无法满足实时打分的应用需求。
技术实现思路
本专利技术实施例提供了一种唱歌评测方法及系统,计算过程简单、评分准确,能够满足实时打分的应用需求。本专利技术实施例提供的技术方案如下:一方面,提供了一种唱歌评测方法,包括:获取用户演唱歌曲的录音数据;在所述录音数据的起始端点和结束端点之间的不同位置开始依次截取多段设定长度的录音数据,得到多个数据段;逐一计算每个所述数据段与歌曲的标准音频数据的音高差值,并将音高差值最小的数据段的起始端点作为检测起始点;计算从所述检测起始点开始的数据段与所述歌曲的标准音频数据的相似度得分;将所述相似度得分作为评测结果。优选地,所述计算所述数据段与歌曲的标准音频数据的音高差值,包括:步骤201:提取所述数据段的稳定基频;步骤202:计算所述数据段的稳定基频与所述标准音频数据的起调偏差;步骤203:根据所述起调偏差对所述稳定基频中的半频和倍频进行规整处理;步骤204:迭代执行上述步骤202至步骤203,直至计算次数达到预设次数或者所述稳定基频发生收敛;步骤205:将所述计算次数达到预设次数或者所述稳定基频发生收敛时,所述数据段的稳定基频与所述标准音频数据的起调偏差作为所述音高差值。优选地,在所述计算从所述检测起始点开始的数据段与所述歌曲的标准音频数据的相似度得分之前,所述方法还包括:对所述音高差值小于预设阈值的数据段进行平滑处理及去除奇点处理。优选地,所述计算所述数据段的稳定基频与所述标准音频数据的起调偏差,包括:计算所述数据段的稳定基频与所述标准音频数据的音高均值差;在包含所述音高均值差的区间内查找与所述稳定基频之和最接近于所述标准音高数据的音高偏差值,将所述音高偏差值作为所述起调偏差。优选地,所述在所述录音数据的起始端点和结束端点之间的不同位置开始依次截取多段设定长度的录音数据,包括:确定截取起始位置;从所述截取起始位置开始截取设定长度的录音数据;以预设步长多次调整所述截取起始位置,分别从每次调整后的截取起始位置开始截取多段设定长度的录音数据。另一方面,提供了一种唱歌评测系统,包括:获取模块,用于获取用户演唱歌曲的录音数据;截取模块,用于在所述录音数据的起始端点和结束端点之间的不同位置开始依次截取多段设定长度的录音数据,得到多个数据段;第一计算模块,用于逐一计算每个所述数据段与歌曲的标准音频数据的音高差值;检测起始点确定模块,用于从所述第一计算模块计算得到的音高差值中选取音高差值最小的数据段的起始端点作为检测起始点;第二计算模块,用于计算从所述检测起始点开始的数据段与所述歌曲的标
准音频数据的相似度得分,并将所述相似度得分作为评测结果。优选地,所述第一计算模块包括:提取单元,用于提取所述数据段的稳定基频;计算单元,用于通过迭代方式计算所述数据段的稳定基频与所述标准音频数据的起调偏差,并将所述计算次数达到预设次数或者所述稳定基频发生收敛时,所述数据段的稳定基频与所述标准音频数据的起调偏差作为所述音高差值;规整单元,用于根据所述计算单元计算得到的起调偏差对所述稳定基频中的半频和倍频进行规整处理,并将规整后的稳定基频输出给所述计算单元,以使所述计算单元进行下一次迭代计算。优选地,所述系统还包括:平滑去奇模块,用于在所述第二计算模块计算从所述检测起始点开始的数据段与所述歌曲的标准音频数据的相似度得分之前,对所述音高差值小于预设阈值的数据段进行平滑处理及去除奇点处理。优选地,所述计算单元包括:均值差计算单元,用于计算所述数据段的稳定基频与所述标准音频数据的音高均值差;查找单元,用于在包含所述音高均值差的区间内查找与所述稳定基频之和最接近于所述标准音高数据的音高偏差值,将所述音高偏差值作为所述起调偏差。优选地,所述截取模块包括:确定单元,用于确定截取起始位置;截取单元,用于从所述截取起始位置开始截取设定长度的录音数据;调整单元,用于以预设步长多次调整所述截取起始位置;所述截取单元,还用于在所述调整单元每次对所述截取起始位置进行调整后,分别从每次调整后的截取起始位置开始截取多段设定长度的录音数据。本专利技术实施例提供的唱歌评测方法及系统,在用户演唱歌曲的录音数据的起始端点和结束端点之间的不同位置开始截取多段设定长度的录音数据,得到多个数据段,计算每个数据段与歌曲的标准音频数据的音高差值,将音高差值
最小的数据段的起始端点作为检测起始点,计算从检测起始点开始的数据段与歌曲的标准音频数据的相似度得分,将该相似度得分作为评测结果。该唱歌评测方法及系统,通过将音高差值最小的数据段的起始端点作为检测起始点,能够保证用户演唱歌曲的录音数据与标准音高数据之间的时间差最小,从而在用户演唱歌曲的录音数据与标准音高数据之间时间不对应的情况下,能够准确进行评分,此外,由于计算过程简单,能够满足实时打分的应用需求,具有很强的实用性。附图说明为本文档来自技高网
...
一种唱歌评测方法及系统

【技术保护点】
一种唱歌评测方法,其特征在于,包括:获取用户演唱歌曲的录音数据;在所述录音数据的起始端点和结束端点之间的不同位置开始依次截取多段设定长度的录音数据,得到多个数据段;逐一计算每个所述数据段与歌曲的标准音频数据的音高差值,并将音高差值最小的数据段的起始端点作为检测起始点;计算从所述检测起始点开始的数据段与所述歌曲的标准音频数据的相似度得分;将所述相似度得分作为评测结果。

【技术特征摘要】
1.一种唱歌评测方法,其特征在于,包括:获取用户演唱歌曲的录音数据;在所述录音数据的起始端点和结束端点之间的不同位置开始依次截取多段设定长度的录音数据,得到多个数据段;逐一计算每个所述数据段与歌曲的标准音频数据的音高差值,并将音高差值最小的数据段的起始端点作为检测起始点;计算从所述检测起始点开始的数据段与所述歌曲的标准音频数据的相似度得分;将所述相似度得分作为评测结果。2.根据权利要求1所述的唱歌评测方法,其特征在于,所述计算所述数据段与歌曲的标准音频数据的音高差值,包括:步骤201:提取所述数据段的稳定基频;步骤202:计算所述数据段的稳定基频与所述标准音频数据的起调偏差;步骤203:根据所述起调偏差对所述稳定基频中的半频和倍频进行规整处理;步骤204:迭代执行上述步骤202至步骤203,直至计算次数达到预设次数或者所述稳定基频发生收敛;步骤205:将所述计算次数达到预设次数或者所述稳定基频发生收敛时,所述数据段的稳定基频与所述标准音频数据的起调偏差作为所述音高差值。3.根据权利要求2所述的唱歌评测方法,其特征在于,在所述计算从所述检测起始点开始的数据段与所述歌曲的标准音频数据的相似度得分之前,所述方法还包括:对所述音高差值小于预设阈值的数据段进行平滑处理及去除奇点处理。4.根据权利要求3所述的唱歌评测方法,其特征在于,所述计算所述数据段的稳定基频与所述标准音频数据的起调偏差,包括:计算所述数据段的稳定基频与所述标准音频数据的音高均值差;在包含所述音高均值差的区间内查找与所述稳定基频之和最接近于所述
\t标准音高数据的音高偏差值,将所述音高偏差值作为所述起调偏差。5.根据权利要求1至4任一项所述的唱歌评测方法,其特征在于,所述在所述录音数据的起始端点和结束端点之间的不同位置开始依次截取多段设定长度的录音数据,包括:确定截取起始位置;从所述截取起始位置开始截取设定长度的录音数据;以预设步长多次调整所述截取起始位置,分别从每次调整后的截取起始位置开始截取多段设定长度的录音数据。6.一种唱歌评测系统,其特征在于,包括:获取模块,用于获取用户演唱歌曲...

【专利技术属性】
技术研发人员:李啸蒋成林梅林海
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1