【技术实现步骤摘要】
一种颤音识别的方法与装置
本专利技术涉及语音处理领域,尤其涉及一种颤音识别的方法与装置。
技术介绍
在歌声音调提取时,我们发现在演唱时某一个字的音调并不是固定值,而是随着时间以一定的音调值为中心波动变化。这是由于演唱者在演唱过程中受歌曲情绪的感染加上歌唱的技巧所表现出来的颤音。颤音的识别可应用于演唱评分中对颤音的打分基准,丰富演唱评分功能。现有的颤音提取方法主要是通过截取待检测声音片段,对声音片段截去头尾固定长度,对中间数据进行分帧,并计算每一帧的音调,得到的音调序列分别以不同的周期长度分成几个片段,对相邻片段计算音调距离,音调距离最小的周期长度若小于设定的阀值,测判定为颤音。该方法针对特定的声音数据有一定的颤音检测效果,但在待检测声音片段与实际需要检测颤音的字的时间坐标存在一定误差时很容易造成颤音检测错误或者漏检,并且字的颤音位置并不固定存在于待检测声音片段中间位置,也可能存在于一段固定音高之后,对于上述情况,现有方法不能很好的检测颤音。目前,针对上述问题,还没有提出一种能够有效解决问题的技术方案。 ...
【技术保护点】
1.一种颤音识别的方法,其特征在于,包括:/n获取待检测音频数据,对所述待检测音频数据根据预设分帧滑动窗长度和步进进行分帧,识别并删除清音帧和低音强尾音帧后,得到有效音频检测片段;/n判断所述有效音频检测片段长度是否满足预设颤音最小时长要求;/n当满足所述预设颤音最小时长要求时,计算所述有效音频检测片段所有帧的音调,得到音调序列;/n对所述音调序列根据预设音调滑动窗长度和步进进行分组,计算每一分组的音调标准差和目标周期,获取所有分组对应的音调标准差序列和目标周期序列;/n删除音调标准差大于预设标准差阈值以及目标周期大于预设颤音周期最小值或小于预设颤音周期最大值的分组;/n计 ...
【技术特征摘要】
1.一种颤音识别的方法,其特征在于,包括:
获取待检测音频数据,对所述待检测音频数据根据预设分帧滑动窗长度和步进进行分帧,识别并删除清音帧和低音强尾音帧后,得到有效音频检测片段;
判断所述有效音频检测片段长度是否满足预设颤音最小时长要求;
当满足所述预设颤音最小时长要求时,计算所述有效音频检测片段所有帧的音调,得到音调序列;
对所述音调序列根据预设音调滑动窗长度和步进进行分组,计算每一分组的音调标准差和目标周期,获取所有分组对应的音调标准差序列和目标周期序列;
删除音调标准差大于预设标准差阈值以及目标周期大于预设颤音周期最小值或小于预设颤音周期最大值的分组;
计算删除后剩余分组数与删除前总组数的比值,若比值大于一预设参数,将待检测音频数据判定为颤音信号。
2.根据权利要求1所述的方法,其特征在于,所述计算每一个分组的目标周期的方法为:
根据至少一个预设周期值将每一分组的音调划分成至少两个音调序列分段;
针对每一个预设的周期值,计算所述音调序列中至少两个相邻音调序列分段之间的音调距离值,获取计算所得的音调距离值的平均值作为所述预设周期值对应的音调距离;
获取所有与所述预设周期值对应的音调距离,构成音调距离序列,将所述音调距离序列中最小的音调距离作为所述分组对应的目标周期。
3.根据权利要求1所述的方法,其特征在于,
在待检测音频数据的前半部分,将低于预设过零率下限值的数据帧识别为清音帧;
在待检测音频数据的后半部分,将帧电平小于预设帧电平下限的数据帧识别为低音强尾音帧。
4.根据权利要求1所述的方法,其特征在于,计算所述有效音频检测片段所有帧的音调,得到音调序列后,还包括:
对所述音调序列做滤波处理,将滤波后的音调序列平均音调作为所述有效检测音频片段的音频信号音调。
5.根据权利要求4所述的方法,其特征在于,当所述待检测音频数据判定为非颤音信号时,输出非颤音信号判定结果的同时,将所述音频信号音调作为待检测音频数据音调进行输出。
6.一种颤音识别的装置,其特征在于,包括:
截取模块,用于获取待检测音频数据,对所述待检测音频数据根据预设分帧滑动窗长度和步进进行分帧...
【专利技术属性】
技术研发人员:宋冬梅,武剑,王宏,
申请(专利权)人:北京雷石天地电子技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。