语速识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:32896279 阅读:43 留言:0更新日期:2022-04-07 11:44
本申请公开了一种语速识别方法、装置、设备及可读存储介质,涉及机器学习领域。该方法包括:获取语音数据,语音数据中包括至少两帧语音帧;提取语音帧的基音周期状态;建立与基音周期状态对应的直方统计图;基于直方统计图进行语速预测,得到语速识别结果。通过提取语音数据中语音帧的基音周期状态,并根据基音周期状态的连续分布情况对语音数据的语速进行识别,而无需针对语音数据进行语音识别得到文本内容后,根据文本内容确定语速,提高了语速识别的效率,且由于语音识别所需要进行的计算量较大,故通过基音周期状态进行语速识别能够减少设备的计算量,减少对设备计算量的占用。减少对设备计算量的占用。减少对设备计算量的占用。

【技术实现步骤摘要】
语速识别方法、装置、设备及可读存储介质


[0001]本申请实施例涉及机器学习领域,特别涉及一种语速识别方法、装置、设 备及可读存储介质。

技术介绍

[0002]语速是人类表达语言符号时在单位时间内所呈现词汇的速度,通常,语速 与人类特定的说话习惯、心情以及环境相关,语速过快会导致收听者的收听效 果较差,而语速过慢会导致收听者需要耗费较多时间进行收听。
[0003]相关技术中,基于自动语音识别技术(Automatic Speech Recognition,ASR) 技术对指定语音信号进行语速识别,也即,将指定语音信号通过ASR技术识别 得到文本内容,并确定文本内容对应指定语音信号的语音时长,从而以语音时 长和文本内容的内容长度确定语速。
[0004]然而,该过程中ASR技术的识别准确率受说话环境噪声的影响较大,且不 同人的发音习惯不同,对识别率也存在一定的影响,导致在文本内容识别结果 错误的情况下,语速计算结果的准确率也较低。

技术实现思路

[0005]本申请实施例提供了一种语速识别方法、装置、设备及可读存储介质,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语速识别方法,其特征在于,所述方法包括:获取语音数据,所述语音数据中包括至少两帧语音帧;提取所述语音帧的基音周期状态,所述基音周期状态用于指示至少两帧语音帧之间的基音周期变化情况;建立与所述基音周期状态对应的直方统计图,所述直方统计图用于指示在至少两个状态区间中所述基音周期状态的分布情况,其中,所述状态区间为针对所述基音周期状态的连续分布情况划分的区间,所述状态区间以所述基音周期状态的连续分布长度为划分条件;基于所述直方统计图中所述基音周期状态的分布情况进行语速预测,得到所述语音数据对应的语速识别结果。2.根据权利要求1所述的方法,其特征在于,所述建立与所述基音周期状态对应的直方统计图,包括:获取所述基音周期状态的至少一个连续累计值,所述连续累计值用于指示符合所述基音周期状态的语音帧在所述语音数据中的连续分布情况;基于所述连续累计值建立与所述基音周期状态对应的直方统计图。3.根据权利要求2所述的方法,其特征在于,所述基于所述连续累计值建立与所述基音周期状态对应的直方统计图,包括:确定所述直方统计图所对应的状态区间分布,所述状态区间分布用于对所述连续累计值进行分布情况的区分;将所述基音周期状态的所述连续累计值映射至所述状态区间分布中,得到所述基音周期状态对应的直方统计图。4.根据权利要求2所述的方法,其特征在于,所述基音周期状态中包括周期升状态、周期平状态和周期降状态中的至少一种;所述获取所述基音周期状态的连续累计值,包括:响应于所述基音周期状态中包括所述周期升状态,获取所述周期升状态的至少一个第一连续累计值;响应于所述基音周期状态中包括所述周期平状态,获取所述周期平状态的至少一个第二连续累计值;响应于所述基音周期状态中包括所述周期降状态,获取所述周期降状态的至少一个第三连续累计值。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:响应于第i+1帧语音帧的基音周期值大于第i帧语音帧的基音周期值,且差异达到预设周期值,确定所述第i+1帧语音帧对应的基音周期状态为周期升状态,i为正整数;响应于第i+1帧语音帧的基音周期值与第i帧语音帧的基音周期值的差异小于所述预设周期值,确定所述第i+1帧语音帧对应的基音周期状态为周期平状态;响应于第i+1帧语音帧的基音周期值小于第i帧语音帧的基音周期值,且差异达到预设周期值,确定所述第i+1帧语音帧对应的基音周期状态为周期降状态。6.根据权利要求2至5任一所述的方法,其特征在于,所述基于所述直方统计图中所述基音周期状态的分布情况进行语速预测,得到所述语音数据对应的语速识别结果,包括:
获取所述直方统计图中与所述至少两个状态区间分别对应的连续累计值数量;通过语速识别模型对所述至少两个状态区间分别对应的连续累计值数量进行分析,得到所述语音数据对应的语速识别结果。...

【专利技术属性】
技术研发人员:梁俊斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1