【技术实现步骤摘要】
语音切割点检测方法及其装置、介质和电子设备
本申请涉及语音处理
,特别涉及一种语音切割点检测方法及其装置、介质和电子设备。
技术介绍
随着语音交互技术的发展,机器人客服、带有语音交互功能的家居设备、带有语音助手的电子设备等在生活中的应用越来越广泛,对语音识别的快慢、准确度以及响应速度等要求越来越高。在语音识别中,语音端点检测技术(VoiceActivityDetection,VAD)是一项非常重要的技术,它的目的是在连续语音信号中找到一段语音的开始点和终止点。长语音识别一般会利用这项技术,将音频切割成短音频进行识别,因此切割点直接影响了最终的语音识别效果。目前切割点方法是,取长语音中的静音帧,若静音帧的时长大于预定阈值时,将该静音帧中的某一点确定为切割点。但是这种方法存在的问题是,当用户的语速变慢时,可能存在一句话还没说完就被识别为切割点,导致最终语音识别性能下降。
技术实现思路
本申请实施例提供了一种语音切割点检测方法及其装置、介质和电子设备,在语音识别电子设备中引入语速识别,通过识别语速来进一步确定语音 ...
【技术保护点】
1.一种语音切割点检测方法,其特征在于,所述方法包括:/n获取待检测语音信号;/n确定所述待检测语音信号中的静音片段集;/n确定所述静音片段集中静音片段的时长大于预设时长阈值的静音片段子集;/n确定所述待检测语音信号中所述静音片段子集中每个静音片段对应的第一待检测语音片段和第二待检测语音片段,其中,所述第一待检测语音片段和所述第二待检测语音片段一一对应,每个所述第一待检测语音片段和每个所述第二待检测语音片段相同的部分包含至少部分相同的静音片段;/n确定每个第一待检测语音片段的第一语速第二待检测语音片段的第二语速;/n根据每个所述第一语速和每个所述第二语速从所述静音片段子集中 ...
【技术特征摘要】
1.一种语音切割点检测方法,其特征在于,所述方法包括:
获取待检测语音信号;
确定所述待检测语音信号中的静音片段集;
确定所述静音片段集中静音片段的时长大于预设时长阈值的静音片段子集;
确定所述待检测语音信号中所述静音片段子集中每个静音片段对应的第一待检测语音片段和第二待检测语音片段,其中,所述第一待检测语音片段和所述第二待检测语音片段一一对应,每个所述第一待检测语音片段和每个所述第二待检测语音片段相同的部分包含至少部分相同的静音片段;
确定每个第一待检测语音片段的第一语速第二待检测语音片段的第二语速;
根据每个所述第一语速和每个所述第二语速从所述静音片段子集中确定目标静音片段子集;
确定所述目标静音片段子集中的语音切割点集。
2.根据权利要求1所述的语音切割点检测方法,其特征在于,
所述第一待检测语音片段包括所述静音片段子集中的至少部分静音片段;
或者;
所述第一待检测语音片段包括所述静音片段子集中的静音片段和该静音片段两端相邻的非静音片段。
3.根据权利要求1所述的语音切割点检测方法,其特征在于,所述待检测语音信号包括首端点,尾端点,所述第二待检测语音片段包括:所述静音片段中的第一预设点到所述首端点之间的片段和所述静音片段中的第一预设点到所述语音切割点之间的片段。
4.根据权利要求3所述的语音切割点检测方法,其特征在于,所述第一预设点为所述静音片段的时长中点。
5.根据权利要求1所述的语音切割点检测方法,其特征在于,所述根据每个所述第一语速和每个所述第二语速从所述静音片段子集中确定目标静音片段子集,包括:
若所述第一语速与所述第二语速的比值小于预设比值,则确定所述第一待检测语音片段和所述第二待检测语音片段对应的所述静音片段子集的静音片段为目标静音片段。
6.根据权利要求1所述的语音切割点检测方法,其特征在于,所...
【专利技术属性】
技术研发人员:吕安旗,郑达,李索恒,张志齐,
申请(专利权)人:上海依图信息技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。