语音播报的打断检测方法、装置、存储介质及电子设备制造方法及图纸

技术编号：32859896 阅读：15 留言：0更新日期：2022-03-30 19:37

本发明专利技术公开了一种语音播报的打断检测方法、装置、存储介质及电子设备。其中，该方法包括：在智能客服的播报过程中，采用声纹识别算法检测音频数据中的说话人声片段；对上述说话人声片段进行说话人特征提取，得到说话人语音特征；对上述说话人语音特征和目标人语音特征进行相似度匹配；根据上述说话人语音特征和上述目标人语音特征之间的相似度与设定阈值的比较结果，确定是否中断上述播报过程。本发明专利技术解决了由于语音播报过程中无关说话人的语音干扰，造成的误打断率高、用户体验感差的技术问题。问题。问题。

全部详细技术资料下载

【技术实现步骤摘要】
语音播报的打断检测方法、装置、存储介质及电子设备

[0001]本专利技术涉及智能语音
，具体而言，涉及一种语音播报的打断检测方法、装置、存储介质及电子设备。

技术介绍

[0002]随着语音技术的发展，智能语音在生产生活中的应用越来越广泛，同时由于实际应用过程的复杂性，给语音技术也带来了严峻挑战。
[0003]传统的智能客服系统打断方法是基于有效音检测(VAD)技术，在语音播报过程中，检测到有效说话声则播报中断。如果用户在使用过程中背景说话人声较大，存在无关说话人的干扰，则很容易导致智能语音播报中断，语音播报的误打断率较高，用户体验感差。
[0004]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种语音播报的打断检测方法、装置、存储介质及电子设备，以至少解决由于语音播报过程中无关说话人的语音干扰，造成的误打断率高、用户体验感差的技术问题。
[0006]根据本专利技术实施例的一个方面，提供了一种语音播报的打断检测方法，包括：在智能客服的播报过程中，采用声纹识别算法检测音频数据中的说话人声片段；对上述说话人声片段进行说话人特征提取，得到说话人语音特征；对上述说话人语音特征和目标人语音特征进行相似度匹配；根据上述说话人语音特征和上述目标人语音特征之间的相似度与设定阈值的比较结果，确定是否中断上述播报过程。
[0007]可选的，根据上述说话人语音特征和上述目标人语音特征之间的相似度与设定阈值的比较结果，确定是否中断上述播报过...

【技术保护点】

【技术特征摘要】
1.一种语音播报的打断检测方法，其特征在于，包括：在智能客服的播报过程中，采用声纹识别算法检测音频数据中的说话人声片段；对所述说话人声片段进行说话人特征提取，得到说话人语音特征；对所述说话人语音特征和目标人语音特征进行相似度匹配；根据所述说话人语音特征和所述目标人语音特征之间的相似度与设定阈值的比较结果，确定是否中断所述播报过程。2.根据权利要求1所述的方法，其特征在于，根据所述说话人语音特征和所述目标人语音特征之间的相似度与设定阈值的比较结果，确定是否中断所述播报过程，包括：如果所述相似度高于或等于设定阈值，则判定所述说话人声片段为目标人声片段，并中断所述播报过程；如果所述相似度低于所述设定阈值，则判定所述说话人声片段并非目标人声片段，并继续所述播报过程。3.根据权利要求1所述的方法，其特征在于，在所述智能客服的播报之前，所述方法还包括：在通话开始阶段，对身份验证通过的目标人的语音数据进行语音片段提取，得到目标人语音片段；对累计到特定时长后的目标人语音片段进行说话人特征提取，得到所述目标人语音特征。4.根据权利要求3所述的方法，其特征在于，对所述目标人的语音数据进行语音片段提取，得到目标人语音片段，包括：采用深度神经网络模型对所述语音数据进行概率计算，得到所述语音数据为语音或者非语音的概率序列；采用维特比寻址算法对所述概率序列进行语音段判定，得到所述目标人语音片段在每个时刻对应的最优状态，生成用于起尾点判定的状态序列；采用起尾点判定算法根据所述状态序列进行有效音片段检测，得到所述目标人语音片段。5.根据权利要求4所述的方法，其特征在于，采用起尾点判定算法根据所述状态序列进行有效音片段检测，得到所述目标人语音片段，包括：如果有效音片段检测所述...

【专利技术属性】
技术研发人员：张后力，袁改娟，刘威，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人