语音一致性检测方法、装置、设备及存储介质制造方法及图纸

技术编号：33967995 阅读：11 留言：0更新日期：2022-06-30 01:50

本发明专利技术公开了一种语音一致性检测方法、装置、设备及存储介质。该方法通过获取目标用户的模板语音特征库和待判定语音，确定待判定语音中各待判定元音音素的音素特征，进而根据各待判定元音音素的音素特征以及模板语音特征库中与各待判定元音音素对应的模板元音音素的音素特征，检测待判定语音与模板语音特征库中的模板语音之间是否具备一致性，实现了基于音素特征的语音一致性检测，该方法通过为用户构建的模板语音特征库即可实现实时对用户录制语音的一致性检测，无需人工多次回放收听，解决了检测语音一致性的成本较高以及时效性较低的技术问题，提高了语音一致性的检测效率和检测时效性。和检测时效性。和检测时效性。

全部详细技术资料下载

【技术实现步骤摘要】
语音一致性检测方法、装置、设备及存储介质

[0001]本专利技术涉及语音处理
，尤其涉及一种语音一致性检测方法、装置、设备及存储介质。

技术介绍

[0002]在生成语音合成数据库的过程中，通常要求同一个发音人在不同时期、不同环境所录制的数据保持较高的一致性，即从听感上保证所录制的各个批次的语音尽量保持一致，如，同一发音人在不同时期录制的音频的音量是否忽高忽低、语速是否时快时慢、音调是否忽高忽低等。
[0003]针对同一发音人在不同时期录制的音频是否在听感上保持一致，目前没有一个标准的评价方法。现有技术通常依赖于人工检查，即人为反复多次回放音频来判断是否一致。然而，该方法人工成本、时间成本较多，并且，不能实时判断出发音人当前录制的语音是否具备一致性，时效性较低。

技术实现思路

[0004]本专利技术提供了一种语音一致性检测方法、装置、设备及存储介质，以解决检测语音一致性的成本较高以及时效性较低的技术问题。
[0005]根据本专利技术的一方面，提供了一种语音一致性检测方法，包括：获取目标用户的模板语音特征库，其中，所述模板语音特征库包括模板语音中各模板元音音素的音素特征；获取所述目标用户的待判定语音，确定所述待判定语音中各待判定元音音素的音素特征；基于各所述待判定元音音素的音素特征以及所述模板语音特征库中与各所述待判定元音音素对应的模板元音音素的音素特征，检测所述待判定语音与所述模板语音之间是否具备一致性。
[0006]可选的，所述获取目标用户的模板语音特征库，包括：获取目标...

【技术保护点】

【技术特征摘要】
1.一种语音一致性检测方法，其特征在于，包括：获取目标用户的模板语音特征库，其中，所述模板语音特征库包括模板语音中各模板元音音素的音素特征；获取所述目标用户的待判定语音，确定所述待判定语音中各待判定元音音素的音素特征；基于各所述待判定元音音素的音素特征以及所述模板语音特征库中与各所述待判定元音音素对应的模板元音音素的音素特征，检测所述待判定语音与所述模板语音之间是否具备一致性。2.根据权利要求1所述的方法，其特征在于，所述获取目标用户的模板语音特征库，包括：获取目标用户的模板语音，确定所述模板语音中各模板元音音素的音素信息；基于各所述模板元音音素的音素信息确定各所述模板元音音素的音素特征；基于各所述模板元音音素的音素特征构建模板语音特征库。3.根据权利要求2所述的方法，其特征在于，所述确定所述模板语音中各模板元音音素的音素信息，包括：确定所述模板语音中各音素的音素信息，其中，所述音素信息包括音素置信度；基于各所述音素的音素置信度以及预设置信度阈值对各所述音素进行过滤处理，基于过滤处理的结果确定各模板元音音素的音素信息。4.根据权利要求2所述的方法，其特征在于，在所述确定所述模板语音中各模板元音音素的音素信息之前，所述方法还包括：针对各所述模板语音，确定所述模板语音中的静音片段和噪声片段，将所述静音片段和所述噪声片段从所述模板语音中剔除。5.根据权利要求2所述的方法，其特征在于，所述音素信息包括音素起始时间、音素结束时间以及音素采样点幅度值，所述基于各所述模板元音音素的音素信息确定各所述模板元音音素的音素特征，包括：基于所述模板元音音素的音素起始时间和音素结束时间，确定所述模板元音音素的平均语速；基于所述模板元音音素的音素采样点幅度值确定所述模板元音音素的平均能量；根据所述平均语速、所述平均能量、所述模板元音音素的基频以及所述模板元音音素的共振峰，构建所述模板元音音素的音素特征。6.根据权利要求5所述的方法，其特征在于，所述基于各所述模板元音音素的音素特征构建模板语音特征库，包括：基于各所述模板元音音素的基频和共振峰，对各所述模板元音音素进行聚类处理；根据聚类处理的结果在各所述模板元音音素中确定各簇内音素，基于所述簇内音素的音素特征构建模板语音特征库。7.根据权利要求1所述的方法，其特征在于，所述基于各所述待判定元音音素的音素特征以及所述模板语音特征库中与各所述待判定元音音素对应的模板元音音素的音素特征，检测所述待判定语音与所述模板语音之间是否具备...

【专利技术属性】
技术研发人员：邵志明，黄宇凯，李科，郝玉峰，
申请(专利权)人：北京海天瑞声科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人