一种语音角色标注方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38853199 阅读：24 留言：0更新日期：2023-09-17 10:00

本申请的实施例公开了一种语音角色标注方法、装置、电子设备及存储介质，其中语音角色标注方法通过对目标语音角色的多个语音文件进行聚类，实现目标语音角色语音聚集，得到目标语音角色的混合语音，并对该相同说话人语音聚集进行说话人分割，得到混合语音对应的第一语音分割文件，并基于混合语音文件得到多个独立的时间片段，并基于多个独立的时间片段得到第二语音分割数据，并根据第一语音分割数据和第二语音分割数据进行目标语音角色标注，实现了通过同一聚类结果获取不同语音分割数据的效果，并基于不同语音分割数据的相互参考对照对目标语音角色进行标注，实现准确的对语音文件中的语音角色进行标注的效果。件中的语音角色进行标注的效果。件中的语音角色进行标注的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音角色标注方法、装置、电子设备及存储介质

[0001]本申请涉及数据处理
，具体而言，涉及一种语音角色标注方法、装置、电子设备及存储介质。

技术介绍

[0002]随着语音文件获取途径和数量的快速增加，语音文件管理变得越来越复杂，通过对语音文件中的语音角色进行标注，实现对不同的语音角色进行针对性的分析，例如，对处于销售业务场景中的语音文件进行角色标注，明确出来哪些属于客户说话，哪些属于销售说话，针对客户说话，结合语音识别，可以进一步分析出来客户画像，而针对销售说话，可以提取优秀话术；而语音角色标注是这些工作的基础和前提，相关技术中，语音角色标注效果差，无法准确的对语音文件中的语音角色进行标注。

技术实现思路

[0003]本申请的实施例提供了一种语音角色标注方法、装置、电子设备及存储介质，其中方法能够准确的对语音文件中的语音角色进行标注，解决了相关技术中，语音角色标注效果差，无法准确的对语音文件中的语音角色进行标注的问题。
[0004]本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。
[0005]根据本申请实施例的一个方面，提供了一种语音角色标注方法，所述方法包括：获取目标语音角色的多个语音文件，并对多个语音文件进行聚类，得到所述目标语音角色对应的聚类结果；对所述聚类结果进行说话人分割，得到第一语音分割数据；对所述聚类结果中包含的语音文件进行拼接处理，得到拼接语音文件，并对所述拼接语音文件进行说话人分割，得到第二语音分割数据；基于所述第一语音...

【技术保护点】

【技术特征摘要】
1.一种语音角色标注方法，其特征在于，所述方法包括：获取目标语音角色的多个语音文件，并对多个语音文件进行聚类，得到所述目标语音角色对应的聚类结果；对所述聚类结果进行说话人分割，得到第一语音分割数据；对所述聚类结果中包含的语音文件进行拼接处理，得到拼接语音文件，并对所述拼接语音文件进行说话人分割，得到第二语音分割数据；基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注。2.根据权利要求1所述的方法，其特征在于，基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注，包括：通过所述第二语音分割数据确定所述目标语音角色的身份标识；基于所述身份标识对所述第一语音分割数据和所述第二语音分割数据进行比对，并基于比对结果在所述聚类结果中对所述目标语音角色进行标注。3.根据权利要求1所述的方法，其特征在于，对所述聚类结果进行说话人分割，得到第一语音分割数据，包括：基于所述目标语音角色的语音文件对应的场景确定约束结果，所述约束结果用于约束语音文件中的语音角色数量；根据所述约束结果对所述聚类结果进行说话人分割，得到所述第一语音分割数据。4.根据权利要求1所述的方法，其特征在于，对所述聚类结果中包含的语音文件进行拼接处理，得到拼接语音文件，并对所述拼接语音文件进行说话人分割，得到第二语音分割数据，包括：从每个语音文件中截取预设时长的时间片段；将获取的所述时间片段进行拼接，得到所述拼接语音文件；对所述拼接语音文件进行说话人分割，得到所述第二语音分割数据。5.根据权利要求4所述的方法，其特征在于，基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注之后，所述方法还包括：查看标注结果，若所述标注结果低于目标期望，修改所述预设时长，并基于修改后的所述预设时长从每个语音文件中截取新的时...

【专利技术属性】
技术研发人员：雍坤，姜平，赵亮，
申请(专利权)人：北京明略昭辉科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人