一种语音角色标注方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38853199 阅读:24 留言:0更新日期:2023-09-17 10:00
本申请的实施例公开了一种语音角色标注方法、装置、电子设备及存储介质,其中语音角色标注方法通过对目标语音角色的多个语音文件进行聚类,实现目标语音角色语音聚集,得到目标语音角色的混合语音,并对该相同说话人语音聚集进行说话人分割,得到混合语音对应的第一语音分割文件,并基于混合语音文件得到多个独立的时间片段,并基于多个独立的时间片段得到第二语音分割数据,并根据第一语音分割数据和第二语音分割数据进行目标语音角色标注,实现了通过同一聚类结果获取不同语音分割数据的效果,并基于不同语音分割数据的相互参考对照对目标语音角色进行标注,实现准确的对语音文件中的语音角色进行标注的效果。件中的语音角色进行标注的效果。件中的语音角色进行标注的效果。

【技术实现步骤摘要】
一种语音角色标注方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,具体而言,涉及一种语音角色标注方法、装置、电子设备及存储介质。

技术介绍

[0002]随着语音文件获取途径和数量的快速增加,语音文件管理变得越来越复杂,通过对语音文件中的语音角色进行标注,实现对不同的语音角色进行针对性的分析,例如,对处于销售业务场景中的语音文件进行角色标注,明确出来哪些属于客户说话,哪些属于销售说话,针对客户说话,结合语音识别,可以进一步分析出来客户画像,而针对销售说话,可以提取优秀话术;而语音角色标注是这些工作的基础和前提,相关技术中,语音角色标注效果差,无法准确的对语音文件中的语音角色进行标注。

技术实现思路

[0003]本申请的实施例提供了一种语音角色标注方法、装置、电子设备及存储介质,其中方法能够准确的对语音文件中的语音角色进行标注,解决了相关技术中,语音角色标注效果差,无法准确的对语音文件中的语音角色进行标注的问题。
[0004]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0005]根据本申请实施例的一个方面,提供了一种语音角色标注方法,所述方法包括:获取目标语音角色的多个语音文件,并对多个语音文件进行聚类,得到所述目标语音角色对应的聚类结果;对所述聚类结果进行说话人分割,得到第一语音分割数据;对所述聚类结果中包含的语音文件进行拼接处理,得到拼接语音文件,并对所述拼接语音文件进行说话人分割,得到第二语音分割数据;基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注。
[0006]在一些示例中,基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注,包括:通过所述第二语音分割数据确定所述目标语音角色的身份标识;基于所述身份标识对所述第一语音分割数据和所述第二语音分割数据进行比对,并基于比对结果在所述聚类结果中对所述目标语音角色进行标注。
[0007]在一些示例中,对所述聚类结果进行说话人分割,得到第一语音分割数据,包括:基于所述目标语音角色的语音文件对应的场景确定约束结果,所述约束结果用于约束语音文件中的语音角色数量;根据所述约束结果对所述聚类结果进行说话人分割,得到所述第一语音分割数据。
[0008]在一些示例中,对所述聚类结果中包含的语音文件进行拼接处理,得到拼接语音文件,并对所述拼接语音文件进行说话人分割,得到第二语音分割数据,包括:从每个语音文件中截取预设时长的时间片段;将获取的所述时间片段进行拼接,得到所述拼接语音文件;对所述拼接语音文件进行说话人分割,得到所述第二语音分割数据。
[0009]在一些示例中,基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注之后,所述方法还包括:查看标注结果,若所述标注结果低于目标期望,修改所述预设时长,并基于修改后的所述预设时长从每个语音文件中截取新的时间片段;将获取的所述新的时间片段进行拼接,以更新所述拼接语音文件;基于更新后的所述拼接语音文件重新获取所述第二语音分割数据。
[0010]在一些示例中,基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注之后,所述方法还包括:查看标注结果,若所述标注结果低于目标期望,基于所述预设时长从每个语音文件中截取新的时间片段;将获取的所述新的时间片段进行拼接,以更新所述拼接语音文件;基于更新后的所述拼接语音文件重新获取所述第二语音分割数据。
[0011]根据本申请实施例的一个方面,提供了一种语音角色标注装置,所述装置包括:聚类模块,用于获取目标语音角色的多个语音文件,并对多个语音文件进行聚类,得到所述目标语音角色对应的聚类结果;分割模块,用于基于所述聚类结果进行说话人分割,得到第一语音分割数据;所述分割模块还用于对所述聚类结果中包含的语音文件进行拼接处理,得到拼接语音文件,并对所述拼接语音文件进行说话人分割,得到第二语音分割数据;标注模块,用于基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注。
[0012]在一些示例中,所述标注模块还用于通过所述第二语音分割数据确定所述目标语音角色的身份标识;基于所述身份标识对所述第一语音分割数据和所述第二语音分割数据进行比对,并基于比对结果在所述聚类结果中对所述目标语音角色进行标注。
[0013]根据本申请实施例的一个方面,本申请实施例提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如上所述的方法。
[0014]根据本申请实施例的一个方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被电子设备的处理器执行时,使电子设备执行如上所述的方法。
[0015]根据本申请实施例的一个方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该电子设备执行上述各个实施例中提供如前所述的方法。
[0016]本方案可以应用于在数据处理
进行广告分析处理,在本申请的实施例所提供的技术方案中,语音角色标注方法通过获取目标语音角色的多个语音文件,并对多个语音文件进行聚类,得到所述目标语音角色对应的聚类结果;基于所述聚类结果进行说话人分割,得到第一语音分割数据;对所述聚类结果中包含的语音文件进行拼接处理,得到拼接语音文件,并对所述拼接语音文件进行说话人分割,得到第二语音分割数据;基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注,其中,对目标语音角色的多个语音文件进行聚类,实现目标语音角色语音聚集,得到目标语音角色的混合语音,并对该相同说话人语音聚集进行说话人分割,得到混合语音对应的第一语音分割文件,并基于混合语音文件得到多个独立的时间片段,并基于多个独立的时间片段得到第二
语音分割数据,并根据第一语音分割数据和第二语音分割数据进行目标语音角色标注,实现了通过同一聚类结果获取不同语音分割数据的效果,并基于不同语音分割数据的相互参考对照对目标语音角色进行标注,实现准确的对语音文件中的语音角色进行标注的效果,避免了相关技术中单语音分割数据下,语音角色标注效果差,无法准确的对语音文件中的语音角色进行标注的问题。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0018]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。在附图中:
[0019]图1是本申请实施例一示出的一种语音角色标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音角色标注方法,其特征在于,所述方法包括:获取目标语音角色的多个语音文件,并对多个语音文件进行聚类,得到所述目标语音角色对应的聚类结果;对所述聚类结果进行说话人分割,得到第一语音分割数据;对所述聚类结果中包含的语音文件进行拼接处理,得到拼接语音文件,并对所述拼接语音文件进行说话人分割,得到第二语音分割数据;基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注。2.根据权利要求1所述的方法,其特征在于,基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注,包括:通过所述第二语音分割数据确定所述目标语音角色的身份标识;基于所述身份标识对所述第一语音分割数据和所述第二语音分割数据进行比对,并基于比对结果在所述聚类结果中对所述目标语音角色进行标注。3.根据权利要求1所述的方法,其特征在于,对所述聚类结果进行说话人分割,得到第一语音分割数据,包括:基于所述目标语音角色的语音文件对应的场景确定约束结果,所述约束结果用于约束语音文件中的语音角色数量;根据所述约束结果对所述聚类结果进行说话人分割,得到所述第一语音分割数据。4.根据权利要求1所述的方法,其特征在于,对所述聚类结果中包含的语音文件进行拼接处理,得到拼接语音文件,并对所述拼接语音文件进行说话人分割,得到第二语音分割数据,包括:从每个语音文件中截取预设时长的时间片段;将获取的所述时间片段进行拼接,得到所述拼接语音文件;对所述拼接语音文件进行说话人分割,得到所述第二语音分割数据。5.根据权利要求4所述的方法,其特征在于,基于所述第一语音分割数据和所述第二语音分割数据对所述目标语音角色进行标注之后,所述方法还包括:查看标注结果,若所述标注结果低于目标期望,修改所述预设时长,并基于修改后的所述预设时长从每个语音文件中截取新的时...

【专利技术属性】
技术研发人员:雍坤姜平赵亮
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1