语音处理方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号：26422457 阅读：37 留言：0更新日期：2020-11-20 14:18

本公开的实施例公开了语音处理方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：将待处理语音分割成至少一个语音片段，其中，上述语音片段是同一声源的一段语音起始到语音结束的片段；基于上述至少一个语音片段的聚类结果，生成至少一个第一语音；以上过程可以对目标语音进行一定精度的语音分割，为以下生成第二语音奠定了基础。对上述至少一个第一语音中的每个第一语音进行提特征提取，得到每个上述第一语音对应的声纹特征矢量；基于上述声纹特征矢量生成第二语音，其中，第二语音是同一声源的未混合语音。通过对上述第一语音进行特征提取，以及对第一语音进一个语音分离，得到更准确的第二语音，从而提升整体语音分割效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置、电子设备和计算机可读介质
本公开的实施例涉及计算机
，具体涉及语音处理方法、装置、设备和计算机可读介质。
技术介绍
目前，在语音分离过程中，往往需要在一段给定的语音中分离出目标语音。目前，相关的做法可以是采用分割聚类方法来从一段给定语音中，得到目标语音。然而，采用分割聚类方法所得到的目标语音准确率不高。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了语音处理方法、装置、电子设备和计算机可读介质，来解决以上
技术介绍
部分提到的技术问题。第一方面，本公开的一些实施例提供了一种语音处理方法，该方法包括：将待处理语音分割成至少一个语音片段，其中，上述语音片段是同一声源的一段语音起始到语音结束的片段；基于上述至少一个语音片段的聚类结果，生成至少一个第一语音，其中，上述第一语音包含同一声...

【技术保护点】
1.一种语音处理方法，包括：/n将待处理语音分割成至少一个语音片段，其中，所述语音片段是同一声源的一段语音起始到语音结束的片段；/n基于所述至少一个语音片段的聚类结果，生成至少一个第一语音，其中，所述第一语音包含同一声源的至少一个语音片段；/n对所述至少一个第一语音中的每个第一语音进行提特征提取，得到每个所述第一语音对应的声纹特征矢量；/n基于所述声纹特征矢量生成第二语音，其中，所述第二语音是同一声源的未混合语音。/n

【技术特征摘要】
1.一种语音处理方法，包括：
将待处理语音分割成至少一个语音片段，其中，所述语音片段是同一声源的一段语音起始到语音结束的片段；
基于所述至少一个语音片段的聚类结果，生成至少一个第一语音，其中，所述第一语音包含同一声源的至少一个语音片段；
对所述至少一个第一语音中的每个第一语音进行提特征提取，得到每个所述第一语音对应的声纹特征矢量；
基于所述声纹特征矢量生成第二语音，其中，所述第二语音是同一声源的未混合语音。

2.根据权利要求1所述的方法，其中，所述基于所述至少一个语音片段的聚类结果，生成至少一个第一语音，包括：
将所述至少一个语音片段的聚类结果中的每个语音片段簇中的语音片段拼接成初始第一语音，生成对应所述至少一个语音片段的至少一个初始第一语音。

3.根据权利要求2所述的方法，其中，所述基于所述至少一个语音片段的聚类结果，生成至少一个第一语音，包括：
对于至少一个初始第一语音中的每一个初始第一语音，对所述初始第一语音进行分帧，得到语音帧集合，将所述语音帧集合中语音帧的聚类结果中的每个语音帧簇中的语音帧拼接，生成所述至少一个第一语音。

4.根据权利要求1所述的方法，其中，所述至少一个第一语音中的每一个第一语音包括以下至少一项：未混合语音，混合语音。

5.根据权利要求1所述的方法，其中，所述第一语音对应的声纹特征...

【专利技术属性】
技术研发人员：蔡猛，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人