语音分离方法、电子设备、芯片系统及计算机可读存储介质技术方案

技术编号：46595540 阅读：0 留言：0更新日期：2025-10-10 21:28

本申请公开一种语音分离方法、电子设备、芯片系统及计算机可读存储介质，涉及语音识别技术领域。语音分离方法包括：获取待处理语音，将待处理语音均匀切分成N段子语音。提取每段子语音的声纹特征，计算与N段子语音对应的N‑1个声纹特征相似度S1～SN‑1。声纹特征相似度是在时域上相邻的两段子语音的声纹特征的相似度。根据N‑1个声纹特征相似度S1～SN‑1对N段子语音进行连通，形成K个第一连通块B1～BK。根据每个第一连通块的质心对K个第一连通块B1～BK进行合并或拆分，形成T个第二连通块B1’～BT’。第一连通块的质心为第一连通块中全部子语音的声纹特征的平均值。从T个第二连通块B1’～BT’中分离目标连通块，目标连通块包含至少一段目标子语音。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别，具体涉及一种语音分离方法、电子设备、芯片系统及计算机可读存储介质。

技术介绍

1、语音是身份信息的重要载体，语音识别技术在身份认证、语音通话、语音支付及个性化推荐等场景中有广泛的应用。在语音识别的应用场景中，电子设备可以利用声纹模型提取一段语音的声纹特征，再利用声纹特征判别接收到的语音是否为注册用户的语音。其中，声纹为电声学仪器显示的携带语音信息的声波频谱，声纹特征用于表征说话人的语音特性。

2、然而，注册用户的语音通常受到环境噪声或重叠人声的影响，导致输入至声纹模型的语音混合了干扰信号，使声纹模型输出的声纹特征与注册用户的实际声纹特征的匹配度较低，从而导致语音识别的准确度较低。

技术实现思路

1、鉴于此，本申请实施例提供一种语音分离方法、电子设备、芯片系统及计算机可读存储介质，旨在解决如何分离语音的问题。

2、本申请实施例第一方面提供一种语音分离方法，方法包括：获取待处理语音，将待处理语音均匀切分成n段子语音。提取每段子语音的声纹特征，计算与n...

【技术保护点】

1.一种语音分离方法，其特征在于，所述方法包括：

2.如权利要求1所述的语音分离方法，其特征在于，根据每个第一连通块的质心对所述K个第一连通块B1～BK进行合并包括：

3.如权利要求2所述的语音分离方法，其特征在于，第一连通块Bi满足合并条件包括：

4.如权利要求1所述的语音分离方法，其特征在于，根据每个第一连通块的质心对所述K个第一连通块B1～BK进行拆分包括：

5.如权利要求4所述的语音分离方法，其特征在于，第一连通块Bi满足拆分条件包括：

6.如权利要求4或5所述的语音分离方法，其特征在于，确定子语音voicei具有转换点...

【技术特征摘要】

1.一种语音分离方法，其特征在于，所述方法包括：

2.如权利要求1所述的语音分离方法，其特征在于，根据每个第一连通块的质心对所述k个第一连通块b1～bk进行合并包括：

3.如权利要求2所述的语音分离方法，其特征在于，第一连通块bi满足合并条件包括：

4.如权利要求1所述的语音分离方法，其特征在于，根据每个第一连通块的质心对所述k个第一连通块b1～bk进行拆分包括：

5.如权利要求4所述的语音分离方法，其特征在于，第一连通块bi满足拆分条件包括：

6.如权利要求4或5所述的语音分离方法，其特征在于，确定子语音voicei具有转换点包括：

7.如权利要求6所述的语音分离方法，其特征在于，所述最小相似度si,x满足波动条件包括：

8.如权利要求1～7中任一项所述的语音分离方法，其特征在于，从所述t个第二连通块b1’～bt’中分离目标连通块包括：

【专利技术属性】
技术研发人员：郭俊龙，谢字希，
申请(专利权)人：荣耀终端股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人