多人声分离方法技术

技术编号：39596242 阅读：10 留言：0更新日期：2023-12-03 19:54

本申请提供一种多人声分离方法

全部详细技术资料下载

【技术实现步骤摘要】
多人声分离方法、系统、模型训练方法、介质及设备

[0001]本申请涉及一种多人声分离方法，特别是涉及一种多人声分离方法
、
系统
、
模型训练方法
、
介质及设备
。

技术介绍

[0002]随着语音识别技术的不断发展，越来越多的智能设备通过语音识别等语音相关的技术来实现人机交互的功能，例如智能音箱
、
智能手机等设备，通过这些智能设备，人们可以更方便的通过语音来进行设备的相关操作
。
但是，目前，现有的多人声分离模型结构固定，只能应对一种人声分离的任务而无法自动判断应该分离几个人声
。
并且现有的大部分人声分离模型的解码器网络结构基本相同，但是却没有加以复用，从而造成资源的浪费
。
同时，解码器网络往往只有一个分支输出一个语音，输出效果不佳
。
因此，现有技术中缺少一种能够自动判断人声分离数量且复用网络结构的人声分离模型
。

技术实现思路

[0003]鉴于以上所述现有技术的缺点，本申请的目的在于提供一种多人声分离方法
、
系统
、
模型训练方法
、
介质及设备，用于解决现有技术中现有技术中缺少一种能够自动判断人声分离数量且复用网络结构的人声分离模型的技术问题
。
[0004]为实现上述目的及其他相关目的，本申请的第一方面提供一种多人声分离模型的训练方法，包括将混合语音输入多人声分离模型以获取初始混...

【技术保护点】

【技术特征摘要】
1.
一种多人声分离模型的训练方法，其特征在于，包括：将混合语音输入多人声分离模型以获取初始混合语音特征；基于所述初始混合语音特征获取独立人声数量；基于所述独立人声数量与所述初始混合语音特征获取最终混合语音特征；基于所述独立人声数量和所述最终混合语音特征获取多人声分离结果；基于所述混合语音和所述多人声分离结果对所述多人声分离模型进行训练以获取训练好的多人声分离模型
。2.
根据权利要求1所述的多人声分离模型的训练方法，其特征在于，基于所述独立人声数量与所述初始混合语音特征获取最终混合语音特征包括：基于所述独立人声数量获取独立人声数量特征；基于所述独立人声数量特征与所述初始混合语音特征获取最终混合语音特征
。3.
根据权利要求1所述的多人声分离模型的训练方法，其特征在于，基于所述独立人声数量和所述最终混合语音特征获取多人声分离结果包括：基于所述独立人声数量设置对应数量的分离网络模块；基于所述对应数量的分离网络模块对所述最终混合语音特征进行处理以获取多人声分离结果
。4.
根据权利要求3所述的多人声分离模型的训练方法，其特征在于，基于所述对应数量的分离网络模块对所述最终混合语音特征进行处理以获取多人声分离结果包括：所述分离网络模块包括转换网络
、
融合网络与解码器网络；基于所述转换网络和所述融合网络获取与所述独立人声数量对应的独立人声特征；基于所述解码器网络获取所述独立人声特征对应的独立人声语音结果
。5.
根据权利要求4所述的多人声分离模型的训练方法，其特征在于，所述基于所述解码器网络获取所述独立人声特征对应的独立人声语音结果包括：所述解码器网络...

【专利技术属性】
技术研发人员：孔欧，
申请(专利权)人：上海蜜度信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人