语音增广方法及相关方法、装置、设备和存储介质制造方法及图纸

技术编号:41576609 阅读:25 留言:0更新日期:2024-06-06 23:54
本申请公开了一种语音增广方法及相关方法、装置、设备和存储介质,其中,语音增广方法包括:获取目标语音;其中,目标语音包含多个语音通道;基于目标语音执行增广处理,得到与目标语音表达相同含义的增广语音;其中,增广处理包括以下至少一项操作:对至少一个语音通道的语谱图执行至少一种谱增广,对至少一个语音通道中语音帧的目标数据以帧为单位进行增广,对至少一个语音通道中语音帧的目标数据以通道为单位进行增广,且语音帧的目标数据为语音帧本身、语音帧的声学特征中任一者。上述方案,能够在实现多通道语音增广的前提下,尽可能地提升多通道语音增广的多样性。

【技术实现步骤摘要】

本申请涉及语音处理,特别是涉及一种语音增广方法及相关方法、装置、设备和存储介质


技术介绍

1、数据增强是诸如语音识别、语音情感分类等语音任务相关模型训练中的一种重要技术,通过数据增强能够对样本语音进行增广,以生成新的样本语音,有助于后续相关模型训练效果。

2、目前,现有技术通常聚焦于对单通道语音进行数据增强,而缺乏对多通道语音的增强方案。有鉴于此,如何在实现多通道语音增广的前提下,尽可能地提升多通道语音增广的多样性,成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种语音增广方法及相关方法、装置、设备和存储介质,能够在实现多通道语音增广的前提下,尽可能地提升多通道语音增广的多样性。

2、为了解决上述技术问题,本申请第一方面提供了一种语音增广方法,包括:获取目标语音;其中,目标语音包含多个语音通道;基于目标语音执行增广处理,得到与目标语音表达相同含义的增广语音;其中,增广处理包括以下至少一项操作:对至少一个语音通道的语谱图执行至少一种谱增广,对至少一个语音通道中语本文档来自技高网...

【技术保护点】

1.一种语音增广方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对至少一个所述语音通道的语谱图执行至少一种谱增广,包括:

3.根据权利要求1所述的方法,其特征在于,所述对至少一个所述语音通道中语音帧的目标数据以帧为单位进行增广,包括以下至少一者:

4.根据权利要求3所述的方法,其特征在于,所述在各个所述语音通道中选择时间对齐的语音帧作为第一目标帧,包括以下至少一者:

5.根据权利要求3所述的方法,其特征在于,所述在至少一个所述语音通道中分别选择所述语音帧作为第二目标帧,包括以下至少一者:

<p>6.根据权利要求...

【技术特征摘要】

1.一种语音增广方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对至少一个所述语音通道的语谱图执行至少一种谱增广,包括:

3.根据权利要求1所述的方法,其特征在于,所述对至少一个所述语音通道中语音帧的目标数据以帧为单位进行增广,包括以下至少一者:

4.根据权利要求3所述的方法,其特征在于,所述在各个所述语音通道中选择时间对齐的语音帧作为第一目标帧,包括以下至少一者:

5.根据权利要求3所述的方法,其特征在于,所述在至少一个所述语音通道中分别选择所述语音帧作为第二目标帧,包括以下至少一者:

6.根据权利要求1所述的方法,其特征在于,所述对至少一个所述语音通道中语音帧的目标数据以通道为单位进行增广,包括以下至少一者:

7.一种语音处理模型的训练方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于,所述至少基于所述样本增广语音训练语音处理网络,得到语音处理模型,包括:<...

【专利技术属性】
技术研发人员:胡今朝吴重亮李永超吴明辉
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1