音频处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:45038163 阅读:17 留言:0更新日期:2025-04-18 17:21
本公开实施例提供了一种音频处理方法、装置、电子设备和存储介质,其中方法包括:获取第一音频和所述第一音频对应的第一文本;通过第一发音预测系统,根据所述第一音频和所述第一文本预测所述第一文本的第一发音序列;所述第一发音序列中标注的所述第一文本中的字的发音的声调包括轻声声调和/或变调后的三声声调;所述第一文本中的连续两个三声声调中的第一个三声声调在所述第一发音序列中被标注为变调后的三声声调;通过第二发音预测系统,对所述第一发音序列中的轻声声调进行更正,和/或,通过第三发音预测系统,对所述第一发音序列中的变调后的三声声调进行更正。

【技术实现步骤摘要】

本公开涉及音频处理领域,尤其涉及一种音频处理方法、装置、电子设备和存储介质


技术介绍

1、在自然语言处理领域中,经常需要预测文本的发音序列,文本的发音序列可以是音素序列也可以是拼音序列。文本中可能存在轻声或者连续两个三声,连续两个三声可以举例为:ni3、hao3,这里3指示第三声。针对文本中的连续两个三声,考虑到真实朗读场景中第一个三声会被变调处理,不会被读成三声,因此在发音序列中通常将第一个三声标记为变调后的三声。已有技术中,受到文本中的轻声和连续两个三声的干扰,预测发音序列的准确性较差。


技术实现思路

1、本公开实施例提供了一种音频处理方法、装置、电子设备和存储介质,能够提高预测文本的发音序列的准确性。

2、第一方面,本公开实施例提供了一种音频处理方法,包括:

3、获取第一音频和所述第一音频对应的第一文本;

4、通过第一发音预测系统,根据所述第一音频和所述第一文本预测所述第一文本的第一发音序列;所述第一发音序列中标注的所述第一文本中的字的发音的声调包括轻声声调和/或变本文档来自技高网...

【技术保护点】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述通过第一发音预测系统,根据所述第一音频和所述第一文本预测所述第一文本的第一发音序列,包括:

3.根据权利要求1所述的方法,其特征在于,所述通过第二发音预测系统,对所述第一发音序列中的轻声声调进行更正,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过第三发音预测系统,对所述第一发音序列中的变调后的三声声调进行更正,包括:

5.根据权利要求3所述的方法,其特征在于,所述通过第二发音预测系统,根据所述第一音频和所述第一文本预测所述第一文本的第二发音序...

【技术特征摘要】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述通过第一发音预测系统,根据所述第一音频和所述第一文本预测所述第一文本的第一发音序列,包括:

3.根据权利要求1所述的方法,其特征在于,所述通过第二发音预测系统,对所述第一发音序列中的轻声声调进行更正,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过第三发音预测系统,对所述第一发音序列中的变调后的三声声调进行更正,包括:

5.根据权利要求3所述的方法,其特征在于,所述通过第二发音预测系统,根据所述第一音频和所述第一文本预测所述第一文本的第二发音序列,包括:

6.根据权利要求3所述的方法,其特征在于,所述根据所述第二发音序列对所述第一发音序列中的轻声声调进行更正,包括:

7.根据权利要求4所述的方法,其特征在于,所述通过第三发音预测系统,根据所述第一音频和所述...

【专利技术属性】
技术研发人员:蒋泳森叶顺平
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1