System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音合成方法及装置、电子设备和存储介质制造方法及图纸_技高网

语音合成方法及装置、电子设备和存储介质制造方法及图纸

技术编号:40841398 阅读:5 留言:0更新日期:2024-04-01 15:08
本说明书实施方式提供了一种语音合成方法及装置、电子设备和存储介质。该方法包括:获取第一文本信息,其中,第一文本信息为待合成语音的文本信息;对第一文本信息进行文本转换,得到转换后的第二文本信息,其中,文本转换是指对第一文本信息中的特定文本区间进行标签标注,以对特定文本区间进行文本替换;以及对第二文本信息进行语音合成,获得对应的音频信息,能够提供语音合成的准确率。

【技术实现步骤摘要】

本说明书中实施方式关于语音合成领域,特别涉及一种语音合成方法及装置、电子设备和存储介质


技术介绍

1、语音合成技术是将文本转化为语音的一种技术,可以应用于语音合成助手、智能客服、有声读物、呼叫中心、车载娱乐设备等应用场景。目前,已有很多智能语音交互产品可以提供文本合成语音的能力。

2、但是,现有智能语音交互产品在语音合成过程中对于大段自由文本中的特殊文本,例如:计量单位、范围、~、大于号、小于号等重要文本不能准确识别,从而造成语音合成的准确率较低。


技术实现思路

1、本说明书中多个实施方式提供一种语音合成方法及装置、电子设备和存储介质,能够提高语音合成的准确率。

2、本说明书的一个实施方式提供一种语音合成方法,包括:获取第一文本信息,其中,第一文本信息为待合成语音的文本信息;对第一文本信息进行文本转换,得到转换后的第二文本信息,其中,文本转换是指对第一文本信息中的特定文本区间进行标签标注,以对特定文本区间进行文本替换;以及对第二文本信息进行语音合成,获得对应的音频信息。

3、本说明书的一个实施方式提供一种语音合成装置,包括:获取模块,用于获取第一文本信息,其中,第一文本信息为待合成语音的文本信息;转换模块,用于对第一文本信息进行文本转换,得到转换后的第二文本信息,其中,文本转换是指对第一文本信息的特定文本区间进行标签标注,以对特定文本区间进行文本替换;以及合成模块,用于对第二文本信息进行语音合成,获得对应的音频信息。

4、本说明书的一个实施方式提供一种电子设备,其特征在于,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于执行上述任一实施方式所述的语音合成方法。

5、本说明书的一个实施方式提供一种计算机可读存储介质,其上存储有计算机可执行指令,其特征在于,可执行指令被处理器执行时实现上述任一实施方式所述的语音合成方法。

6、本说明书的一个实施方式提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一实施方式所述的语音合成方法。

7、本说明书提供的多个实施方式,通过获取待合成语音的第一文本信息,对第一文本信息中的特定文本区间进行标签标注得到第二文本信息,可以对特定文本区间(例如特殊数字、字母、符号、单位缩写等)进行文本替换,将其替换成相应中文发音对应的文本,进而能够提高语音合成的准确率。

本文档来自技高网...

【技术保护点】

1.一种语音合成方法,其特征在于,包括:

2.根据权利要求1所述的语音合成方法,其特征在于,所述对所述第一文本信息进行文本转换,得到转换后的第二文本信息,包括:

3.根据权利要求1所述的语音合成方法,其特征在于,还包括:

4.根据权利要求3所述的语音合成方法,其特征在于,所述根据所述提示信息,对所述第一文本信息进行文本转换,得到所述第二文本信息,包括:

5.根据权利要求4所述的语音合成方法,其特征在于,还包括:

6.根据权利要求4所述的语音合成方法,其特征在于,所述预训练语言模型包括生成式预训练转换器。

7.根据权利要求1至6中任一项所述的语音合成方法,其特征在于,所述第一文本信息包括完整版药品说明书文本或简化版药品说明书文本,其中,所述语音合成方法还包括:

8.一种语音合成装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1至7中任一项所述的语音合成方法

...

【技术特征摘要】

1.一种语音合成方法,其特征在于,包括:

2.根据权利要求1所述的语音合成方法,其特征在于,所述对所述第一文本信息进行文本转换,得到转换后的第二文本信息,包括:

3.根据权利要求1所述的语音合成方法,其特征在于,还包括:

4.根据权利要求3所述的语音合成方法,其特征在于,所述根据所述提示信息,对所述第一文本信息进行文本转换,得到所述第二文本信息,包括:

5.根据权利要求4所述的语音合成方法,其特征在于,还包括:

6.根据权利要求4所述...

【专利技术属性】
技术研发人员:孙滋唱
申请(专利权)人:阿里健康科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1