数据处理方法、语音合成模型训练方法及装置制造方法及图纸

技术编号:37620912 阅读:16 留言:0更新日期:2023-05-18 12:12
本申请公开了一种数据处理方法、语音合成模型训练方法及装置,用以解决目前语音合成的准确度低的问题。包括:对待处理的文本数据进行拆分处理,得到第一音素字符和第一音调字符;根据预设的字符和字符标识之间的第一映射关系,确定每个第一音素字符对应的音素字符标识,根据音素字符标识确定第一音素字符对应的音素标识序列;以及确定每个第一音调字符对应的音调字符标识,根据音调字符标识确定第一音调字符对应的音调标识序列;将音素标识序列和音调标识序列输入预先训练的语音合成模型中,进行语音合成处理,得到文本数据对应的目标语音数据。该技术方案提升了合成的语音数据的准确度。确度。确度。

【技术实现步骤摘要】
数据处理方法、语音合成模型训练方法及装置


[0001]本申请涉及数据处理
,尤其涉及一种数据处理方法、语音合成模型训练方法及装置。

技术介绍

[0002]目前,端到端TTS(Text To Speech,文本转语音)技术越来越流行,通过TTS模型可以将输入数据转为较为自然的语音信号。由于对于模型而言,文本类型的输入数据是不被接受的,因此在输入TTS模型之前,需要对文本数据进行处理,但是,在文本数据包括多种类型的字符的情况下,处理所得到的输入数据仍然较复杂,从而在利用TTS模型对复杂的输入数据进行处理时,数据处理的准确度难以确保,导致语音合成的准确度降低,因此,需要提供一种能够提高语音合成的准确度的技术方案。

技术实现思路

[0003]本申请实施例的目的是提供一种数据处理方法、语音合成模型训练方法及装置,用以解决目前语音合成的准确度低的问题。
[0004]为解决上述技术问题,本申请实施例是这样实现的:
[0005]第一方面,本申请实施例提供一种数据处理方法,包括:
[0006]对待处理的文本数据进行拆本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:对待处理的文本数据进行拆分处理,得到第一音素字符和第一音调字符,所述文本数据包括多个字符;根据预设的字符和字符标识之间的第一映射关系,确定每个所述第一音素字符对应的音素字符标识,根据所述音素字符标识确定所述第一音素字符对应的音素标识序列;以及确定每个所述第一音调字符对应的音调字符标识,根据所述音调字符标识确定所述第一音调字符对应的音调标识序列;将所述音素标识序列和所述音调标识序列输入预先训练的语音合成模型中,进行语音合成处理,得到所述文本数据对应的目标语音数据。2.根据权利要求1所述的方法,其特征在于,所述语音合成模型包括:嵌入层、全连接层、运算层和编码层;所述将所述音素标识序列和所述音调标识序列输入预先训练的语音合成模型中,进行语音合成处理,得到所述文本数据对应的目标语音数据,包括:通过所述嵌入层,对所述音素标识序列和所述音调标识序列进行升维处理,得到所述音素标识序列对应的音素特征信息以及所述音调标识序列对应的音调特征信息;通过所述全连接层,将所述音素特征信息和所述音调特征信息映射至预设向量空间,得到第一维度的音素特征信息以及对应的音调特征信息;通过所述运算层,将所述第一维度的音素特征信息和所述第一维度的音调特征信息进行合并处理,得到所述文本数据的目标特征信息;通过所述编码层,对所述目标特征信息进行编码处理,得到所述文本数据对应的目标语音数据。3.根据权利要求2所述的方法,其特征在于,所述嵌入层包括音素标识序列处理模块和音调标识序列处理模块;所述全连接层包括音素特征信息处理模块和音调特征信息处理模块;所述通过所述嵌入层,对所述音素标识序列和所述音调标识序列进行升维处理,得到所述音素标识序列对应的音素特征信息以及所述音调标识序列对应的音调特征信息,包括:通过所述音素标识序列处理模块,对所述音素标识序列进行升维处理,得到所述音素标识序列对应的音素特征信息;通过所述音调标识序列处理模块对所述音调标识序列进行升维处理,得到所述音调标识序列对应的音调特征信息;所述通过所述全连接层,将所述音素特征信息和所述音调特征信息映射至预设向量空间,得到第一维度的音素特征信息以及对应的音调特征信息,包括:通过所述音素特征信息处理模块,将所述音素特征信息映射至所述预设向量空间,得到所述第一维度的音素特征信息;通过所述音调特征信息处理模块,将所述音调特征信息映射至所述预设向量空间,得到所述第一维度的音调特征信息。4.根据权利要求1所述的方法,其特征在于,所述对待处理的文本数据进行拆分处理,得到第一音素字符和第一音调字符,包括:根据预设的字符和字符类别之间的第二映射关系,将所述文本数据拆分为第二音素字符和第二音调字符,所述字符类别包括音素字符类和音调字符类;
根据每个所述第二音素字符和对应的所述第二音调字符的字符位数,对所述第二音素字符和对应的所述第二音调字符进行对齐处理,得到对齐后的所述第一音素字符和所述第一音调字符。5.根据权利要求4所述的方法,其特征在于,所述根据每个所述第二音素字符和对应的所述第二音调字符的字符位数,对所述第二音素字符和对应的所述第二音调字符进行对齐处理,包括:若所述第二音素字符和对应的所述第二音调字符的字符位数不同,则利用预设字符填充目标字符,其中,所述目标字符为所述第...

【专利技术属性】
技术研发人员:刘鹏飞蒋宁吴海英刘敏
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1