【技术实现步骤摘要】
语音合成相关方法、语流音变模型的训练方法及相关装置
[0001]本专利技术涉及语音合成领域,尤其涉及语音合成相关方法、语流音变模型的训练方法及相关装置。
技术介绍
[0002]TTS(text to speech,文本转语音,也称语音合成、文语转换)是指机器将语言从文字载体转换到声音载体的过程,是人机对话、智能播报等系统中的关键模块。随着相关技术的日趋成熟,各大厂商语音合成产品的竞争点逐步聚焦于所合成语音的自然度上。
[0003]然而,目前的合成语音中存在较强的机械音,严重影响使用者的使用感受,而机械音本质上主要由两类原因引起,一是韵律错误,如:应连读的未连读,不应连读的读成连读;二是语流音变错误,如:以汉语普通话为例,上声连读(例:“老虎”)第一个上声调应读为阳平调(二声),而依旧读了上声调(三声)。
[0004]现有的语音合成方法难以降低合成语音的机械音。
技术实现思路
[0005]本专利技术主要解决的技术问题是提供了语音合成相关方法、语流音变模型的训练方法及相关装置,以提高合成语音的自然 ...
【技术保护点】
【技术特征摘要】
1.一种语流音变模型的训练方法,其特征在于,包括:获取训练数据,其中,所述训练数据包括文本数据、所述文本数据的拼音标注数据及所述文本数据的音标流数据;将所述文本数据、所述文本数据的拼音标注数据及所述文本数据的音标流数据进行初始模型的训练,得到所述语流音变模型。2.根据权利要求1所述的语流音变模型的训练方法,其特征在于,所述语流音变模型的训练方法还包括:对所述文本数据进行韵律分析,并得到韵律分析后的分词结果;根据所述韵律分析后的分词结果及所述对应文本数据的音标流数据调整所述对应文本数据的音标流数据;将所述调整后的文本数据的音标流数据及对应所述文本数据、所述文本数据的拼音标注数据输入所述初始模型进行再训练,得到所述语流音变模型。3.一种语音合成的方法,其特征在于,包括:对待处理文本进行拼音标注,得到所述待处理文本的拼音标注信息;将所述待处理文本及所述待处理文本的拼音标注信息输入语流音变模型,得到所述待处理文本的第一音标流数据;基于所述第一音标流数据对所述待处理文本进行语音合成。4.根据权利要求3所述的语音合成的方法,其特征在于,所述语流音变模型是通过权利要求1或2所述的语流音变模型的训练方法训练得到的。5.根据权利要求3所述的语音合成的方法,其特征在于,所述方法还包括:对所述第一音标流数据进行韵律分析,并基于所述韵律分析的结果比对所述第一音标流数据;在所述韵律分析的结果对应的待处理文本的分词结果与所述第一音标流数据对应的待处理文本的分词结果不同时,将所述韵律分析的结果得到的第一音标流数据再输入所述语流音变模型中,得到第二音标流数据;基于所述第二音标流数据对所述待处理文本进行语音合成。6.根据权利要求5所述的语音合成的方法,其特征在于,所述对所述待处理文本进行韵律分析,并基于所述韵律分析的结...
【专利技术属性】
技术研发人员:白安琪,蒋宁,王洪斌,吴海英,赵立军,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。