【技术实现步骤摘要】
【国外来华专利技术】具有多级别文本信息的神经文本到语音合成
技术介绍
[0001]文本到语音(TTS)合成旨在基于文本输入来生成相应的语音波形。TTS合成广泛应用于例如故事中的角色扮演、语音到语音翻译、对特定用户的语音定制等。神经TTS系统被越来越多地用于实施TTS合成,并且正在成为人工智能(AI)领域近些年的研究热点。与需要前端文本语言特征提取的传统TTS技术不同,神经TTS系统可以是采用端到端结构来建立模型的,并且可以直接基于文本-语音数据对来进行训练。因此,神经TTS系统可以减轻对广泛领域专业知识的需求,并且还可以节省许多辛苦工作。神经TTS系统可以联合地优化语音的发音、韵律等,这将使得比传统TTS技术更自然的合成语音。
技术实现思路
[0002]提供本
技术实现思路
以便介绍一组构思,这组构思将在以下的具体实施方式中做进一步描述。本
技术实现思路
并非旨在标识所保护主题的关键特征或必要特征,也不旨在用于限制所保护主题的范围。
[0003]本公开的实施例提出用于通过神经TTS合成来生成语音的方法和装置。可以获得文本输入。可以基于所述文本输入来生成音素或字符级别文本信息。可以基于所述文本输入来生成上下文敏感文本信息。可以基于所述音素或字符级别文本信息和所述上下文敏感文本信息来生成文本特征。可以至少基于所述文本特征来生成与所述文本输入相对应的语音波形。
[0004]应当注意,以上一个或多个方面包括以下详细描述以及权利要求中具体指出的特征。下面的说明书及附图详细提出了所述一个或多个方面的某些说明性特征。这些特征仅仅指示可以实施各个方面的原 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于通过神经文本到语音(TTS)合成来生成语音的方法,包括:获得文本输入;基于所述文本输入来生成音素或字符级别文本信息;基于所述文本输入来生成上下文敏感文本信息;基于所述音素或字符级别文本信息和所述上下文敏感文本信息来生成文本特征;以及至少基于所述文本特征来生成与所述文本输入相对应的语音波形。2.根据权利要求1所述的方法,其中,所述音素或字符级别文本信息包括音素或字符嵌入向量序列,并且所述生成音素或字符级别文本信息包括:从所述文本输入中识别音素或字符序列;以及通过音素或字符嵌入模型,基于所述音素或字符序列来生成所述音素或字符嵌入向量序列。3.根据权利要求1所述的方法,其中,所述上下文敏感文本信息包括词语级别文本信息,并且所述生成上下文敏感文本信息包括生成所述词语级别文本信息。4.根据权利要求3所述的方法,其中,所述词语级别文本信息包括词语嵌入向量序列,并且所述生成词语级别文本信息包括:从所述文本输入中识别词语序列;以及通过词语嵌入模型,基于所述词语序列来生成所述词语嵌入向量序列。5.根据权利要求4所述的方法,其中,所述生成所述词语嵌入向量序列包括:对所述词语序列进行上采样以与所述文本输入的音素或字符序列对准;以及通过所述词语嵌入模型,基于经上采样的词语序列来生成所述词语嵌入向量序列。6.根据权利要求4所述的方法,其中,所述词语嵌入模型是基于神经机器翻译(NMT)的。7.根据权利要求3所述的方法,其中,所述生成文本特征包括:基于所述音素或字符级别文本信息和所述词语级别文本信息来生成所述文本特征。8.根据权利要求1所述的方法,其中,所述上下文敏感文本信息包括句子级别文本信息,并且所述生成上下文敏感文本信息包括生成所述句子级别文本信息。9.根据权利要求8所述的方法,其中,所述句子级别文本信息包括语法解析信息序列,并且所述生成句子级别文本信息包括:对所述文本输入执行语法解析,以获得所述文本输入的语法结构;以及基于所述语法结构来生成所述语法解析信息序列。10.根据权利要求9所述的方法,其中,所述生成所述语法解析信息序列包括:从所述语法结构中提取所述文本输入中每个词语的语法解析信息;对每个词语的所述语法解析信息进行上采样,以与所述文本输入的音素或字符序列中的相应音素或字符对准;以及将所述文本输入中所有词语的经上采样的语法解析信息组合成所述语法解析信息序列。11.根据权利要求10所述的方法,其中,每个词语的所述语法解析信息包括以下至少之一:对包含所述词语的至少一个短语的短语类型的指示;关于所述词语是否是所述至少一个短语的边界的指示;以及
对所述词语在所述至少一个短语中的相对位置的指示。12.根据权利要求8所述的方法,其中,所述生成文本特征包括:基于所述音素或字符级别文本信息和所述句子级别文本信息来生成所述文本特征。13.根据权利要求1所述的方法,其中,所述上下文敏感文本信息包括词语级别文本信息和句子级别文本信息二者,并且所述生成上下文敏感文本信息包括:生成所述词语级别文本信息;以及生成所述句子级别文本信息。14.根据权利要求13所述的方法,其中...
【专利技术属性】
技术研发人员:明怀平,何磊,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。