【技术实现步骤摘要】
本专利技术涉及基于神经编解码语言模型的老挝语韵律建模方法,属于自然语言处理。
技术介绍
1、老挝与中国比邻,开展老挝语的韵律建模研究对促进两国政策沟通有重要支撑近年来,语音合成模型在合成声音的自然度方面有了极大的提高,跳词复读的问题也得到了解决。因此,如何在合成语音中实现人类语音的表现力是一个研究热点,而让语音富有表现力的关键,就是对语音进行韵律建模。相较于中、英等语言,老挝语与它们的发音存在一定的区别,这使得老挝语的语音合成需要在音节及音调上准确建模。
2、韵律是语言中多种特征的融合,韵律建模内容可包括速度、音高、持续时间等等信息,主要使合成的语音更加拟人化。对于韵律建模任务,按照韵律调整的粒度可分为两类:(1)粗粒度:粗粒度为句子层面的迁移调控。(2)细粒度:细粒度为短语,单词层面的调控。目前,在大语种如英语、汉语等的韵律建模已经有了一些工作,但对于低资源语言老挝语仍然缺少相关的研究工作。
技术实现思路
1、本专利技术提供了基于神经编解码语言模型的老挝语韵律建模方法,以用于
...【技术保护点】
1.基于神经编解码语言模型的老挝语韵律建模方法,其特征在于:首先结合老挝语的语言特点,对老挝语进行字符转音素;其次使用速度控制曲线和音调控制曲线,实现了在速度和音调多种语言特点上的韵律建模;最后通过自回归架构和非自回归架构结合的方式对模型进行训练,使合成的语音在质量和推理速度之间取得一个平衡。
2.根据权利要求1所述的基于神经编解码语言模型的老挝语韵律建模方法,其特征在于:所述基于神经编解码语言模型的老挝语韵律建模方法的具体步骤如下:
3.根据权利要求2所述的基于神经编解码语言模型的老挝语韵律建模方法,其特征在于:所述Step5的具体步骤如下:
4.根...
【技术特征摘要】
1.基于神经编解码语言模型的老挝语韵律建模方法,其特征在于:首先结合老挝语的语言特点,对老挝语进行字符转音素;其次使用速度控制曲线和音调控制曲线,实现了在速度和音调多种语言特点上的韵律建模;最后通过自回归架构和非自回归架构结合的方式对模型进行训练,使合成的语音在质量和推理速度之间取得一个平衡。
2.根据权利要求1所述的基于神经编解...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。