【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种高表现力歌唱声音合成模型训练方法、合成方法及装置。
技术介绍
1、歌声既是一种人们借以传达信息的媒介,也是一种传达创作者、歌唱者思绪的艺术形式。随着人工智能及计算机技术的不断发展,高表现力的歌声合成技术是人工智能必不可少的一个研究课题,同时也是现在计算机音乐的热门研究领域之一。
2、现阶段的歌声合成系统可以通过输入歌词和乐谱中的音高和持续时间,来合成自然的歌声。但是,在高表现力歌声合成任务中,需要对歌声进行四个方面的控制来实现高表现力的歌声生成:旋律,强度,节奏和音色。目前的高表现力歌声合成系统缺乏对歌声强度的建模与控制,若用户想细粒度的操作歌声的上述属性,较为困难。
3、现有的歌声合成技术方案包括声学模型和声码器两部分组成,其中声学模型由文本编码器,乐谱编码器,编码器,变量适配器,长度约束器和梅尔编码器构成。文本编码器和乐谱编码器读取歌词,对音高和持续时间进行初步建模,编码器对建模得到的音高和持续时间进一步编码。变量适配器从四个方面对合成歌声进行控制:音色,感情,音高,能量,
...【技术保护点】
1.一种高表现力歌唱声音合成模型训练方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的高表现力歌唱声音合成模型训练方法,其特征在于,获取待合成的歌词文本,以及由真实歌声预测得到的乐谱序列,所述乐谱序列采用乐器数字接口格式。
3.根据权利要求1所述的高表现力歌唱声音合成模型训练方法,其特征在于,根据每个字的基频计算其谐波能量,包括:
4.根据权利要求1所述的高表现力歌唱声音合成模型训练方法,其特征在于,将每个字的时间平均谐波能量预处理后映射至预设范围,包括:
5.根据权利要求1所述的高表现力歌唱声音合成模型
...【技术特征摘要】
1.一种高表现力歌唱声音合成模型训练方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的高表现力歌唱声音合成模型训练方法,其特征在于,获取待合成的歌词文本,以及由真实歌声预测得到的乐谱序列,所述乐谱序列采用乐器数字接口格式。
3.根据权利要求1所述的高表现力歌唱声音合成模型训练方法,其特征在于,根据每个字的基频计算其谐波能量,包括:
4.根据权利要求1所述的高表现力歌唱声音合成模型训练方法,其特征在于,将每个字的时间平均谐波能量预处理后映射至预设范围,包括:
5.根据权利要求1所述的高表现力歌唱声音合成模型训练方法,其特征在于,将所述混合嵌入向量依次输入所述transformer和所述连续语音单元表征模块,生成连续语音单元向量之后...
【专利技术属性】
技术研发人员:王风平,李雅,娄帆,
申请(专利权)人:上海艾特欧数字娱乐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。