【技术实现步骤摘要】
歌唱语音合成方法及合成设备、计算机存储介质
本申请涉及语音合成
,特别是涉及一种歌唱语音合成方法及合成设备、计算机存储介质。
技术介绍
语音合成(TextToSpeech,TTS)是一种将文字转换为语音的技术,近年来由于深度学习等工具的发展,取得了较大进步并被广泛应用,从而导致歌唱语音合成(SingingVoiceSynthesis,SVS)随之受到更多关注,并逐渐成为虚拟偶像、语音助手以及诸多智能设备重要的功能之一。同时,歌唱语音合成很容易与其他人工智能技术结合,比如机器作曲、自动填词等,形成广阔的应用空间。随着多模态技术的进步,人工智能歌手越来越得到大众的欢迎。基于计算机的歌唱语音合成研究始于1950年代,传统的歌唱语音合成方法包括单元拼接和统计参数合成方法。目前一些广泛流行的歌唱语音合成方法仍然采用了有上下文依赖的隐马尔可夫模型,但是这些模型面临较严重的过平滑效应,且对于统计参数的建模能力有限,因此生成的歌唱语音在音色和自然度上相比真实歌唱效果大大折扣。
技术实现思路
本申请主要解决的技术问题是提供一种歌唱语音合成方法及合成设备、计算机存储介质,能够提高歌唱语音合成的准确性以及自然度。为解决上述技术问题,本申请采用的一个技术方案是:提供一种歌唱语音合成方法,所述方法包括:获取乐谱信息;对所述乐谱信息进行特征提取,以获得乐谱特征;对所述乐谱特征进行基频特征预测,以获得基频特征;结合所述基频特征对所述乐谱特征进行声学特征预测,以获得声学特征;根据所述声学特征得到合成后的歌唱 ...
【技术保护点】
1.一种歌唱语音合成方法,其特征在于,所述方法包括:/n获取乐谱信息;/n对所述乐谱信息进行特征提取,以获得乐谱特征;/n对所述乐谱特征进行基频特征预测,以获得基频特征;/n结合所述基频特征对所述乐谱特征进行声学特征预测,以获得声学特征;/n根据所述声学特征得到合成后的歌唱语音数据。/n
【技术特征摘要】
1.一种歌唱语音合成方法,其特征在于,所述方法包括:
获取乐谱信息;
对所述乐谱信息进行特征提取,以获得乐谱特征;
对所述乐谱特征进行基频特征预测,以获得基频特征;
结合所述基频特征对所述乐谱特征进行声学特征预测,以获得声学特征;
根据所述声学特征得到合成后的歌唱语音数据。
2.根据权利要求1所述的方法,其特征在于,所述结合所述基频特征对所述乐谱特征进行声学特征预测,以获得声学特征的步骤,包括:
将所述基频特征和所述乐谱特征进行融合处理,得到融合特征;
对所述融合特征进行声学特征预测,以获得所述声学特征。
3.根据权利要求1所述的方法,其特征在于,所述对所述乐谱特征进行基频特征预测,以获得基频特征的步骤,包括:
将所述乐谱特征输入预设的基频模型进行预测,以获得所述基频特征。
4.根据权利要求3所述的方法,其特征在于,预设的所述基频模型是混合高斯模型,包括第一编码模块以及第一解码模块;
所述第一编码模块对输入的所述乐谱特征进行编码,以获得所述乐谱特征的第一编码特征;
所述第一解码模块对所述第一编码特征进行解码,以预测每个高斯分布的参数,得到每个所述高斯分布的密度函数,然后将所有所述高斯分布的密度函数相加得到基频分布密度函数,而后根据所述基频分布密度函数得到所述基频特征。
5.根据权利要求3所述的方法,其特征在于,在所述获取乐谱信息的步骤之前,还包括:
获取训练数据,所述训练数据包括样本语音数据和对应的样本乐谱信息;
对所述样本语音数据进行特征提取,以获得样本基频特征;
对所述样本乐谱信息进行特征提取,以获得样本乐谱特征;
以所述样本乐谱特征作为输入,并以所述样本基频特征作为真值标签对所述基频模型进行训练。
6.根据权利要求1所述的方法,其特征在于,所述结合所述基频特征对所述乐谱特征进行声学特征预测,以获得声学特征的步骤,包括:
将所述乐谱特征和所述基频特征输入预设的声学模型进行预测,以获得所述声学特征。
7.根据权利要求6所述的方法,其特征在于,预设的所述声学模型包括第二编码模块以及第二解码模块;
所述第二编码模块对输入的所述乐谱特征进行编码,以获得所述乐谱特征的第二编码特征;
所述第二解码模块对所述第二编码特征和所述基频特征进行合并后的合并特征进行解码,以获得所述声学特征。
8.根据权利要求7所述的方法,其特征在于,预设的所述声学模型进一步包括下采样模块;
所述下采样模块对所述第二编码特征和所述基频特征进行合并后的所述合并特征进行下采样,以获得下采样后的下采样特征,而后所述第二解码模块对所述下采样特征进行解码,以获得所述声学特征。
9.根据权利要求6所述的方法,其特征在于,在所述获取乐谱信息的步骤...
【专利技术属性】
技术研发人员:殷锋,胡亚军,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。