The embodiment of the application provides a tremolo modeling method, device, computer equipment and storage medium. The method includes: acquiring song data of several songs, in which each song data includes a music score marked with lyrics and a voice recording consistent with the music score; extracting linguistic and musical features of the music score; extracting acoustic features of voice recording; extracting tremolo features of voice recording according to acoustic characteristics; and using hidden Markov model to make music score. With the input of linguistic and musical features and the output of acoustic and tremolo features of voice recordings, the tremolo model is trained. The embodiment of the application obtains the linguistic and musical features input to the music score by extracting the tremolo characteristics of the voice recording, and establishes and trains the tremolo model output to the acoustic and tremolo characteristics of the voice recording. The tremolo model can effectively retain the characteristics of tremolo to improve the naturalness of synthetic songs.
【技术实现步骤摘要】
颤音建模方法、装置、计算机设备及存储介质
本申请涉及人工智能
,尤其涉及一种颤音建模方法、装置、计算机设备及存储介质。
技术介绍
近年来,基于隐马尔可夫模型进行参数合成的歌曲合成方法在业界非常受关注。使用隐马尔可夫模型合成歌曲的最大优点是,在不需要庞大的歌唱数据库的情况下,可以有效的模拟不同的声音特征,歌唱风格,甚至是情绪。而颤音,作为一种重要的歌唱技巧,对合成歌曲的自然度有很大的影响。颤音在声学特征上的具体体现为基频上的小幅震动,颤音的具体时间点和强度因歌手而异。然而普通的隐马尔可夫模型会在训练和合成时平滑基频上的小幅度的起伏,如此会平滑掉颤音,导致合成的歌唱中并没有颤音的效果。
技术实现思路
本申请实施例提供一种颤音建模方法、装置、计算机设备及存储介质,可保留颤音特征,以提高合成歌曲的自然度。第一方面,本申请实施例提供了一种颤音建模方法,该方法包括:获取多首歌的歌曲数据,其中,每一首歌的歌曲数据包括一篇标有歌词的乐谱和一段与所述乐谱相符的清唱录音;提取所述乐谱的语言学特征和音乐特征;提取所述清唱录音的声学特征;根据所述声学特征提取所述清唱录音的颤音特征;基于隐马尔可夫模型,以所述乐谱的语言学特征和音乐特征为输入,以所述清唱录音的声学特征和颤音特征为输出,训练得到颤音模型。第二方面,本专利技术实施例提供了一种颤音建模装置,该颤音建模装置包括用于执行上述第一方面所述的方法对应的单元。第三方面,本专利技术实施例提供了一种计算机设备,所述计算机设备包括存储器,以及与所述存储器相连的处理器;所述存储器用于存储计算机程序,所述处理器用于运行所述存储器中存储的计算 ...
【技术保护点】
1.一种颤音建模方法,其特征在于,所述方法包括:获取多首歌的歌曲数据,其中,每一首歌的歌曲数据包括一篇标有歌词的乐谱和一段与所述乐谱相符的清唱录音;提取所述乐谱的语言学特征和音乐特征;提取所述清唱录音的声学特征;根据所述声学特征提取所述清唱录音的颤音特征;基于隐马尔可夫模型,以所述乐谱的语言学特征和音乐特征为输入,以所述清唱录音的声学特征和颤音特征为输出,训练得到颤音模型。
【技术特征摘要】
1.一种颤音建模方法,其特征在于,所述方法包括:获取多首歌的歌曲数据,其中,每一首歌的歌曲数据包括一篇标有歌词的乐谱和一段与所述乐谱相符的清唱录音;提取所述乐谱的语言学特征和音乐特征;提取所述清唱录音的声学特征;根据所述声学特征提取所述清唱录音的颤音特征;基于隐马尔可夫模型,以所述乐谱的语言学特征和音乐特征为输入,以所述清唱录音的声学特征和颤音特征为输出,训练得到颤音模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:提取待合成歌曲的乐谱的语言学特征和音乐特征;将提取的语言学特征和音乐特征输入到训练好的颤音模型中,以得到与所述待合成歌曲的乐谱相符的清唱录音的声学特征和颤音特征;在所得到的声学特征中加入所得到的颤音特征;将加入了颤音特征的声学特征输入声码器,以合成歌曲。3.根据权利要求1所述的方法,其特征在于,所述声学特征包括基频,所述根据所述声学特征提取所述清唱录音的颤音特征,包括:定位所述基频所对应的基频序列中的颤音片段;计算所述颤音片段的振幅和频率,将计算出的所述颤音片段的振幅和频率作为所述颤音片段中每一帧的颤音特征。4.根据权利要求3所述的方法,其特征在于,所述定位所述基频所对应的基频序列中的颤音片段,包括:检测所述基频序列中连续出现波谷或者波峰的次数是否达到预设次数;若达到预设次数,获取所对应的基频序列片段,并统计该基频序列片段中的平均频率;检测预设次数中每次频率由波谷到波峰或者频率由波峰到波谷的过程中,波谷所对应的频率是否小于平均频率,且波峰所对应的频率是否大于平均频率;若每次波谷所对应的频率小于平均频率,且波峰所对应的频率大于平均频率,确定该基频序列片段为颤音片段;否则,确定该基频序列片段为非颤音片段。5.根据权利要求3所述的方法,其特征在于,所述定位所述基频所对应的基频序列中的颤音片段,包括:对所述基频序列中的基频序列片段做短时距傅里...
【专利技术属性】
技术研发人员:朱清影,程宁,王健宗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。