音信号合成方法、生成模型的训练方法、音信号合成系统及程序技术方案

技术编号：30072805 阅读：29 留言：0更新日期：2021-09-18 08:26

由计算机实现的音信号合成方法，对包含与多个音名相对应的多个音名数据在内的音高数据的由应该合成的音信号的音名确定的音名数据，分别对与从其音信号的音高的其音名起的偏差相对应的热值进行设定，使用生成模型，对表示与所设定的音高数据相对应的音信号的输出数据进行推定，与推定出的输出数据相应地将音信号进行合成。信号进行合成。信号进行合成。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】音信号合成方法、生成模型的训练方法、音信号合成系统及程序

[0001]本专利技术涉及将音信号进行合成的音源技术。

技术介绍

[0002]提出有专利文献1所示的NSynth、或者非专利文献1所示的NPSS(Neural Parametric Singing Synthesizer)等使用神经网络(下面，称为“NN”)而生成与条件输入相对应的声音波形的音源(下面，称为“DNN(Deep Neural Network)音源”)。NSynth与嵌入(embedding/嵌入向量)相应地，针对每个采样周期而生成音信号的样本。NPSS的Timbre模型与音调及定时信息相应地，针对每个帧而生成音信号的频谱。
[0003]专利文献1：美国专利第10068557号说明书
[0004]非专利文献1：Merlijn Blaauw,Jordi Bonada，、“A Neural Parametric Singing Synthesizer Modeling Timbre and Expression from Natural Songs”，Appl.Sci.2017，7，1313

技术实现思路

[0005]在专利文献1的Nsynth或者非专利文献1的NPSS等DNN音源中，通过对期望的1个音阶进行指定的音高数据，对所要合成的音信号的音高进行控制。没有考虑关于从音调包络或者颤音(vibrato)等对音符等进行指定的音阶起的音高的动态偏移进行控制
[0006]在DNN音源的训练阶段，将音高数据作为输入，对...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种音信号合成方法，其是由计算机实现的，生成表示应该合成的第1音信号的音高的第1音高数据，使用对表示第2音信号的音高的第2音高数据和所述第2音信号之间的关系进行了学习的生成模型，对表示与所述第1音高数据相对应的所述第1音信号的输出数据进行推定，在该音信号合成方法中，所述第1音高数据包含与不同的音名相对应的多个音名数据，在所述第1音高数据的生成时，将所述多个音名数据之中的与所述第1音信号的音高相对应的音名数据设定为与该音名数据相对应的音名的基准音高和该第1音信号的音高之间的差异所对应的热值。2.根据权利要求1所述的音信号合成方法，其中，在所述第1音高数据的生成时，将所述多个音名数据之中的除了与所述第1音信号的音高相对应的音名数据以外的音名数据设定为表示与所述第1音信号的音高无关的冷值。3.根据权利要求1或2所述的音信号合成方法，其中，所述第1音信号的音高动态地变化，所述第1音高数据表示在所述第1音信号中动态地变化的音高。4.根据权利要求1至3中任一项所述的音信号合成方法，其中，所述第2音信号的音高动态地变化，所述第2音高数据表示在所述第2音信号中动态地变化的音高，所述生成模型是使用所述第2音信号和所述第2音高数据进行训练的。5.根据权利要求1至3中任一项所述的音信号合成方法，其中，所述第1音信号的音高在与一个音名相对应的发音期间内动态地变化，在与所述第1音信号的音高相对应的音名数据中设定的热值与该音高相应地变化。6.根据权利要求1至5中任一项所述的音信号合成方法，其中，与所述第1音信号的音高相对应的音名数据，是与不同的音名相对应的多个单位范围之中的与包含该音高的1个单位范围相对应的音名的音名数据。7.根据权利要求1至5中任一项所述的音信号合成方法，其中，与所述第1音信号的音高相对应的音名数据，是与不同的音名相对应的多个基准音高之中的、与隔着该音高的2个基准音高分别对应的2个音名数据。8.根据权利要求1至5中任一项所述的音信号合成方法，其中，与所述第1音信号的音高相对应的音名数据，是与不同的音名相对应的多个基准音高之中的、与该音高接近的N个基准音高分别所对应的N个音名数据，其中，N为1...

【专利技术属性】
技术研发人员：西村方成，
申请(专利权)人：雅马哈株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人