音信号合成方法、生成模型的训练方法、音信号合成系统及程序技术方案

技术编号：30072815 阅读：26 留言：0更新日期：2021-09-18 08:26

通过计算机实现的音信号合成方法是生成控制数据，该控制数据包含表示与应该合成的音信号的音高相对应的音名的音名数据和表示该音高的八度的八度数据，通过向对包含表示与参照信号的音高相对应的音名的音名数据及表示所述音高的八度的八度数据在内的控制数据和表示所述参照信号的输出数据之间的关系进行了学习的生成模型输入所生成的所述控制数据，从而对表示所述音信号的输出数据进行推定。从而对表示所述音信号的输出数据进行推定。从而对表示所述音信号的输出数据进行推定。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】音信号合成方法、生成模型的训练方法、音信号合成系统及程序

[0001]本专利技术涉及将音信号进行合成的音源技术。

技术介绍

[0002]提出有专利文献1所示的NSynth、或者非专利文献1所示的NPSS(Neural Parametric Singing Synthesizer)等使用神经网络(下面，称为“NN”)而生成与条件输入相对应的声音波形的音源(下面，称为DNN(Deep Neural Network)音源)。NSynth与嵌入(embedding/嵌入向量)相应地，针对每个采样周期而生成音信号的样本。NPSS的Timbre模型与音调及定时信息相应地，针对每个帧而生成音信号的频谱。
[0003]专利文献1：美国专利第10068557号说明书
[0004]非专利文献1：Merlijn Blaauw,Jordi Bonada，、“A Neural Parametric Singing Synthesizer Modeling Timbre and Expression from Natural Songs”，Appl.Sci.2017，7，1313

技术实现思路

[0005]以往，作为表示音高的音高数据的形式而提出了one
‑
hot(独热)表达。one
‑
hot表达是通过与不同的音高相对应的n个(n为2以上的自然数)位而表达音高的方法。例如，在表达1个音高的one
‑
hot表达的向量中，将构成音高数据的n个位之中的与该音高相对应...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种音信号合成方法，其是由计算机实现的，生成控制数据，该控制数据包含表示与应该合成的音信号的音高相对应的音名的音名数据和表示该音高的八度的八度数据，通过向对包含表示与参照信号的音高相对应的音名的音名数据及表示该音高的八度的八度数据在内的控制数据和表示所述参照信号的输出数据之间的关系进行了学习的生成模型输入所生成的所述控制数据，从而对表示所述音信号的输出数据进行推定。2.根据权利要求1所述的音信号合成方法，其中，所生成的所述控制数据所包含的八度数据通过one
‑
hot表示所述音信号的音高的八度。3.根据权利要求1或2所述的音信号合成方法，其中，所生成的所述控制数据所包含的音名数据通过one
‑
hot表示与所述音信号的音高相对应的音名。4.根据权利要求1至3中任一项所述的音信号合成方法，其中，所述输出数据表示应该合成的音信号的波形谱。5.根据权利要求1至3中任一项所述的音信号合成方法，其中，所述输出数据表示应该合成的音信号的样本。6.一种生成模型的训练方法，其是由计算机实现的，准备某音高的参照信号、表示与该音高相对应的音名的音名数据、以及表示该音高的八度的八度数据，训练生成模型以与包含所述音名数据和所述八度数据在内的控制数据相应地生成表示所述参照信号的输出数据。7.一种音信号合成系统，其具有1个以上的处理器和1个以上的存储器，在该音信号合成系统中，所述1个以上的存储器对生成模型进行存储，该生成模型对包含表示与参照信号的...

【专利技术属性】
技术研发人员：西村方成，
申请(专利权)人：雅马哈株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人