声音合成方法、声音合成装置及程序制造方法及图纸

技术编号：24896443 阅读：33 留言：0更新日期：2020-07-14 18:21

声音合成装置具有：第1训练好的模型，其生成与包含音位的指定在内的控制数据相对应的谐波成分的频谱的时间序列；第2训练好的模型，其生成与所述控制数据相对应的非谐波成分的波形信号；以及合成处理部，其根据所述频谱的时间序列和所述波形信号而生成包含所述谐波成分和所述非谐波成分在内的声音信号。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】声音合成方法、声音合成装置及程序
本专利技术涉及对声音进行合成的技术。
技术介绍
以往提出了对任意音位的声音进行合成的各种声音合成技术。例如在专利文献1中公开了下述技术，即，利用神经网络合成歌唱声音。在非专利文献1的技术中，通过将针对乐曲的每个音符对音高、音位和发音期间进行指定的控制数据输入至神经网络，从而生成谐波成分的频谱的时间序列和非谐波成分的频谱的时间序列。通过对谐波成分的频谱和非谐波成分的频谱进行合成，从而生成表示歌唱声音的波形的时间区域的声音信号。非专利文献1：MerlijnBlaauw,JordiBonada,"ANEWRALPARATETRICSINGINGSYNTHESIZER,"arXiv,2017.4.12
技术实现思路
在非专利文献1的技术中，虽然能够对于歌唱声音的谐波成分而生成在听觉上自然的声音，但存在下述问题，即，难以对于气息成分或者摩擦音等非谐波成分而生成在听觉上自然的声音。考虑以上的情况，本专利技术的目的在于，对于谐波成分及非谐波成分这两者而生成与现实的人类声音接近的...

【技术保护点】
1.一种声音合成方法，其是通过计算机实现的，/n通过第1训练好的模型而生成与包含音位的指定在内的控制数据相对应的谐波成分的频谱的时间序列，/n通过第2训练好的模型而生成与所述控制数据相对应的非谐波成分的波形信号，/n根据所述频谱的时间序列和所述波形信号而生成包含所述谐波成分和所述非谐波成分在内的声音信号。/n

【技术特征摘要】
【国外来华专利技术】20171129 JP 2017-2290411.一种声音合成方法，其是通过计算机实现的，
通过第1训练好的模型而生成与包含音位的指定在内的控制数据相对应的谐波成分的频谱的时间序列，
通过第2训练好的模型而生成与所述控制数据相对应的非谐波成分的波形信号，
根据所述频谱的时间序列和所述波形信号而生成包含所述谐波成分和所述非谐波成分在内的声音信号。

2.根据权利要求1所述的声音合成方法，其中，
所述第1训练好的模型是针对每个第1单位期间输出所述谐波成分的频谱的神经网络，
所述第2训练好的模型是针对每个第2单位期间输出所述非谐波成分的时间区域的样本的神经网络，该第2单位期间比所述第1单位期间短。

3.根据权利要求1或2所述的声音合成方法，其中，
所述第1训练好的模型基于所述控制数据和该第1训练好的模型在过去生成的所述谐波成分的频谱的时间序列而生成时间轴上的各时刻的所述谐波成分的频谱。

4.根据权利要求1至3中任一项所述的声音合成方法，其中，
所述第2训练好的模型基于所述控制数据和该第2训练好的模型在过去生成的所述非谐波成分的多个样本而生成时间轴上的各时刻...

【专利技术属性】
技术研发人员：大道龙之介，清水正宏，
申请(专利权)人：雅马哈株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人