信息处理方法及信息处理系统技术方案

技术编号：28880974 阅读：15 留言：0更新日期：2021-06-15 23:18

信息处理系统具有合成处理部，该合成处理部将表示歌唱者的歌唱者数据、表示歌唱风格的风格数据和表示歌唱条件的合成数据输入至通过机器学习而生成的合成模型，由此基于该发音风格及发音条件而生成表示应该由歌唱者发音的目标音的音响特征的特征数据。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】信息处理方法及信息处理系统
本专利技术涉及对语音等音响进行合成的技术。
技术介绍
以往提出了对任意音位的语音进行合成的语音合成技术。例如在专利文献1中公开了片段连接型的语音合成技术，其通过将多个语音片段之中的与目标的音位相应地选择出的语音片段相互地连接，从而生成音(以下称为“目标音”)。专利文献1：日本特开2007－240564号公报
技术实现思路
近年的语音合成技术中，要求对由多样的发声者通过多样的发音风格发音的目标音进行合成。但是，为了通过片段连接型的语音合成技术应对以上的要求，需要针对发声者和发音风格的每个组合而单独地准备多个语音片段的集合。因此，存在为了准备语音片段而需要过大的工作量这样的问题。考虑以上的情况，本专利技术的一个方式的目的在于，不需要语音片段，生成使发音源(例如发声者)和发音风格的组合存在差异的多样的目标音。为了解决以上的课题，本专利技术的一个方式所涉及的信息处理方法将表示发音源的发音源数据、表示发音风格的风格数据和表示发音条件的合成数据输入至通过机器学习而生成的合成模型，由此基于所述发音风格及所述发音条件而生成表示应该由所述发音源进行发音的目标音的音响特征的特征数据。本专利技术的一个方式所涉及的信息处理系统具有合成处理部，该合成处理部将表示发音源的发音源数据、表示发音风格的风格数据和表示发音条件的合成数据输入至通过机器学习而生成的合成模型，由此基于所述发音风格及所述发音条件而生成表示应该由所述发音源进行发音的目标音的音响特征的特征数据。本专利...

【技术保护点】
1.一种信息处理方法，其是通过计算机实现的信息处理方法，/n将表示发音源的发音源数据、表示发音风格的风格数据和表示发音条件的合成数据输入至通过机器学习而生成的合成模型，由此基于所述发音风格及所述发音条件而生成表示应该由所述发音源进行发音的目标音的音响特征的特征数据。/n

【技术特征摘要】
【国外来华专利技术】20181106 JP 2018-2092881.一种信息处理方法，其是通过计算机实现的信息处理方法，
将表示发音源的发音源数据、表示发音风格的风格数据和表示发音条件的合成数据输入至通过机器学习而生成的合成模型，由此基于所述发音风格及所述发音条件而生成表示应该由所述发音源进行发音的目标音的音响特征的特征数据。

2.根据权利要求1所述的信息处理方法，其中，
所述发音条件包含针对每个音符的音高。

3.根据权利要求1或2所述的信息处理方法，其中，
所述发音条件包含所述目标音的音位。

4.根据权利要求1至3中任一项所述的信息处理方法，其中，
向所述合成模型输入的所述发音源数据是与不同的发音源相对应的多个发音源数据之中的由利用者选择出的发音源数据。

5.根据权利要求1至4中任一项所述的信息处理方法，其中，
向所述合成模型输入的风格数据是与不同的发音风格相对应的多个风格数据之中的由利用者选择出的风格数据。

6.根据权利要求1至5中任一项所述的信息处理方法，其中，
所述信息处理方法还通过将表示新发音源的新发音源数据、表示与所述新发音源相对应的发音风格的风格数据和表示由所述新发音源进行的发音的发音条件的新合成数据输入至所述合成模型，由此基于所述新发音源的发音风格及由所述新发音源进行的发音的发音条件而生成表示由所述新发音源进行发音的音响的音响特征的新特征数据，
对所述新发音源数据及所述合成模型进行更新，以使得与基于所述新合成数据所表示的发音条件而由所述新发音源发音出的音响相关的已知特征数据和所述新特征数据的差异减少。

【专利技术属性】
技术研发人员：大道龙之介，梅利因·布洛乌，若尔迪·博纳达，
申请(专利权)人：雅马哈株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人