声音合成装置制造方法及图纸

技术编号：11182701 阅读：53 留言：0更新日期：2015-03-25 11:56

得到能够制作高质量的合成声音的声音合成装置。候补声音片段系列制作部（1）针对输入语言信息系列（101），使用声音片段数据库（4）的DB声音片段（105）来制作候补声音片段系列（102）。输出声音片段系列决定部（2）使用表示与输入语言信息系列（101）、和表示候补声音片段系列（102）中的多个候补声音片段各自的属性的声音参数的共生条件（106）对应的值的参数（107），来计算候补声音片段系列（102）适合于输入语言信息系列（101）的程度，根据适合的程度，决定输出声音片段系列（103）。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及与输入语言信息的时间系列对应地从声音片段合成声音来生成合成声音的声音合成装置。
技术介绍
在基于大容量的声音数据库的声音合成方式中，提出了通过代替组合了根据预期的知识决定的物理性的参数的尺度，而将基于在声音识别等中使用的HMM（Hidden Markov Model，隐马尔可夫模型）的统计性的似然度用作尺度，从而一并具有基于依照HMM的合成方式的概率尺度的合理性和声音质量的均匀性的优点、和基于大容量的声音数据库的声音合成方式的高质量这样的优点的、以实现高质量并且均质的合成声音为目的的声音合成方法（参照例如专利文献1）。在专利文献1中，使用表示按照音韵输出每个状态迁移的音响参数（线性预测系数、倒谱等）系列的概率的音响模型、和表示按照韵律输出每个状态迁移的韵律参数（基本频率等）系列的概率的韵律模型，通过与构成针对输入文本的音韵系列的各音韵对应的每个状态迁移的音响参数系列的音响上的似然度、和与构成针对输入文本的韵律系列的各韵律对应的每个状态迁移的韵律参数系列的韵律上的似然度，计算声音片段成本，选择声音片段。【专利文献1】日本特开2004-233774号公报
技术实现思路
但是，在上述那样的以往的声音合成方法中，对于声音片段的选择，难以决定如何决定按照音韵，得不到恰当的按照音韵的音响模型，存在无法恰当地求出输出音响参数系列的概率这样的问题。另外，关于韵律，也同样地

【技术保护点】
一种声音合成装置，其特征在于，具备：候补声音片段系列制作部，针对作为所输入的声音单位的时间系列的输入语言信息系列，参照积蓄声音片段的时间系列的声音片段数据库来制作候补声音片段系列；输出声音片段决定部，使用表示与所述输入语言信息系列、和表示所述候补声音片段系列中的多个候补声音片段各自的属性的声音参数的共生条件对应的值的参数，来计算所述候补声音片段系列适合于所述输入语言信息系列的程度，根据所述适合的程度，决定输出声音片段系列；以及波形片段连接部，连接与所述输出声音片段系列对应的所述声音片段来制作声音波形。

【技术特征摘要】
2013.09.25 JP 2013-1982521.一种声音合成装置，其特征在于，具备：
候补声音片段系列制作部，针对作为所输入的声音单位的时间系
列的输入语言信息系列，参照积蓄声音片段的时间系列的声音片段数
据库来制作候补声音片段系列；
输出声音片段决定部，使用表示与所述输入语言信息系列、和表
示所述候补声音片段系列中的多个候补声音片段各自的属性的声音
参数的共生条件对应的值的参数，来计算所述候补声音片段系列适合
于所述输入语言信息系列的程度，根据所述适合的程度，决定输出声
音片段系列；以及
波形片段连接部，连接与所述输出声音片段系列对应的所述声音
片段来制作声音波形。
2.根据权利要求1所述的声音合成装置，其特征在于，
所述输出声音片段系列决定部将所述声音片段数据库中的所述
声音片段的时间系列视作所述输入语言信息系列，制作与相应视作的
时间系列对应的多个候补声音片段系列，使用以下方案中的至少某一
个来计算：在相应制作了的多个候补声音片段系列中、与所述视作的
时间系列相同的系列的情况下，使所述参数成为大的值，或者，在是
与所述视作的时间系列不同的系列的情况下，使所述参数成为小的
值。
3.根据权利要求1所述的声音合成装置，其特征在于，
所述输出声音片段系列决定部将所述声音片段数据库中的所述
声音片段的时间系列视作所述输入语言信息系列，制作与相应视作的
时间系列对应的多个候补声音片段系列，在相应制作了的多个候补声
音片段系列中、所述视作的时间系列中的各个声音片段的...

【专利技术属性】
技术研发人员：大塚贵弘，川岛启吾，古田训，山浦正，
申请(专利权)人：三菱电机株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人