语音合成装置和方法制造方法及图纸

技术编号：3047213 阅读：176 留言：0更新日期：2012-04-11 18:40

公开了一种语音合成装置和一种语音合成方法，用于根据输入其中的文本数据合成语音，以输出由记录的语音部分和具有与记录的语音部分一致的回声特性的合成的语音部分组成的语音，其中具有回声特性的合成的语音部分在幅值上比记录的语音部分实质上大，以减少由于记录的语音部分和合成的语音部分之间音质的不同引起的奇怪的感觉。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种语音合成装置和一种语音合成方法，用于根据输入其中的文本数据合成语音，尤其涉及这样一种语音合成装置和一种语音合成方法，用于根据输入其中的文本数据合成语音，以输出由记录的语音部分和合成的语音部分组成的语音，该合成的语音部分具有与记录的语音部分一致的回声特性，以减少由于记录的语音部分和合成的语音部分之间音质的不同引起的奇怪的感觉。
技术介绍
近年来，已经发展和使用了各种的语音合成装置用于根据输入其中的文本数据合成语音。该类型的语音合成装置通常包括一个数据库，其工作以便将某种语言中的语音分为多个语音段，每个至少包括该语言中的一个音素，将每个语音段分解为多个音调波形，将这些音调波形与每个语音段相关联，然后在数据库中存储与这些音调波形相联系的每个语音段。当合成语音时，使用在数据库中与每个语音段相联系而存储的音调波形。例如，一个这样的传统语音合成装置被公开在日本专利申请公开出版物No.27789/1993中。参考附图中的图5，其示出了一种传统的语音合成装置500，包括文本输入单元501、文本判断单元502、合成方法选择单元503、合成单元504、再现单元505、语音叠加单元506和输出单元507。文本输入单元501适于输入文本数据。文本判断单元502适于分解文本数据，例如，将由文本输入单元501输入的“This is a pen”分解为多个文本数据元素，例如“This”、“is”、“a”和“pen”，并分析每个文本数据元素。合成方法选择单元503适于基于由文本判断单元502进行的分析从合成方法和再现方法中选择每个文本数据元素的合成方法。然后，合成方...

【技术保护点】
一种语音合成装置，用于根据输入其中的文本数据合成语音，该装置包括：文本存储单元，用于在其中存储多个记录的文本数据元素；语音部分存储单元，用于在其中存储分别对应于所述记录的文本数据元素的多个记录的语音部分；语音段存储单元，用于存储多个语音段；文本输入单元，用于输入所述文本数据；判断单元，用于将由所述文本输入单元输入的所述文本数据分解为多个文本数据元素，一个文本数据元素接一个地判断是否所述文本数据元素与存储在所述文本存储单元中的所述记录的文本数据元素的任一个一致；拆分单元，用于基于所述判断单元的判断结果，将所述文本数据元素拆分为由记录的文本部分和未记录的文本部分组成的两个文本部分，所述记录的文本部分包括与存储在所述文本存储单元中的所述文本数据元素一致的记录的文本数据元素，所述未记录的文本部分包括与未存储在所述文本存储单元中的所述文本数据元素一致的未记录的文本数据元素；记录的语音装载单元，用于输入由所述拆分单元拆分的包括与所述文本数据元素一致的所述记录的文本数据元素的所述记录的文本部分，并从存储在所述语音部分存储单元中的记录的语音部分中...

【技术特征摘要】
【国外来华专利技术】JP 2000-11-29 363394/001.一种语音合成装置，用于根据输入其中的文本数据合成语音，该装置包括文本存储单元，用于在其中存储多个记录的文本数据元素；语音部分存储单元，用于在其中存储分别对应于所述记录的文本数据元素的多个记录的语音部分；语音段存储单元，用于存储多个语音段；文本输入单元，用于输入所述文本数据；判断单元，用于将由所述文本输入单元输入的所述文本数据分解为多个文本数据元素，一个文本数据元素接一个地判断是否所述文本数据元素与存储在所述文本存储单元中的所述记录的文本数据元素的任一个一致；拆分单元，用于基于所述判断单元的判断结果，将所述文本数据元素拆分为由记录的文本部分和未记录的文本部分组成的两个文本部分，所述记录的文本部分包括与存储在所述文本存储单元中的所述文本数据元素一致的记录的文本数据元素，所述未记录的文本部分包括与未存储在所述文本存储单元中的所述文本数据元素一致的未记录的文本数据元素；记录的语音装载单元，用于输入由所述拆分单元拆分的包括与所述文本数据元素一致的所述记录的文本数据元素的所述记录的文本部分，并从存储在所述语音部分存储单元中的记录的语音部分中，选择性地装载分别对应于所述记录的文本部分的所述记录的文本数据元素的记录的语音部分；语音合成单元，用于输入由所述拆分单元拆分的包括与所述文本数据元素一致的所述未记录的文本数据元素的所述未记录的文本部分，并根据所述未记录的文本部分的所述未记录文本数据元素合成在所述语音段存储单元中存储的所述语音段，以产生合成的语音部分；回声特性赋予单元，用于将与存储在所述语音部分存储单元中的所述记录的语音部分的回声特性一致的回声特性，赋予由所述语音合成单元产生的所述合成的语音部分，从而构造具有所述回声特性的合成的语音部分；语音叠加单元，用于叠加由所述记录的语音装载单元装载的所述记录的语音部分和由所述回声特性赋予单元构造的具有所述回声特性的所述合成的语音部分，以产生由所述记录的语音部分和具有所述回声特性的所述合成的语音部分组成的所述语音；和语音输出单元，用于输出由所述记录的语音部分和具有回声特性的所述合成的语音部分组成的所述语音。2.如权利要求1所述的语音合成装置，还包括噪声测量单元，用于测量可听见地输出所述语音的环境中的噪声电平，其中所述回声特性赋予单元还包括幅值调节单元，用于基于由所述噪声测量单元测量的所述噪声电平和由所述记录的语音装载单元装载的所述记录的语音部分的幅值，调节由所述回声特性赋予单元构造的具有所述回声特性的所述合成的语音部分的幅值，使得具有所述回声特性的所述合成的语音部分在幅值上与所述噪声电平成比例地比所述记录的语音部分实质上大；从而所述语音叠加单元被操作以叠加由所述记录的语音装载单元装载的所述记录的语音部分和由所述幅值调节单元调节的具有所述回声特性的所述合成的语音部分，以便产生由包括所述记录的语音部分和具有回声特性的所述合成的语音部分的所述语音部分组成的所述语音。3.如权利要求1或2所述的语音合成装置，其中所述语音段存储单元被操作以存储多个语音段，每个语音段至少包括一个音素，且可拆分为多个音调波形，所述语音段被分别在所述音素上与所述音调波形相关联，且所述语音合成单元被操作以便根据由所述拆分单元拆分的所述未记录的文本部分的所述未记录的...

【专利技术属性】
技术研发人员：野敏幸，西村洋文，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人