声音合成方法和装置、词典构筑方法和计算机可读媒体制造方法及图纸

技术编号：2885550 阅读：217 留言：0更新日期：2012-04-11 18:40

设定讲话者或进话时的感情、状况或讲话内容中至少一个不同的多个声音合成处理任务（Ｓ１），构筑与各任务对应的单词词典、韵律词典和波形词典（Ｓ２），在由游戏系统等输入要合成的字符串及指定任务时采用该指定任务的单词词典、韵律词典和波形词典进行声音合成处理（Ｓ３），由此可生成反映讲话者个性和讲话时的感情、状况、讲话内容的声音信息。（*该技术在2020年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及适用于视频游戏等的声音合成方法、用于声音合成的词典构筑方法、声音合成装置及记录声音合成程序的计算机可读媒体。近年来，随着电话报时、银行ATM声音引导之类需反复输出声音信息(人所讲的言词)的服务的普及和各种电气制品等人机界面要求的提高，希望由机械输出声音信息的需求增大。作为以往输出声音信息的方法，有一种真人朗读预定的引导词或文章并把它预先存储在存储装置中，然后在所需场面原样重现加以输出的方法(下文称为记录重现法)。还有一种在存储装置中存储与构成声音信息的各种词对应的声音数据，然后根据任意输入的字符串(文本)，组合该声音数据加以输出的方法(所谓声音合成方法)。在上述记录重现方法中，可输出高品质的声音信息。但另一方面，也有不能输出确定的引导词和文章以外的声音信息，而且需要容量与引导词和文章数量成比例的存储装置这些缺陷。另一方面，在声音合成方法中，可输出对应于任意输入的字符串，即对应于任意词的声音信息，且与上述记录重现方法相比，其需要的存储容量也小。但是，存在有些字符串变成留有不自然感的声音信息这样的缺陷。可是，在近来视频游戏中，随着游戏机主体性能的提高和存储媒体存储容量的增加，游戏中登场角色的声音信息与BGM和效果音一起输出的可能性增大。这时，在视频游戏这种娱乐性高的场合，强烈希望每个游戏角色输出音质不同的声音信息，而且输出反映讲话时感性、状况的声音信息。进而，也迫切希望由游戏角色念游戏者任意输入、设定的游戏者角色姓名(称呼)。如果要用上述的记录重现方法实现适合上述希望的声音信息输出，则必须对游戏者任意输入、设定的游戏者角色姓名(称呼)这种遍...

【技术保护点】
一种采用单词词典、韵律词典和波形词典生成声音信息的声音合成方法，其特征在于，该方法包括下述步骤：设定讲话者或讲话时感情、状况或讲话内容中至少一个不同的多个声音合成处理任务；至少构筑与各任务对应的韵律词典和波形词典；在与任务指定的同时输入要合成的字符串时，用与该任务对应的单词词典、韵律词典和波形词典进行声音合成处理。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：笠井治，溝口稔幸，
申请(专利权)人：科乐美股份有限公司，科乐美东京电脑娱乐股份有限公司，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人