声音合成方法和装置、词典构筑方法和计算机可读媒体制造方法及图纸

技术编号:2885550 阅读:217 留言:0更新日期:2012-04-11 18:40
设定讲话者或进话时的感情、状况或讲话内容中至少一个不同的多个声音合成处理任务(S1),构筑与各任务对应的单词词典、韵律词典和波形词典(S2),在由游戏系统等输入要合成的字符串及指定任务时采用该指定任务的单词词典、韵律词典和波形词典进行声音合成处理(S3),由此可生成反映讲话者个性和讲话时的感情、状况、讲话内容的声音信息。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及适用于视频游戏等的声音合成方法、用于声音合成的词典构筑方法、声音合成装置及记录声音合成程序的计算机可读媒体。近年来,随着电话报时、银行ATM声音引导之类需反复输出声音信息(人所讲的言词)的服务的普及和各种电气制品等人机界面要求的提高,希望由机械输出声音信息的需求增大。作为以往输出声音信息的方法,有一种真人朗读预定的引导词或文章并把它预先存储在存储装置中,然后在所需场面原样重现加以输出的方法(下文称为记录重现法)。还有一种在存储装置中存储与构成声音信息的各种词对应的声音数据,然后根据任意输入的字符串(文本),组合该声音数据加以输出的方法(所谓声音合成方法)。在上述记录重现方法中,可输出高品质的声音信息。但另一方面,也有不能输出确定的引导词和文章以外的声音信息,而且需要容量与引导词和文章数量成比例的存储装置这些缺陷。另一方面,在声音合成方法中,可输出对应于任意输入的字符串,即对应于任意词的声音信息,且与上述记录重现方法相比,其需要的存储容量也小。但是,存在有些字符串变成留有不自然感的声音信息这样的缺陷。可是,在近来视频游戏中,随着游戏机主体性能的提高和存储媒体存储容量的增加,游戏中登场角色的声音信息与BGM和效果音一起输出的可能性增大。这时,在视频游戏这种娱乐性高的场合,强烈希望每个游戏角色输出音质不同的声音信息,而且输出反映讲话时感性、状况的声音信息。进而,也迫切希望由游戏角色念游戏者任意输入、设定的游戏者角色姓名(称呼)。如果要用上述的记录重现方法实现适合上述希望的声音信息输出,则必须对游戏者任意输入、设定的游戏者角色姓名(称呼)这种遍及几千至几万词全部进行声音收录、重现。为此,收录所需时间和费用、必需的存储装置容量变得十分庞大,事实上,不可能实施。另一方面,用声音合成方法,任意输入、设定的游戏者角色姓名发声比较容易。但,以往的声音合成方法仅以产生明了的自然声音信息为目标,因而根本不能合成与讲话人的个性、讲话时的感性和状况相应的声音信息,即不能根据每个游戏角色输出音质不同的声音信息,不能输出反映游戏角色的感情、状况的声音信息。本专利技术的目的在于提供一种适合视频游戏这种娱乐性高的用途且能产生与讲话者的个性、讲话时的感情和状况或各种讲话内容相应的声音信息的声音合成方法,用于声音合成的词典构筑方法,声音合成装置及记录声音合成程序的计算机可读媒体。为了达到上述目的,本专利技术的一种采用单词词典、韵律词典和波形词典生成声音信息的声音合成方法,该方法包括下述步骤设定讲话者或讲话时感情、状况或讲话内容中至少一个不同的多个声音合成处理作业单位(下文称为任务);至少构筑与各任务对应的韵律词典和波形词典;在与任务指定的同时输入要合成的字符串时,用与该任务对应的单词词典、韵律词典和波形词典进行声音合成处理。根据本专利技术,声音合成处理分成多个讲话者,讲话时的多个感情、状况,多个讲话内容等任务,每个任务构筑词典进行声音合成,因此易于产生与讲话者个性、讲话时的感情与状况、讲话内容对应的声音信息。上述多个任务中的每个任务的词典,由下述步骤构筑生成与任务对应的单词词典;从单词词典的全部单词中选出可成为模型的字符串生成声音收录脚本;按照声音收录脚本收录讲话者的声音;由所述收录的声音构筑韵律词典和波形词典;对各任务进行上述步骤。上述每个任务的词典由下述步骤构筑生成与任务对应的单词词典和单词变形现则;按照与所述任务对应的单词变形规则,对与任务对应的单词词典中包含的全部单词进行变形处理;从经变形处理的单词词典中的全部单词选出可成为模型的字符串生成声音收录脚本;根据声音收录脚本收录讲话者的声音;从所述收录的声音构筑韵律词典和波形词典;对各任务进行上述步骤。每个上述任务的词典由下述步骤构筑生成与任务对应的单词变形规则;按照与任务对应的单词变形规则,对单词词典所包含的全部单词进行变形处理;从经变形处理的单词词典中的全部单词选出可成为模型的字符串生成声音收录脚本;根据声音收录脚本收录讲话者的声音;从所述收录的声音构筑韵律词典和波形词典;对各任务进行上述步骤。根据本专利技术,可简单生成与任务相应的声音收录脚本,根据该脚本收录声音构筑各词典,进行字符串变形处理,由此,可不增加词典容量,易于生成含多样表现内容的声音信息。采用这些词典的声音合成方法包括下述步骤根据与要合成的字符串一起输入的任务指定,切换单词词典、韵律词典和波形词典;采用切换后的单词词典、韵律词典和波形词典,对与要合成的字符串对应的声音信息进行合成处理。这时,在各词典是收录许多至少含一个字符的单词及其语调类型的单词词典、收录表示对收录于所述单词词典中的单词的韵律的韵律模型数据中的代表性韵律数据的韵律词典、把收录声音作为合成单位的声音数据加以收录的波形词典时,该声音合成处理包括下述步骤从单词词典判定要合成的字符串的语调类型;根据要合成的字符串与语调类型,从韵律词典选择韵律模型数据;根据选择的韵律模型数据,从波形词典选择与要合成的字符串各字符对应的波形数据;相互连接所述选择的波形数据。采用这些词典的另一声音合成方法,包括下述步骤根据与要合成的字符串一起输入的任务指定,切换单词词典、韵律词典、波形词典和单词变形规则;按照单词变形规则对要合成的字符串进行变形处理;采用切换后的单词词典、韵律词典和波形词典对与变形处理后的字符串对应的声音信息进行合成处理。采用这些词典的另一声音合成方法,包括下述步骤根据与要合成的字符串一起输入的任务指定,切换韵律词典、波形词典和单词变形规则;按照单词变形规则对要合成的字符进行变形处理;采用单词词典、切换后的韵律词典和波形词典,对与变形处理后的字符串对应的声音信息进行合成处理。这时,在各词典是收录许多至少含一个字符的单词及其语词类型的单词词典、收录表示对收录于所述单词词典中的单词的韵律的韵律模型数据中的代表性韵律数据的韵律词典、把收录声音作为合成单位的声音数据加以收录的波形词典且单词变形规则是收录字符串变形规则的单词变形规则时,该声音合成处理包括下述步骤从单词词典或单词变形规则判定要合成的字符串的语调类型;根据要合成的字符串与语调类型,从韵律词典选择韵律模型数据;根据选择的韵律模型数据,从波形词典选择与要合成的字符串的各字符对应的波形数据;相互连接所述选择的波形数据。采用上述词典的声音合成装置包括根据与要合成的字符串一起输入的任务指定,切换单词词典、韵律词典和波形词典的手段;采用切换后的单词词典、韵律词典和波形词典,对与要合成的字符串对应的声音信息进行合成处理的手段。采用上述词典的另一声音合成装置包括根据与要合成的字符串一起输入的任务指定,切替单词词典、韵律词典、波形词典和单词变形规则的手段;按照单词变形规则对要合成的字符串进行变形处理的手段;采用切换后的单词词典、韵律词典和波形词典,对与变形处理后的字符串对应的声音信息进行合成处理的手段。采用上述词典的另一声音合成装置包括根据与要合成的字符串一起输入的任务指定,切换韵律词典、波形词典和单词变形规则的手段;按照单词变形规则对要合成的字符串进行变形处理的手段;采用单词词典、切换后的韵律词典和波形词典对与变形处理后的字符串对应的声音信息进行合成处理的手段。上述声音合成装置通过一种记录声音合成程序的计算机可本文档来自技高网...

【技术保护点】
一种采用单词词典、韵律词典和波形词典生成声音信息的声音合成方法,其特征在于,该方法包括下述步骤: 设定讲话者或讲话时感情、状况或讲话内容中至少一个不同的多个声音合成处理任务; 至少构筑与各任务对应的韵律词典和波形词典; 在与任务指定的同时输入要合成的字符串时,用与该任务对应的单词词典、韵律词典和波形词典进行声音合成处理。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:笠井治溝口稔幸
申请(专利权)人:科乐美股份有限公司科乐美东京电脑娱乐股份有限公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利