语音转换方法和系统技术方案

技术编号：3048329 阅读：188 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种语音转换方法。该方法包括：语音分析步骤，用于对源说话者的语音执行语音分析以获得语音信息；频谱转换步骤，用于基于语音信息执行频谱转换，至少获得与目标说话者的语音相似的第一频谱；单元选择步骤，用于至少使用第一频谱作为目标，基于目标说话者的语音执行单元选择；频谱替换步骤，用于以所选择的目标说话者语音单元的频谱替代第一频谱的至少一部分；语音重建步骤，用于至少基于替换的频谱执行语音重建。本发明专利技术还提供相应的语音转换系统和计算机程序产品。本发明专利技术的语音转换方案将频率弯曲技术和ＴＴＳ系统内的单元选择进行有机地结合，使得最终转换语音不仅具有与目标说话者语音的良好相似度，而且体现了人声的自然度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及声音处理方法和系统，尤其涉及对人类语音进行转换的方法和系统。
技术介绍
语音转换是转换源说话者的语音以使其听起来类似于目标说话者的语音。当前，语音转换可具有多种用途。一个重要的应用是为不同的公司构建定制的文本至语音系统，其中通过修改原始说话者的语音语料可以快速且便宜地创建具有一个公司喜好的语音的TTS 系统。语音转换也可以用于生成具体的角色语音并在语音到语音翻译时保持说话者的一致性，这种经过转换的语音可用于电影制作、在线游戏、语言聊天、多媒体消息服务等各种应用中。通常存在两个对于转换的语音的标准来评估语音转换系统的性能。转换语音的质量以及与目标说话者的相似度。当前技术水平下的语音转换技术，通常在质量和相似度之间找到一个较好的平衡点。同时，不同的应用会对质量和相似度有不同的侧重。但通常而言，较好的语音质量是语音转换技术被实际应用的一个重要条件。频谱转换是语音转换系统的关键组成部分。最流行的两种频谱转换方法是码本映射(例如参见Abe， M.,S.Nakamura， K.Shikano, H.Kuwabara的 Voice Conversion t本文档来自技高网...

【技术保护点】
一种语音转换方法，包括：　语音分析步骤，用于对源说话者的语音执行语音分析以获得语音信息；　频谱转换步骤，用于基于所述语音信息执行频谱转换，至少获得与目标说话者的语音相似的第一频谱；　单元选择步骤，用于至少使用所述第一频谱作为目标，基于所述目标说话者的语音执行单元选择；　频谱替换步骤，用于以所选择的目标说话者语音单元的频谱替代所述第一频谱的至少一部分；　语音重建步骤，用于至少基于替换的频谱执行语音重建。

【技术特征摘要】
1. 一种语音转换方法，包括语音分析步骤，用于对源说话者的语音执行语音分析以获得语音信息；频谱转换步骤，用于基于所述语音信息执行频谱转换，至少获得与目标说话者的语音相似的第一频谱；单元选择步骤，用于至少使用所述第一频谱作为目标，基于所述目标说话者的语音执行单元选择；频谱替换步骤，用于以所选择的目标说话者语音单元的频谱替代所述第一频谱的至少一部分；语音重建步骤，用于至少基于替换的频谱执行语音重建。2. 根据权利要求1所述的方法，其中通过频率弯曲执行所述频谱转换步骤。3. 根据权利要求1所述的方法，还包括韵律转换步骤，用于基于所述语音信息执行韵律转换，至少获得与所述目标说话者的语音相似的第一音调曲线；其中在所述单元选择步骤中，使用所述第一频谱和所述第一音调曲线作为目标，基于所述目标说话者的语音^丸行单元选择；以及在所述语音重建步骤中，基于替换的频谱和所述第一音调曲线执行语音重建。4. 根据权利要求1所述的方法，其中在所述频谱替换步骤中，利用所选择单元的高于特定频率的频谱替换所述第一频谱中的相应部分，而将所述第一频谱中低于所述特定频率的部分保持不变。5. 根据权利要求4所述的方法，其中所述特定频率选择在500Hz至2000Hz之间。6. 根据权利要求1所述的方法，还包括频镨平滑步骤，用于对所述频谱替换步骤中获得的替换的频傳进行频谱平滑；其中在所述语音重建步骤中，基于平滑的频谱和所述第一音调曲线执行语音重建。7. 根据权利要求1 - 6中任一权利要求所述的方法，其中所述语音信息包括频谱包络和音调曲线信息。8. —种语音转换系统，包括语音分析装置，用于对源说话者的语音执行...

【专利技术属性】
技术研发人员：双志伟，孟繁平，秦勇，施勤，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人