【技术实现步骤摘要】
本专利技术涉及声音处理方法和系统,尤其涉及对人类语音进行转换 的方法和系统。
技术介绍
语音转换是转换源说话者的语音以使其听起来类似于目标说话 者的语音。当前,语音转换可具有多种用途。 一个重要的应用是为 不同的公司构建定制的文本至语音系统,其中通过修改原始说话者的语音语料可以快速且便宜地创建具有一个公司喜好的语音的TTS 系统。语音转换也可以用于生成具体的角色语音并在语音到语音翻 译时保持说话者的 一致性,这种经过转换的语音可用于电影制作、 在线游戏、语言聊天、多媒体消息服务等各种应用中。通常存在两 个对于转换的语音的标准来评估语音转换系统的性能。转换语音的 质量以及与目标说话者的相似度。当前技术水平下的语音转换技术, 通常在质量和相似度之间找到一个较好的平衡点。同时,不同的应 用会对质量和相似度有不同的侧重。但通常而言,较好的语音质量 是语音转换技术被实际应用的一个重要条件。频谱转换是语音转换系统的关键组成部分。最流行的两种频谱转 换方法是码本映射(例如参见Abe, M.,S.Nakamura, K.Shikano, H.Kuwabara的 Voice Co ...
【技术保护点】
一种语音转换方法,包括: 语音分析步骤,用于对源说话者的语音执行语音分析以获得语音信息; 频谱转换步骤,用于基于所述语音信息执行频谱转换,至少获得与目标说话者的语音相似的第一频谱; 单元选择步骤,用于至少使用所述第一频谱作为目标,基于所述目标说话者的语音执行单元选择; 频谱替换步骤,用于以所选择的目标说话者语音单元的频谱替代所述第一频谱的至少一部分; 语音重建步骤,用于至少基于替换的频谱执行语音重建。
【技术特征摘要】
1. 一种语音转换方法,包括语音分析步骤,用于对源说话者的语音执行语音分析以获得语音信息;频谱转换步骤,用于基于所述语音信息执行频谱转换,至少获得与目标说话者的语音相似的第一频谱;单元选择步骤,用于至少使用所述第一频谱作为目标,基于所述目标说话者的语音执行单元选择;频谱替换步骤,用于以所选择的目标说话者语音单元的频谱替代所述第一频谱的至少一部分;语音重建步骤,用于至少基于替换的频谱执行语音重建。2. 根据权利要求1所述的方法,其中 通过频率弯曲执行所述频谱转换步骤。3. 根据权利要求1所述的方法,还包括韵律转换步骤,用于基于所述语音信息执行韵律转换,至少获得与所述目标说话者的语音相似的第 一 音调曲线;其中在所述单元选择步骤中,使用所述第一频谱和所述第一音 调曲线作为目标,基于所述目标说话者的语音^丸行单元选择;以及在所述语音重建步骤中,基于替换的频谱和所述第一音调曲线执行语音重建。4. 根据权利要求1所述的方法,其中在所述频谱替换步骤中,利用所选择单元的高于特定频率的频 谱替换所述第一频谱中的相应部分,而将所述第一频谱中低于所述 特定频率的部分保持不变。5. 根据权利要求4所述的方法,其中 所述特定频率选择在500Hz至2000Hz之间。6. 根据权利要求1所述的方法,还包括频镨平滑步骤,用于对所述频谱替换步骤中获得的替换的频傳 进行频谱平滑;其中在所述语音重建步骤中,基于平滑的频谱和所述第一音调曲 线执行语音重建。7. 根据权利要求1 - 6中任一权利要求所述的方法,其中 所述语音信息包括频谱包络和音调曲线信息。8. —种语音转换系统,包括语音分析装置,用于对源说话者的语音执行...
【专利技术属性】
技术研发人员:双志伟,孟繁平,秦勇,施勤,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。