【技术实现步骤摘要】
语音变换允许确定和表示
技术介绍
本专利技术涉及提供在人工语音角色生成过程期间自动生成针对可调参数的允许间隔以使得所生成的语音角色满足针对真实性和保真度的期望要求的能力的技术。语音转换/变换技术长久以来用于游戏和电影制作并且最近变得可用于文本到语音(TTS)合成。语音转换/变换技术可用于TTS应用,以用于生成针对不同人类和非人类(虚构的)个性的语音。通常,可控制的语音转换平台具有由图形用户接口(GUI)控件表示和控制的多个参数。此类控件可以是连续或离散的,并且可用于修改“真实的”语音。真实的语音可以是人类录音或者TTS系统输出。通常,并非所有GUI控件的可能设置导致产生与初始语音相比较不同的语音个性或者产生似人类的语音的高质量语音,即,例如,没有人工痕迹。常规方式不提供引导语音角色生成的过程的自动化方式,因此,语音生成通常通过反复修改语音产生控件并且听所生成的音频来手动执行。因此,需要提供在人工语音角色生成过程期间自动生成针对可调参数的允许间隔以使得所生成的语音角色满足针对真实性和保真度的期望要求的能力的技术。专利 ...
【技术保护点】
1.一种在计算机系统中实现的用于语音角色生成的方法,所述计算机系统包括处理器、能够由所述处理器访问的存储器、和存储在所述存储器中并能够由所述处理器执行的计算机程序指令,所述方法包括:/n在所述计算机系统处,向用户显示控制合成语音信号的特征的多个用户能够选择的语音角色参数,以及结合多个用户能够选择的语音角色参数中的至少一些语音角色参数中的每一个语音角色参数来显示所述语音角色参数的语音变换允许间隔;/n在所述计算机系统处,接受来自用户的对至少一个用户能够选择的语音角色参数的选择;以及/n在所述计算机系统处,基于所选择的至少一个用户能够选择的语音角色参数来生成合成语音信号。/n
【技术特征摘要】
20190513 US 16/4099581.一种在计算机系统中实现的用于语音角色生成的方法,所述计算机系统包括处理器、能够由所述处理器访问的存储器、和存储在所述存储器中并能够由所述处理器执行的计算机程序指令,所述方法包括:
在所述计算机系统处,向用户显示控制合成语音信号的特征的多个用户能够选择的语音角色参数,以及结合多个用户能够选择的语音角色参数中的至少一些语音角色参数中的每一个语音角色参数来显示所述语音角色参数的语音变换允许间隔;
在所述计算机系统处,接受来自用户的对至少一个用户能够选择的语音角色参数的选择;以及
在所述计算机系统处,基于所选择的至少一个用户能够选择的语音角色参数来生成合成语音信号。
2.根据权利要求1所述的方法,其中,所显示的语音变换允许间隔范围通过以下操作来确定:
a)生成合成语音信号;
b)基于所述合成语音信号的质量、所述合成语音信号的自然性和所述合成语音信号的角色来评估所述合成语音信号;以及
执行二分搜索过程,所述过程包括重复a)和b)以确定语音变换允许间隔的至少一个边缘。
3.根据权利要求2所述的方法,其中,所述合成语音信号的所述自然性通过使用至少一些人工生成的反例训练的二进制分类器来确定。
4.根据权利要求3所述的方法,其中,所述二进制分...
【专利技术属性】
技术研发人员:V·谢赫特曼,A·索林,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。