【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及转换声音的音质的,尤 其涉及将输入声音的音质转换为作为目标的讲话者的声音的音质的音 质转换装置及音质转换方法。
技术介绍
近几年,随着声音合成技术的发展,已经能够制作出极高音质的 合成音。但是,以往的合成音的用途主要以播音员的风格朗读新闻等用途 为中心。另一方面,在移动电话服务等领域,提供使用名人的声音信息来 代替铃声之类的服务等,有特征的声音(个人再现性高的合成音,以 及女高中生腔调或者关西方言腔调等具有特征性的韵律和音质的合成 音)作为一个内容开始流通。为了增加这样的人际交流中的乐趣,可 以想像对于制作给对方听的特征性的声音的要求今后会增高。再者,作为合成音的方法,大致分为以下两种。即,从预先准备好的声音单元DB(数据库)中选择适当的声音单元,并通过将其进行连 接来合成音的波形连接型声音合成方法,和对声音进行分析,以分析 后的参数为基础来合成声音的分析合成型声音合成方法。如果考虑使上述合成音的音质进行各种各样的变化,则在波形连 接型声音合成方法中,需要尽量准备必要的声音单元DB,并切换声音 单元DB,同时需要对声音单元进行连接。因此,为了制作各种各样音 质的合成音,需要庞大的费用。9另一方面,在分析合成型声音合成方法中,通过使分析后的声音 参数进行变形,能够转换合成音的音质。作为参数的变形方法,存在 使用作为同样的讲话内容的不同的两个讲话进行转换的方法。专利文献1表示使用神经网络等学习模式的分析合成型声音合成 方法的一个例子。图1是表示利用专利文献1的付与感情方法的声音处理系统的构 成的图。此图所示的声音处理系统包括声分析部2、频谱的D ...
【技术保护点】
一种音质转换装置,利用与输入声音对应的信息来转换输入声音的音质,包括: 目标元音声道信息保持部,按每个元音来保持目标元音声道信息,所述目标元音声道信息是表示成为目标的音质的元音的声道信息; 元音转换部,接受被付与了输入声音所对应 的音素及音素的时间长度信息的声道信息、即附带音素边界信息的声道信息,将所述附带音素边界信息的声道信息所包含的元音的声道信息的时间变化以第一函数进行近似,将与该元音相同的元音的所述目标元音声道信息保持部所保持的声道信息的时间变化以第二函数进行近似,通过结合所述第一函数和所述第二函数从而求出第三函数,并由所述第三函数生成转换后的元音的声道信息;以及 合成部,利用由所述元音转换部转换后的元音的声道信息,合成声音。
【技术特征摘要】
【国外来华专利技术】JP 2007-5-14 128555/20071、一种音质转换装置,利用与输入声音对应的信息来转换输入声音的音质,包括目标元音声道信息保持部,按每个元音来保持目标元音声道信息,所述目标元音声道信息是表示成为目标的音质的元音的声道信息;元音转换部,接受被付与了输入声音所对应的音素及音素的时间长度信息的声道信息、即附带音素边界信息的声道信息,将所述附带音素边界信息的声道信息所包含的元音的声道信息的时间变化以第一函数进行近似,将与该元音相同的元音的所述目标元音声道信息保持部所保持的声道信息的时间变化以第二函数进行近似,通过结合所述第一函数和所述第二函数从而求出第三函数,并由所述第三函数生成转换后的元音的声道信息;以及合成部,利用由所述元音转换部转换后的元音的声道信息,合成声音。2、 如权利要求1所述的音质转换装置,还包括 子音声道信息导出部,接受所述附带音素边界信息的声道信息,并按该附带音素边界信息的声道信息所包含的每个子音的声道信息, 从包含所述成为目标的音质以外的音质的子音的声道信息之中,导出 具有与所述附带音素边界信息的声道信息所包含的子音相同的音素的 子音的声道信息,所述合成部利用由所述元音转换部转换后的元音的声道信息,和 在所述子音声道信息导出部导出的子音的声道信息,合成声音。3、 如权利要求2所述的音质转换装置, 所述子音声道信息导出部具有子音声道信息保持部,按每个子音保持从多个讲话者的声音抽取 了的声道信息;以及子音选择部,接受所述附带音素边界信息的声道信息,并按该附 带音素边界信息的声道信息所包含的每个子音的声道信息,将适合于 位于该子音之前或之后的元音区间的由所述元音转换部转换后的元音 的声道信息的、具有与该子音相同的音素的子音的声道信息,从所述 子音声道信息保持部所保持的子音的声道信息中选择。4、 如权利要求3所述的音质转换装置,所述子音选择部,接受所述附带音素边界信息的声道信息,依据 该附带音素边界信息的声道信息所包含的每个子音的声道信息的数值 与位于该子音之前或之后的元音区间的、由所述元音转换部转换后的 元音的声道信息的数值的连续性,从所述子音声道信息保持部所保持 的子音的声道信息中选择具有与该子音相同的音素的子音的声道信 息。5、 如权利要求3所述的音质转换装置,还包括子音变形部,将在所述子音选择部选择的子音的声道信息 进行变形,以使该子音的声道信息的数值与位于该子音之后的元音区 间的、由所述元音转换部转换后的元音的声道信息的数值的连续性变 好。6、 如权利要求1所述的音质转换装置,还包括转换比率输入部,输入表示向成为目标的音质转换的程度 的转换比率,所述元音转换部接受被付与了输入声音所对应的音素及音素的时 间长度信息的声道信息、即附带音素边界信息的声道信息和在所述转 换比率输入部输入的所述转换比率,将所述附带音素边界信息的声道信息所包含的元音的声道信息的时间变化以第一函数进行近似,将与 该元音相同的元音的所述目标元音声道信息保持部所保持的声道信息 的时间变化以第二函数进行近似,通过以所述转换比率结合所述第一 函数和所述第二函数从而求出第三函数,并由所述第三函数生成转换 后的元音的声道信息。7、 如权利要求6所述的音质转换装置,所述元音转换部,以次数为单位将所述附带音素边界信息的声道 信息所包含的元音的声道信息以第一多项式进行近似,以次数为单位 将与该元音相同的元音的所述目标元音声道信息保持部所保持的所述 目标元音声道信息以第二多项式进行近似,并以次数为单位,通过以 所述转换比率混合所述第一多项式的系数和所述第二多项式的系数, 从而求出第三多项式的各个次数的系数,将转换后的元音的声道信息 以所述第三多项式进行近似。8、 如权利要求1所述的音质转换装置,所述元音转换部进一步,将包含作为第一元音的声道信息和第二 元音的声道信息之间在时间上的边界的元音边界的规定时间设为过渡 区间,对该过渡区间中所包含的所述第一元音的声道信息和所述第二 元音的声道信息进行插值,以使在所述元音边界中所述第一元音的声 道信息和所述第二元音的声道信息被连续地连接。9、 如权利要求8所述的音质转换装置,所述规定时间被设定为,位于所述元音边界的前后的、所述第一 元音和所述第二元音的持续时间长度越长,所述规定时间就越长。10、 如权利要求1所述的音质转换装置, 所述声道信息是PARCOR系数或者声道声管模型的反射系数。11、 如权利要求10所述的音质转换装置,所述PARCOR系数或者声道声管模型的反射系数通过对输入声 音进行LPC分析,并根据分析出的全极点模型的多项式被算出。12、 如权利要求10所述的音质转换装置,所述PARCOR系数或者声道声管模型的反射系数通过对输入声 音进行ARX分析,并根据分析后的全极点模型的多项式被算出。13、 ...
【专利技术属性】
技术研发人员:广濑良文,釜井孝浩,加藤弓子,
申请(专利权)人:松下电器产业株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。