基音转换方法和设备技术

技术编号:3044948 阅读:175 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供基音转换方法和设备,其可以在尽可能地抑制由于进行基音转换而导致的声音质量的劣化的同时减小数据吞吐量。在该基音转换方法和装置中,输入按预定处理单位的输入信号基音模式和目标基音模式,并对表示从输入信号基音模式到目标基音模式的基音转换时输入信号的波形的劣化程度的劣化度进行计算。作为另一种选择,从一数据库中提取与输入信号的语音状态和音位类型相对应的劣化度,在该数据库中将所估计的语音状态和音位类型的所有组合与劣化度相关联以进行记录。然后,根据该劣化度在执行具有小数据吞吐量的基音转换的基音转换器与执行具有大数据吞吐量的基音转换的基音转换器之间进行切换。

【技术实现步骤摘要】

本专利技术涉及基音转换方法和设备,特别地涉及一种用于将输入信号 的基音转换成期望的(目标)基音以例如改变语音高低或重音的基音转 换方法和设备。
技术介绍
现在将参照图24对上述基音转换技术的现有技术示例[1]和[2]进行 描述。现有技术示例[l] (PSOLA方法)图24在该基音转换技术中,通过依照目标基音按基音周期将输入信号的 波形交叠和相加来执行基音转换(即,在时间轴方向上最终将输入信号 扩展或縮短),通常将该方法称为基音同步叠加(PSOLA-Pitch-Synchronous Overlap and Add)方法(例如见专利文献l)。图24示出了用于通过采用PSOLA方法在时间轴方向上将输入信号 In縮短的基音转换的示例。艮口,首先按基音周期T从输入信号In切取出两个波形Wl和W2, 然后将窗口函数Fl和F2分别施加给所切取的波形Wl和W2以调节振 幅。为了避免通过后述的交叠和相加处理而得到的波形Wl和W2的交 叠部分与非交叠部分之间的边界处的波形的不连续性,如图24所示地将 窗口函数Fl和F2设定为使得在波形Wl与W2的交叠部分处互贡献度 之和变成1。然后,将通过窗口函数F1和F2调节了其振幅的两个波形(未示出) 交叠并相加以获得输出信号Out。在这种现有技术示例[l]中,基音转换后的波形可能会变形,因为将 相位彼此不同的波形相交叠。这种变形尤其在基音转换率(即,输入信号在时间轴方向上的扩展和縮短率)大时是显著的,这会导致声音质量 的劣化。为了解决该问题,已经提出了如下所述的现有技术示例[2]: 现有技术示例[2]:未示出在该基音转换技术中,首先对输入信号执行线性预测分析,从而将 信号分离成包络信号(共振峰分量)和残留信号(谐波分量)。然后,按 与上述现有技术示例[l]相同的方式只对残留信号执行基音转换,从而通 过利用根据输入信号计算出的线性预测系数将执行了基音转换之后的残 留信号与原始包络信号合成。这样,可以在不影响包络信号的情况下执行基音转换,并且可以减 小由于基音转换而导致的上述波形变形,从而可以避免声音质量的劣化 (例如见专利文献2)。日本特开平10-78791号 [专利文献2]日本特开平7-219597号尽管与上述现有技术示例[l]相比,在上述现有技术示例[2]中可以在 不使输入信号的声音质量劣化的情况下执行基音转换,但是存在线性预 测分析和信号分离/合成需要处理大数据吞吐量(计算量等)的问题。
技术实现思路
因此本专利技术的一个目的是提供一种基音转换方法和设备,其可以在 尽可能地抑制由于进行基音转换而导致的声音质量的劣化的同时减小数 据吞吐量。为了实现上述目的,根据本专利技术一个方面的一种基音转换方法(或设备)包括以下步骤(或装置)劣化评估步骤(或装置),其输入按预定处理单位的输入信号基音模式和针对所述输入信号基音模式的目标基 音模式,并对表示从所述输入信号基音模式到所述目标基音模式的基音转换时输入信号的波形的劣化程度的劣化度进行计算;和基音转换步骤 (或装置),其根据所述劣化度执行具有预定数据吞吐量的基音转换。 艮口,在劣化评估步骤(或装置)处,在执行基音转换之前计算劣化度,并且在基音转换步骤(或装置)处,根据所述劣化度对用于执行所 述基音转换的数据吞吐量进行切换。这样,当劣化度小时,可以通过采用例如在上述现有技术示例[l]中 示出的基音转换技术来按照小数据吞吐量执行基音转换,这是因为未出 现由于所述基音转换而导致的声音质量劣化。此外,仅当由于大劣化度 而需要执行高性能基音转换时,才可以通过采用例如在上述现有技术示 例[2]中示出的基音转换技术来执行基音转换。因此,可以减小处理负荷 (即,整个数据吞吐量)。此外,在上述[l]中,所述劣化评估步骤(或装置)可以包括以下步骤平均基音转换量计算步骤(或装置),其通过将每预定周期的所述 目标基音模式与所述输入信号基音模式之间的多个基音差的和除以每预 定周期的所述输入信号基音模式的多个基音的和,来计算平均基音转换 量;和劣化度计算步骤(或装置),其向所述基音转换步骤(或装置)提供一值作为所述劣化度,该值是通过预定系数加权的所述平均基音转换艮p,由于该平均基音转换量是表示需要针对每预定处理单位的输入 信号执行多少基音转换的值(即,输入信号的波形可以变形的程度),因 此可以使用该值作为所述劣化度。此外,在上述[l]中,所述基音转换步骤(或装置)可以包括取决于所述劣化度的高低的第一和第二基音转换步骤(或装置),因此所述劣 化评估步骤(或装置)也可以包括同样的第一和第二基音转换步骤(或装置),并且所述劣化评估步骤(或装置)还可以包括以下步骤(或装置) 平均信号差计算步骤(或装置),其通过将按预定周期的第一基音转换结 果与第二基音转换结果之间的功率差的和除以按预定周期的所述第二基 音转换结果的功率的和来计算平均信号差,所述第一基音转换结果是在 所述第一基音转换步骤(或装置)处通过对按预定处理单位的所述输入 信号基音模式和所述目标基音模式的一部分进行转换而获得的,所述第 二基音转换结果是在所述第二基音转换步骤(或装置)处通过对按预定 处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的;和劣化度计算步骤(或装置),其向所述基音转换步骤(或 装置)提供一值作为所述劣化度,该值是通过预定系数加权的所述平均 信号差。艮P,所述劣化评估步骤(或装置)在分别位于所述第一基音转换步 骤(或装置)和所述第二基音转换步骤(或装置)处的随后的基音转换 步骤(或装置)处执行基音转换之前对按预定处理单位的所述输入信号 基音模式和所述目标基音模式的所述部分执行基音转换,所述第一基音 转换步骤(或装置)和所述第二基音转换步骤(或装置)与在所述随后 阶段处包括的所述基音转换步骤(或装置)相同。基于上述两个基音转换的结果而获得的平均信号差是表示与在所述 基音转换步骤(或装置)中包括的所述第一基音转换步骤(或装置)和 所述第二基音转换步骤(或装置)处分别并且实际地执行的基音转换的 结果之间的差的更接近的差的值。当所述平均信号差小时,可以认为无 论数据吞吐量的大小如何所述多个基音转换结果之间都没有差别(即, 无论数据吞吐量的大小如何,都未出现由于基音转换而导致的声音质量 的劣化)。因此,可以使用平均信号差作为劣化度。此外,在上述[l]中,所述劣化评估步骤(或装置)可以包括以下 步骤(或装置)基音模式变化度计算步骤(或装置),其通过按基音模式的预定时间间隔计算多个平均基音,并通过顺序地比较所述多个平均 基音,来将所述输入信号基音模式和所述目标基音模式的变化趋势分别 分类成多个预定变化趋势中的任何一个,并基于这两个变化趋势的组合 确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度;和劣化度计算步骤(或装置),其向所述基音转换步骤(或装置) 提供一值作为所述劣化度,该值是通过预定系数加权的所述基音模式变 化度。即,由于该基音模式变化度是根据所述输入信号基音模式的变化趋 势和所述目标基音模式的变化趋势之间的相关性而获得的值(即,例如, 表示是否需要较大地改变所述输入信号的基音的值),因此可以使用该值 作为所述劣化度。此外,在上述[2]中,所述基音转换步骤(本文档来自技高网
...

【技术保护点】
一种基音转换方法,该基音转换方法包括以下步骤:劣化评估步骤,其输入按预定处理单位的输入信号基音模式和针对所述输入信号基音模式的目标基音模式,并对表示从所述输入信号基音模式到所述目标基音模式的基音转换时输入信号的波形劣化程度的劣化度进 行计算;和基音转换步骤,其根据所述劣化度执行具有预定数据吞吐量的基音转换。

【技术特征摘要】
JP 2006-7-20 2006-1985601、一种基音转换方法,该基音转换方法包括以下步骤劣化评估步骤,其输入按预定处理单位的输入信号基音模式和针对所述输入信号基音模式的目标基音模式,并对表示从所述输入信号基音模式到所述目标基音模式的基音转换时输入信号的波形劣化程度的劣化度进行计算;和基音转换步骤,其根据所述劣化度执行具有预定数据吞吐量的基音转换。2、 根据权利要求1所述的基音转换方法,其中所述劣化评估步骤包 括以下步骤平均基音转换量计算步骤,其通过将所述目标基音模式与 每预定周期的所述输入信号基音模式之间的多个基音差的和除以每预定 周期的所述输入信号基音模式的多个基音的和来计算平均基音转换量; 和劣化度计算步骤,其向所述基音转换步骤提供一值作为所述劣化度, 该值是通过预定系数加权的所述平均基音转换量。3、 根据权利要求1所述的基音转换方法,其中所述基音转换步骤包 括取决于所述劣化度的高低的第一和第二基音转换步骤,因此所述劣化 评估步骤也包括同样的第一和第二基音转换步骤,并且所述劣化评估步 骤还包括以下步骤平均信号差计算步骤,其通过将按预定周期的第一 基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期的 所述第二基音转换结果的功率的和来计算平均信号差,所述第一基音转 换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输入 信号基音模式和所述目标基音模式的一部分进行转换而获得的,所述第 二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位的 所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得 的;和劣化度计算步骤,其向所述基音转换步骤提供一值作为所述劣化 度,该值是通过预定系数加权的所述平均信号差。4、 根据权利要求1所述的基音转换方法,其中所述劣化评估步骤包 括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定时间 间隔计算多个平均基音,并顺序地比较所述多个平均基音,来将所述输 入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变 化趋势中的任何一个,并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度;和劣化度计算步骤,其向所述基音转换步骤提供一值作为所述劣化度,该值是通 过预定系数加权的所述基音模式变化度。5、 根据权利要求2所述的基音转换方法,其中所述基音转换步骤包 括取决于所述劣化度的高低的第一和第二基音转换步骤,因此所述劣化 评估步骤也包括同样的第一和第二基音转换步骤,并且所述劣化评估步骤还包括以下步骤平均信号差计算步骤,其通过将按预定周期的第一基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期的 所述第二基音转换结果的功率的和来计算平均信号差,所述第一基音转 换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输入 信号基音模式和所述目标基音模式的一部分进行转换而获得的,所述第 二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位的 所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得 的,并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为 所述劣化度,所述多个值是分别通过多个预定系数加权的所述平均基音 转换量和所述平均信号差。6、 根据权利要求2所述的基音转换方法,其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定时间间隔计算多个平均基音,并通过顺序地比较所述多个平均基音,来将 所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个 预定变化趋势中的任何一个,并基于这两个变化趋势的组合确定相对于 针对所述输入信号基音模式的所述目标基音模式的基音模式变化度,并 且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣 化度,所述多个值是通过多个预定系数分别加权的所述平均基音转换量 和所述基音模式变化度。7、 根据权利要求3所述的基音转换方法,其中所述劣化评估步骤还 包括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定时 间间隔计算多个平均基音,并通过顺序地比较所述多个平均基音,来将 所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个 预定变化趋势中的任何一个,并基于这两个变化趋势的组合确定相对于 针对所述输入信号基音模式的所述目标基音模式的基音模式变化度,并 且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣 化度,所述多个值是通过多个预定系数分别加权的所述平均信号差和所 述基音模式变化度。8、 根据权利要求5所述的基音转换方法,其中所述劣化评估步骤还 包括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定时 间间隔计算多个平均基音,并通过顺序地比较所述多个平均基音,来将 所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个 预定变化趋势中的任何一个,并基于这两个变化趋势的组合确定相对于 针对所述输入信号基音模式的所述目标基音模式的基音模式变化度,并 且所述劣化度计算步骤向所述基音转换步骤提供多个值作为所述劣化 度,所述多个值是通过多个预定系数分别加权的所述平均基音转换量、 所述平均信号差以及所述基音模式变化度。9、 一种基音转换方法,该基音转换方法包括以下步骤 劣化度提取步骤,其输入按预定处理单位的输入信号的语音状态和音位类型,并从一数据库中提取与所述输入的语音状态和音位类型相对 应的劣化度,在该数据库中将表示从输入信号基音模式到针对所述输入 信号基音模式的目标基音模式的基音转换时所述输入信号的波形的劣化 程度的劣化度与所估计的语音状态和音位类型的所有组合相关联以进行 记录;和基音转换步骤,其根据所述劣化度执行具有预定数据吞吐量的基音 转换。10、 一种基音转换方法,该基音转换方法包括以下步骤-劣化评估步骤,其输入按预定处理单位的输入信号基音模式、针对所述输入信号基音模式的目标基音模式以及所述输入信号的语音状态和 音位类型,并对表示从所述输入信号基音模式到所述目标基音模式的基音转换时所述输入信号的波形的劣化程度的劣化度进行计算;和基音转换步骤,其根据所述劣化度执行具有预定数据吞吐量的基音 转换。11、 根据权利要求10所述的基音转换方法,其中所述劣化评估步骤 包括以下步骤平均基音转换量计算步骤,其通过将所述目标基音模式与每预定周期的所述输入信号基音模式之间的多个基音差的和除以每预 定周期的所述输入信号基音模式的多个基音的和来计算平均基音转换量;劣化度提取步骤,其从一数据库中提取与所述输入的语音状态和音 位类型相对应的劣化度,在该数据库中将所述劣化度与所估计的语音状 态和音位类型的所有组合相关联以进行记录;以及劣化度计算步骤,其 向所述基音转换步骤提供多个值的和作为所述劣化度,所述多个值是通 过多个预定系数分别加权的所述平均基音转换量和所述提取的劣化度。12、 根据权利要求10所述的基音转换方法,其中所述基音转换步骤 包括取决于所述劣化度的高低的第一和第二基音转换步骤,因此所述劣 化评估步骤也包括同样的第一和第二基音转换步骤,并且所述劣化评估 步骤还包括以下步骤平均信号差计算步骤,其通过将按预定周期的第 一基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期 的所述第二基音转换结果的功率的和来计算平均信号差,所述第一基音 转换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输 入信号基音模式和所述目标基音模式的一部分进行转换而获得的,所述 第二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位 的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得 的;劣化度提取步骤,其从一数据库中提取与所述输入的语音状态和音 位类型相对应的劣化度,在该数据库中将所述劣化度与所估计的语音状 态和音位类型的所有组合相关联以进行记录;以及劣化度计算步骤,其 向所述基音转换步骤提供多个值的和作为所述劣化度,所述多个值是通 过多个预定系数分别加权的所述平均信号差和所述提取的劣化度。13、 根据权利要求10所述的基音转换方法,其中所述劣化评估步骤 包括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定时 间间隔计算多个平均基音,并通过顺序地比较所述多个平均基音,来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个 预定变化趋势中的任何一个,并基于这两个变化趋势的组合确定相对于 针对所述输入信号基音模式的所述目标基音模式的基音模式变化度;劣 化度提取步骤,其从一数据库中提取与所述输入的语音状态和音位类型 相对应的劣化度,在该数据库中将劣化度与所估计的语音状态和音位类 型的所有组合相关联以进行记录;以及劣化度计算步骤,其向所述基音 转换步骤提供多个值的和作为所述劣化度,所述多个值是通过多个预定 系数分别加权的所述基音模式变化度和所述提取的劣化度。14、 根据权利要求11所述的基音转换方法,其中所述基音转换步骤 包括取决于所述劣化度的高低的第一和第二基音转换步骤,因此所述劣 化评估步骤也包括同样的第一和第二基音转换步骤,并且所述劣化评估 步骤还包括以下步骤平均信号差计算步骤,其通过将按预定周期的第 一基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期 的所述第二基音转换结果的功率的和来计算平均信号差,所述第一基音 转换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输 入信号基音模式和所述目标基音模式的一部分进行转换而获得的,所述 第二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位 的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得 的,并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为 所述劣化度,所述多个值是通过多个预定系数分别加权的所述平均基音 转换量、所述提取的劣化度以及所述平均信号差。15、 根据权利要求ll所述的基音转换方法,其中所述劣化评估步骤 还包括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定 时间间隔计算多个平均基音,并通过顺序地比较所述多个平均基音,来 将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多 个预定变化趋势中的任何一个,并基于这两个变化趋势的组合确定相对 于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度, 并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述 劣化度,所述多个值是通过多个预定系数分别加权的所述平均基音转换 量、所述提取的劣化度以及所述基音模式变化度。16、 根据权利要求12所述的基音转换方法,其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定 时间间隔计算多个平均基音,并通过顺序地比较所述多个平均基音,来 将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多 个预定变化趋势中的任何一个,并基于这两个变化趋势的组合确定相对 于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度, 并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述 劣化度,所述多个值是通过多个预定系数分别加权的所述平均信号差、 所述提取的劣化度以及所述基音模式变化度。17、 根据权利要求14所述的基音转换方法,其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤,其通过按基音模式的预定 时间间隔计算多个平均基音,并通过顺序地比较所述多个平均基音,来 将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多 个预定变化趋势中的任何一个,并基于这两个变化趋势的组合确定相对 于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度, 并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述 劣化度,所述多个值是通过多...

【专利技术属性】
技术研发人员:远藤香绪里松本智佳子外川太郎大田恭士
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利