基音转换方法和设备技术

技术编号：3044948 阅读：175 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供基音转换方法和设备，其可以在尽可能地抑制由于进行基音转换而导致的声音质量的劣化的同时减小数据吞吐量。在该基音转换方法和装置中，输入按预定处理单位的输入信号基音模式和目标基音模式，并对表示从输入信号基音模式到目标基音模式的基音转换时输入信号的波形的劣化程度的劣化度进行计算。作为另一种选择，从一数据库中提取与输入信号的语音状态和音位类型相对应的劣化度，在该数据库中将所估计的语音状态和音位类型的所有组合与劣化度相关联以进行记录。然后，根据该劣化度在执行具有小数据吞吐量的基音转换的基音转换器与执行具有大数据吞吐量的基音转换的基音转换器之间进行切换。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及基音转换方法和设备，特别地涉及一种用于将输入信号的基音转换成期望的(目标)基音以例如改变语音高低或重音的基音转换方法和设备。
技术介绍
现在将参照图24对上述基音转换技术的现有技术示例[1]和[2]进行描述。现有技术示例[l] (PSOLA方法)图24在该基音转换技术中，通过依照目标基音按基音周期将输入信号的波形交叠和相加来执行基音转换(即，在时间轴方向上最终将输入信号扩展或縮短)，通常将该方法称为基音同步叠加(PSOLA-Pitch-Synchronous Overlap and Add)方法(例如见专利文献l)。图24示出了用于通过采用PSOLA方法在时间轴方向上将输入信号 In縮短的基音转换的示例。艮口，首先按基音周期T从输入信号In切取出两个波形Wl和W2，然后将窗口函数Fl和F2分别施加给所切取的波形Wl和W2以调节振幅。为了避免通过后述的交叠和相加处理而得到的波形Wl和W2的交叠部分与非交叠部分之间的边界处的波形的不连续性，如图24所示地将窗口函数Fl和F2设定为使得在波形Wl与W2的交叠部分处互贡献度之和变成1。然后，将通过窗口函数F1和F2调节了其振幅的两个波形(未示出) 交叠并相加以获得输出信号Out。在这种现有技术示例[l]中，基音转换后的波形可能会变形，因为将相位彼此不同的波形相交叠。这种变形尤其在基音转换率(即，输入信号在时间轴方向上的扩展和縮短率)大时是显著的，这会导致声音质量的劣化。为了解决该问题，已经提出了如下所述的现有技术示例[2]: 现有技术示例[2]:未示出在该基音转换技术中，首先...

【技术保护点】
一种基音转换方法，该基音转换方法包括以下步骤：劣化评估步骤，其输入按预定处理单位的输入信号基音模式和针对所述输入信号基音模式的目标基音模式，并对表示从所述输入信号基音模式到所述目标基音模式的基音转换时输入信号的波形劣化程度的劣化度进行计算；和基音转换步骤，其根据所述劣化度执行具有预定数据吞吐量的基音转换。

【技术特征摘要】
JP 2006-7-20 2006-1985601、一种基音转换方法，该基音转换方法包括以下步骤劣化评估步骤，其输入按预定处理单位的输入信号基音模式和针对所述输入信号基音模式的目标基音模式，并对表示从所述输入信号基音模式到所述目标基音模式的基音转换时输入信号的波形劣化程度的劣化度进行计算；和基音转换步骤，其根据所述劣化度执行具有预定数据吞吐量的基音转换。2、根据权利要求1所述的基音转换方法，其中所述劣化评估步骤包括以下步骤平均基音转换量计算步骤，其通过将所述目标基音模式与每预定周期的所述输入信号基音模式之间的多个基音差的和除以每预定周期的所述输入信号基音模式的多个基音的和来计算平均基音转换量；和劣化度计算步骤，其向所述基音转换步骤提供一值作为所述劣化度，该值是通过预定系数加权的所述平均基音转换量。3、根据权利要求1所述的基音转换方法，其中所述基音转换步骤包括取决于所述劣化度的高低的第一和第二基音转换步骤，因此所述劣化评估步骤也包括同样的第一和第二基音转换步骤，并且所述劣化评估步骤还包括以下步骤平均信号差计算步骤，其通过将按预定周期的第一基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期的所述第二基音转换结果的功率的和来计算平均信号差，所述第一基音转换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的，所述第二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的；和劣化度计算步骤，其向所述基音转换步骤提供一值作为所述劣化度，该值是通过预定系数加权的所述平均信号差。4、根据权利要求1所述的基音转换方法，其中所述劣化评估步骤包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度；和劣化度计算步骤，其向所述基音转换步骤提供一值作为所述劣化度，该值是通过预定系数加权的所述基音模式变化度。5、根据权利要求2所述的基音转换方法，其中所述基音转换步骤包括取决于所述劣化度的高低的第一和第二基音转换步骤，因此所述劣化评估步骤也包括同样的第一和第二基音转换步骤，并且所述劣化评估步骤还包括以下步骤平均信号差计算步骤，其通过将按预定周期的第一基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期的所述第二基音转换结果的功率的和来计算平均信号差，所述第一基音转换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的，所述第二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的，并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是分别通过多个预定系数加权的所述平均基音转换量和所述平均信号差。6、根据权利要求2所述的基音转换方法，其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并通过顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度，并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均基音转换量和所述基音模式变化度。7、根据权利要求3所述的基音转换方法，其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并通过顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度，并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均信号差和所述基音模式变化度。8、根据权利要求5所述的基音转换方法，其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并通过顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度，并且所述劣化度计算步骤向所述基音转换步骤提供多个值作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均基音转换量、所述平均信号差以及所述基音模式变化度。9、一种基音转换方法，该基音转换方法包括以下步骤劣化度提取步骤，其输入按预定处理单位的输入信号的语音状态和音位类型，并从一数据库中提取与所述输入的语音状态和音位类型相对应的劣化度，在该数据库中将表示从输入信号基音模式到针对所述输入信号基音模式的目标基音模式的基音转换时所述输入信号的波形的劣化程度的劣化度与所估计的语音状态和音位类型的所有组合相关联以进行记录；和基音转换步骤，其根据所述劣化度执行具有预定数据吞吐量的基音转换。10、一种基音转换方法，该基音转换方法包括以下步骤-劣化评估步骤，其输入按预定处理单位的输入信号基音模式、针对所述输入信号基音模式的目标基音模式以及所述输入信号的语音状态和音位类型，并对表示从所述输入信号基音模式到所述目标基音模式的基音转换时所述输入信号的波形的劣化程度的劣化度进行计算；和基音转换步骤，其根据所述劣化度执行具有预定数据吞吐量的基音转换。11、根据权利要求10所述的基音转换方法，其中所述劣化评估步骤包括以下步骤平均基音转换量计算步骤，其通过将所述目标基音模式与每预定周期的所述输入信号基音模式之间的多个基音差的和除以每预定周期的所述输入信号基音模式的多个基音的和来计算平均基音转换量；劣化度提取步骤，其从一数据库中提取与所述输入的语音状态和音位类型相对应的劣化度，在该数据库中将所述劣化度与所估计的语音状态和音位类型的所有组合相关联以进行记录；以及劣化度计算步骤，其向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均基音转换量和所述提取的劣化度。12、根据权利要求10所述的基音转换方法，其中所述基音转换步骤包括取决于所述劣化度的高低的第一和第二基音转换步骤，因此所述劣化评估步骤也包括同样的第一和第二基音转换步骤，并且所述劣化评估步骤还包括以下步骤平均信号差计算步骤，其通过将按预定周期的第一基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期的所述第二基音转换结果的功率的和来计算平均信号差，所述第一基音转换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的，所述第二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的；劣化度提取步骤，其从一数据库中提取与所述输入的语音状态和音位类型相对应的劣化度，在该数据库中将所述劣化度与所估计的语音状态和音位类型的所有组合相关联以进行记录；以及劣化度计算步骤，其向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均信号差和所述提取的劣化度。13、根据权利要求10所述的基音转换方法，其中所述劣化评估步骤包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并通过顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度；劣化度提取步骤，其从一数据库中提取与所述输入的语音状态和音位类型相对应的劣化度，在该数据库中将劣化度与所估计的语音状态和音位类型的所有组合相关联以进行记录；以及劣化度计算步骤，其向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述基音模式变化度和所述提取的劣化度。14、根据权利要求11所述的基音转换方法，其中所述基音转换步骤包括取决于所述劣化度的高低的第一和第二基音转换步骤，因此所述劣化评估步骤也包括同样的第一和第二基音转换步骤，并且所述劣化评估步骤还包括以下步骤平均信号差计算步骤，其通过将按预定周期的第一基音转换结果与第二基音转换结果之间的功率差的和除以按预定周期的所述第二基音转换结果的功率的和来计算平均信号差，所述第一基音转换结果是在所述第一基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的，所述第二基音转换结果是在所述第二基音转换步骤处通过对按预定处理单位的所述输入信号基音模式和所述目标基音模式的一部分进行转换而获得的，并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均基音转换量、所述提取的劣化度以及所述平均信号差。15、根据权利要求ll所述的基音转换方法，其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并通过顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度，并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均基音转换量、所述提取的劣化度以及所述基音模式变化度。16、根据权利要求12所述的基音转换方法，其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并通过顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度，并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多个预定系数分别加权的所述平均信号差、所述提取的劣化度以及所述基音模式变化度。17、根据权利要求14所述的基音转换方法，其中所述劣化评估步骤还包括以下步骤基音模式变化度计算步骤，其通过按基音模式的预定时间间隔计算多个平均基音，并通过顺序地比较所述多个平均基音，来将所述输入信号基音模式和所述目标基音模式的变化趋势分别分类成多个预定变化趋势中的任何一个，并基于这两个变化趋势的组合确定相对于针对所述输入信号基音模式的所述目标基音模式的基音模式变化度，并且所述劣化度计算步骤向所述基音转换步骤提供多个值的和作为所述劣化度，所述多个值是通过多...

【专利技术属性】
技术研发人员：远藤香绪里，松本智佳子，外川太郎，大田恭士，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人