校正难以理解的合成语音制造技术

技术编号:8801834 阅读:286 留言:0更新日期:2013-06-13 06:18
一种语音合成的方法和系统。在文本语音转换系统中接收文本输入,并且使用该系统的处理器将文本输入处理成合成语音,该合成语音被确定为难以理解的。将文本输入再处理成后续合成语音并通过扬声器输出给用户以校正难以理解的合成语音。在一个实施例中,通过预测合成语音的可懂度,并确定预测出的可懂度低于最小阈值,可以将合成语音确定为难以理解的。在另一个实施例中,通过经由扬声器将合成语音输出给用户并从用户接收合成语音难以理解的指示,可以将合成语音确定为难以理解的。

【技术实现步骤摘要】

本专利技术总体上涉及语音信号处理,并且更具体地涉及语音合成。
技术介绍
语音合成是通过人工手段从文本产生语音。例如,文本语音转换(TTS)系统从文本合成语音从而为传统的计算机到人的可视化输出设备-如计算机监视器或显示器提供了一种替代方案。TTS合成遇到的一个问题是合成语音可能具有差的韵律特征,诸如音调、发音、重音、语速、语调、和自然度。因此,这种差的韵律可能迷惑TTS用户并且导致与用户的不完整交互。
技术实现思路
根据本专利技术的一个方面,提供一种语音合成方法,包括下述步骤:(a)在文本语音转换系统中接收文本输入;(b)使用该系统的处理器将该文本输入处理成合成语音;(c)确定该合成语音是难以理解的;(d)将该文本输入再处理成后续合成语音以校正难以理解的合成语音;和(e)通过扬声器将后续合成语音输出给用户。根据本专利技术的另一个实施例,提供一种语音合成方法,包括下述步骤:(a)在文本语音转换系统中接收文本输入;(b)使用该系统的处理器将该文本输入处理成合成语音;(c)预测该合成语音的可懂度;(d)确定来自步骤(C)的预测可懂度是否低于最小阈值;(e)如果在步骤(d)中确定该预测可懂度不低于该最小阈值,则通过扬声器将该合成语音输出给用户;(f)如果在步骤(d)中确定该预测可懂度低于该最小阈值,则调整与处理文本输入结合使用的模型;(g)将该文本输入再处理成后续合成语音;(h)预测该后续合成语音的可懂度;⑴确定来自步骤(h)的预测可懂度是否低于最小阈值;(j)如果在步骤(i)中确定该预测可懂度不低于该最小阈值,则通过扬声器将该后续合成语音输出给用户;以及,否则(k)重复步骤(f)至(k)。根据本专利技术的进一步实施例,提供一种语音合成方法,包括下述步骤:(a)在文本语音转换系统中接收文本输入;(b)使用该系统的处理器将该文本输入处理成合成语音;(Cl)通过扬声器将该合成语音输出给用户;(c2)从用户接收合成语音难以理解的指示;(d)将该文本输入再处理成后续合成语音以校正难以理解的合成语音;和(e)通过扬声器将该后续合成语音输出给用户。方案1.一种语音合成方法,包括下列步骤:(a)在文本语音转换系统中接收文本输入;(b)使用该系统的处理器将该文本输入处理成合成语音;(c)确定该合成语音是难以理解的;(d)将该文本输入再处理成后续合成语音以校正该难以理解的合成语音;和(e)通过扬声器将该后续合成语音输出给用户。方案2.如方案I的方法,其中步骤(C)包括:(c I)预测该合成语音的可懂度;和(c2)确定来自步骤(Cl)的预测可懂度低于最小阈值。方案3.如方案2的方法,在步骤(C)和(d)之间进一步包括:(f)调整与步骤(d)结合使用的模型。方案4.如方案3的方法,在步骤(e)之后进一步包括:(g)预测该后续合成语音的可懂度;(h)确定来自步骤(g)的预测可懂度是否低于最小阈值;(i)如果在步骤(h)中确定该预测可懂度不低于该最小阈值,则通过扬声器将该后续合成语音输出给用户;以及,否则(j)重复步骤(f)至(j)。方案5.如方案I的方法,其中步骤(C)包括:(Cl)通过扬声器将该合成语音输出给用户;和(c2)从用户接收该合成语音难以理解的指示。方案6.如方案5的方法,其中在步骤(d)中该后续合成语音比合成语音简单。方案7.如方案5的方法,其中在步骤(d)中该后续合成语音比合成语音慢。方案8.如方案5的方法,进一步包括识别用户的交流能力,其中在步骤(d)中基于识别出的交流能力产生后续合成语音。方案9.如方案8的方法,其中在步骤(d)中该后续合成语音比合成语音慢。方案10.如方案9的方法,其中在步骤(d)中该后续合成语音比合成语音简单。方案11.一种语音合成方法,包括下列步骤:(a)在文本语音转换系统中接收文本输入;(b)使用该系统的处理器将该文本输入处理成合成语音;(C)预测该合成语音的可懂度;(d)确定来自步骤(C)的预测可懂度是否低于最小阈值;(e)如果在步骤(d)中确定该预测可懂度不低于该最小阈值,则通过扬声器将该合成语音输出给用户;(f)如果在步骤(d)中确定该预测可懂度低于该最小阈值,则调整与处理文本输入结合使用的模型;(g)将该文本输入再处理成后续合成语音;(h)预测该后续合成语音的可懂度;(i)确定来自步骤(h)的预测可懂度是否低于最小阈值;(j)如果在步骤(i)中确定该预测可懂度不低于该最小阈值,则通过扬声器将该后续合成语音输出给用户;以及,否则(k)重复步骤(f)至(k)。方案12.如方案11的方法,其中步骤(f)中的模型是隐藏马尔可夫模型,该模型使用最大似然线性回归算法进行调整。方案13.如方案11的方法,其中预测可懂度的步骤包括计算语音可懂度得分,该得分包括加权韵律属性的总和。方案14.如方案13的方法,其中所述加权韵律属性包括音调、语速、频谱能量、基音或重音中的至少两个。方案15.如方案13的方法,其中调整的模型是基于可懂度指数、语音传输指数或语音干扰水平中的至少一种。方案16.如方案11的方法,其中调整的模型是基于可懂度指数、语音传输指数或语音干扰水平中的至少一种。方案17.—种语音合成方法,包括下列步骤:(a)在文本语音转换系统中接收文本输入;(b)使用该系统的处理器将该文本输入处理成合成语音;(c I)通过扬声器将该合成语音输出给用户;(c2)从用户接收该合成语音难以理解的指示;(d)将文本输入再处理成后续合成语音以校正难以理解的合成语音;和(e)通过扬声器将该后续合成语音输出给用户。方案18.如方案17的方法进一步包括识别用户的交流能力,其中步骤(d)中基于识别的交流能力产生后续合成语音。方案19.如方案17的方法,其中在步骤(d)中该后续合成语音比合成语音简单。方案20.如方案17的方法,其中在步骤(d)中该后续合成语音比合成语音慢。附图说明下面结合附图描述本专利技术的一个或多个优选实施例,其中相同的符号表不相同的兀件,并且其中:图1是示出能够利用本专利技术公开的方法的通信系统的实施例的框图;图2是示出可用于图1的系统的文本语音转换(TTS)系统的实施例的框图,该系统用于执行语音合成和/或改善语音识别度的示例方法;图3是示出可由图1的通信系统和图2的TTS系统执行的语音合成方法的实施例的流程图;和图4是示出可由图1的通信系统和图2的TTS系统执行的语音合成方法的另一实施例的流程图。具体实施方式下面的具体实施方式描述了通信系统示例,可用于该通信系统的文本语音转换(TTS)系统的示例,可用于上述系统的一个或两者的方法的一个或多个示例。下面描述的方法可由车辆远程信息处理单元(VTU)使用,作为合成语音的一部分向VTU用户输出。虽然以下描述的方法是这样的:他们可在程序执行过程中或运行时在VTU的车辆环境进行实施,但是可以理解的是,它们可用于任何类型的TTS系统和其他类型的TTS系统以及除了车辆环境的其他环境。通信系统参照图1,该图示出了示例性的操作环境,该操作环境包括移动车辆通信系统10,并且能够用于实施本专利技术所公开的方法。通信系统10通常包括车辆12、一个或多个无线载波系统14、陆地通信网络16、计算机18、和呼叫中心20。应当理解,所公开的方法可以用于任何数目的不同的系统且不特别局限于此处示出的操作环本文档来自技高网...

【技术保护点】
一种语音合成方法,包括下列步骤:(a)在文本语音转换系统中接收文本输入;(b)使用该系统的处理器将该文本输入处理成合成语音;(c)确定该合成语音是难以理解的;(d)将该文本输入再处理成后续合成语音以校正该难以理解的合成语音;和(e)通过扬声器将该后续合成语音输出给用户。

【技术特征摘要】
2011.09.27 US 13/246,1311.一种语音合成方法,包括下列步骤: (a)在文本语音转换系统中接收文本输入; (b)使用该系统的处理器将该文本输入处理成合成语音; (C)确定该合成语音是难以理解的; (d)将该文本输入再处理成后续合成语音以校正该难以理解的合成语音;和 (e)通过扬声器将该后续合成语音输出给用户。2.如权利要求1的方法,其中步骤(C)包括: (Cl)预测该合成语音的可懂度;和 (c2)确定来自步骤(Cl)的预测可懂度低于最小阈值。3.如权利要求2的方法,在步骤(c)和(d)之间进一步包括: (f)调整与步骤(d)结合使用的模型。4.如权利要求3的方法,在步骤(e)之后进一步包括: (g)预测该后续合成语音的可懂度; (h)确定来自步骤(g)的预测可懂度是否低于最小阈值; (i)如果在步骤(h)中确定该预测可懂度不低于该最小阈值,则通过扬声器将该后续合成语音输出给用户;以及,否则 (j)重复步骤(f)至(j)。5.如权利要求1的方法,其中步骤(c)包括: (cl)通过扬声器将该合成语音输出给用户;和 (c2)从用户接收该合成语音难以理解的指示。6.如权利要求5的方法,其中在步骤(d)中该后续合成语音比合成语音简单。7.如权利要求5的方法,其中在步骤...

【专利技术属性】
技术研发人员:G·塔尔瓦R·秦贾尔瓦拉延
申请(专利权)人:通用汽车有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1