校正难以理解的合成语音制造技术

技术编号：8801834 阅读：286 留言：0更新日期：2013-06-13 06:18

一种语音合成的方法和系统。在文本语音转换系统中接收文本输入，并且使用该系统的处理器将文本输入处理成合成语音，该合成语音被确定为难以理解的。将文本输入再处理成后续合成语音并通过扬声器输出给用户以校正难以理解的合成语音。在一个实施例中，通过预测合成语音的可懂度，并确定预测出的可懂度低于最小阈值，可以将合成语音确定为难以理解的。在另一个实施例中，通过经由扬声器将合成语音输出给用户并从用户接收合成语音难以理解的指示，可以将合成语音确定为难以理解的。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总体上涉及语音信号处理，并且更具体地涉及语音合成。
技术介绍
语音合成是通过人工手段从文本产生语音。例如，文本语音转换(TTS)系统从文本合成语音从而为传统的计算机到人的可视化输出设备-如计算机监视器或显示器提供了一种替代方案。TTS合成遇到的一个问题是合成语音可能具有差的韵律特征，诸如音调、发音、重音、语速、语调、和自然度。因此，这种差的韵律可能迷惑TTS用户并且导致与用户的不完整交互。
技术实现思路
根据本专利技术的一个方面，提供一种语音合成方法，包括下述步骤:(a)在文本语音转换系统中接收文本输入；(b)使用该系统的处理器将该文本输入处理成合成语音；(c)确定该合成语音是难以理解的；(d)将该文本输入再处理成后续合成语音以校正难以理解的合成语音；和(e)通过扬声器将后续合成语音输出给用户。根据本专利技术的另一个实施例，提供一种语音合成方法，包括下述步骤:(a)在文本语音转换系统中接收文本输入；(b)使用该系统的处理器将该文本输入处理成合成语音；(c)预测该合成语音的可懂度；(d)确定来自步骤(C)的预测可懂度是否低于最小阈值；(e)如果在步骤(d)中确定该预测可懂度不低于该最小阈值，则通过扬声器将该合成语音输出给用户；(f)如果在步骤(d)中确定该预测可懂度低于该最小阈值，则调整与处理文本输入结合使用的模型；(g)将该文本输入再处理成后续合成语音；(h)预测该后续合成语音的可懂度；⑴确定来自步骤(h)的预测可懂度是否低于最小阈值；(j)如果在步骤(i)中确定该预测可懂度不低于该最小阈值，则通过扬声器将该后续合成语音输出给用户；以及，否则(k)...

【技术保护点】
一种语音合成方法，包括下列步骤：(a)在文本语音转换系统中接收文本输入；(b)使用该系统的处理器将该文本输入处理成合成语音；(c)确定该合成语音是难以理解的；(d)将该文本输入再处理成后续合成语音以校正该难以理解的合成语音；和(e)通过扬声器将该后续合成语音输出给用户。

【技术特征摘要】
2011.09.27 US 13/246,1311.一种语音合成方法，包括下列步骤: (a)在文本语音转换系统中接收文本输入； (b)使用该系统的处理器将该文本输入处理成合成语音； (C)确定该合成语音是难以理解的； (d)将该文本输入再处理成后续合成语音以校正该难以理解的合成语音；和 (e)通过扬声器将该后续合成语音输出给用户。2.如权利要求1的方法，其中步骤(C)包括: (Cl)预测该合成语音的可懂度；和 (c2)确定来自步骤(Cl)的预测可懂度低于最小阈值。3.如权利要求2的方法，在步骤(c)和(d)之间进一步包括: (f)调整与步骤(d)结合使用的模型。4.如权利要求3的方法，在步骤(e)之后进一步包括: (g)预测该后续合成语音的可懂度； (h)确定来自步骤(g)的预测可懂度是否低于最小阈值； (i)如果在步骤(h)中确定该预测可懂度不低于该最小阈值，则通过扬声器将该后续合成语音输出给用户；以及，否则 (j)重复步骤(f)至(j)。5.如权利要求1的方法，其中步骤(c)包括: (cl)通过扬声器将该合成语音输出给用户；和 (c2)从用户接收该合成语音难以理解的指示。6.如权利要求5的方法，其中在步骤(d)中该后续合成语音比合成语音简单。7.如权利要求5的方法，其中在步骤...

【专利技术属性】
技术研发人员：G·塔尔瓦，R·秦贾尔瓦拉延，
申请(专利权)人：通用汽车有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人