语音合成制造技术

技术编号：3047774 阅读：147 留言：0更新日期：2012-04-11 18:40

通过将语音信号分成一个频谱分量及一个激励分量而改变合成的语音信号的音高。在发声语音的情况中，将激励分量乘以与至少近似地对应于发声激励瞬间的音高定时标记信息同步的一系列重叠的窗口函数，以将其分成开窗口的语音段，在作用了可控制的时间位移之后重新将它们加在一起。然后重新组合频谱及激励分量。乘法以每一音高时段至少用两个窗口，各有小于一个音高时段的持续时间。作为替代，各窗口具有小于两倍定时标记之间的音高时段的持续时间并相对于定时标记不对称。（*该技术在2015年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音的自动生成(例如从编码文本输入中)。更具体地涉及分析合成法，其中“合成的”语音是从存储的始自来人类说话者导出的语音波形生成的(与“用规则合成”系统对应)。为了产生自然发音的语音，有必要在合成语音中产生与出现在人类语音中的相同种类的上下文相关的(韵律学的)音调变化。本专利技术包含生成定义要作出的音高变化的韵律学信息，并致力于处理语音信号以达到这种音高变化的问题。在F.J.Charpentier与MG Stella的“采用语音波形连接的重叠相加技术的复音合成”中描述了音高调节的一种方法，ASSP国际会议会报，IEEE，东京，1986年，2015-2018页。存储了各表示一个复音的语音波型的段，连同在时间上与波形的各音高周期的最大峰值值重合(对于发声的语音)并从而粗略地对应于说话人的声门闭合瞬间；或者对于不发声的语音是随意的音高标记。利用长度等于三倍音高时段的Hamming窗口将要使用的波形部分分成重叠的段。为波形得出一个全程频谱包络，并利用离散傅立叶变换得出一个短期频谱包络；得出一个用频谱包络去除该短期频谱的“源分量”。然后用线性插入过程修正源分量的音高再将其与包络信息重新组合。用这一方法预处理之后，用重叠相加过程连接这些段以给出所希望的基本音高。另一种建议免除了频域预处理而使用两倍音程持续时间的Hamming窗口(“基于语音的时域韵律修正的复音合成系统”，C.Hamon、E.Moulines与F.Charpentier，ASSP国际会议，Glasgow，1989年，238-241页)。作为将时域重叠相加过程应用在一个完整的语音信号上的...

【技术保护点】
一种语音合成装置，包含可加以控制来改变由其合成的语音信号的音高的装置，具有：（ｉ）用于将语音信号分成一个频谱分量及一个激励分量的装置；（ｉｉ）用于在发声语音的情况中，一系列与至少近似地对应于发声激励瞬间的音高定时标记信息同步的重叠窗口函数去乘激励分量，而将其分成开窗口的语音段的装置；（ｉｉｉ）在这些段上作用一个可控时间移位并将它们加在一起的装置；以及（ｉｖ）用于重新组合频谱与激励分量的装置；其中该乘法装置每一音高时段至少采用两个窗口，各有小于一个音高时段的持续时间。２、按照权利要求１的语音合成装置，其中该窗口包括每一音高时段一个的包含定时标记位置的第一窗口及多个中间窗口。

【技术特征摘要】
EP 1994-3-18 94301953.91.一种语音合成装置，包含可加以控制来改变由其合成的语音信号的音高的装置，具有(i)用于将语音信号分成一个频谱分量及一个激励分量的装置；(ii)用于在发声语音的情况中，一系列与至少近似地对应于发声激励瞬间的音高定时标记信息同步的重叠窗口函数去乘激励分量，而将其分成开窗口的语音段的装置；(iii)在这些段上作用一个可控时间移位并将它们加在一起的装置；以及(iv)用于重新组合频谱与激励分量的装置；其中该乘法装置每一音高时段至少采用两个窗口，各有小于一个音高时段的持续时间。2.按照权利要求1的语音合成装置，其中该窗口包括每一音高时段一个的包含定时标记位置的第一窗口及多个中间窗口。3.按照权利要求2的语音合成装置，其中的中间窗口各有小于第一窗口的宽度。4.一种语音合成装置，包含可加以控制来改变由其合成的语音信号的音高的装置，具有(i)用于将语音信号分成一个频谱分量及一个激励分量的装置；(ii)用于通过插入来自输入信号样本的新的信号样本，而暂时间压缩/扩张激励分量的装置；以及(iii)用于重新组合频谱与激励分量的装置。5.按照权利要求4的语音合成装置，其中该压缩/扩张装置可以响应至少近似地对应于发声激励瞬间的定时标记信息进行操作来与之同步地改变压缩/扩张的程度，使得该激励信号在定时标记...

【专利技术属性】
技术研发人员：安德鲁洛厄里，
申请(专利权)人：英国电讯有限公司，
类型：发明
国别省市：GB[英国]

全部详细技术资料下载我是这个专利的主人