用于稳定音信号合成的方法和文本到语音转换的合成系统技术方案

技术编号：3046166 阅读：195 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种根据第二声音信号合成第一声音信号的方法，第一声音信号具有所需要的第一基频，并且第二声音信号具有第二基频，该方法包括步骤：ａ）确定第一声音信号的时域中所需要的基音声位置，该基音声位置通过第一基频的一个周期分开；ｂ）通过对第二声音信号的时域中的基音声位置上的第二声音信号进行加窗提供基音声，该基音声位置通过第二基频的一个周期分开；ｃ）对于每一所需要的基音声位置，从所提供的基音声中随机地选择一基音声；ｄ）对所选择的基音声执行叠接和相加操作，以合成第一信号。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音或乐音合成领域，并且更特别地没有限制地涉及文本到语音转换合成领域。文本到语音转换(TTS)合成系统的功能是根据给定语言的普通文本合成语音。如今，TTS系统已经投入许多应用的实际操作，诸如通过电话网络访问数据库或帮助障碍人士。合成语音的一种方法是通过联结所记录的语音子单元集的元素，诸如半音节或多音素。大多数成功的商用系统都采用多音素联结。多音素包括两个(双音素)、三个(三音素)或多个音素的组，并可以通过在稳定的频谱区域对理想分组的音素进行划分根据无意词进行确定。在基于联结的合成中，两个相邻音素之间的过渡转换对于确保所合成的语音的质量非常重要。通过选择多音素作为基本子单元，在所记录的子单元中就保留有两个相邻音素之间的过渡，并且在相似音素之间进行联结。但是在合成之前，为了实现包含这些音素的新词的韵律限制，必须修改这些音素的持续时间和基音。必须进行该过程，才能避免产生发音单调的合成语音。在TTS系统中，韵律模块执行该功能。为了在所记录的子单元中进行持续时间和基音的修改，许多基于联结的TTS系统采用时域基音同步叠接相加(TD-PSOLA)(E.Moulines和F.Charpentier，“Pitch synchronous waveform processingtechniques for text-to-speech synthesis usingdiphones，”Speech Commun.，vol.9，pp，453-467，1990)模式的合成。当待合成的信号需要具有延长的持续时间时，这可以通过重复从原始信号得到的基音声(pitch...

【技术保护点】
一种根据第二声音信号合成第一声音信号的方法，第一声音信号具有所需要的第一基频，并且第二声音信号具有第二基频，该方法包括步骤：.确定第一声音信号的时域中所需要的基音声位置，该基音声位置通过第一基频的一个周期分开；.通过对第二声音信号的时域中的基音声位置上的第二声音信号进行加窗，提供基音声，该基音声位置通过第二基频的一个周期分开；.对于每一所需要的基音声位置，从所提供的基音声中随机地选择一基音声；.对所选择的基音声执行叠接和相加操作，以合成第一信号。

【技术特征摘要】
EP 2002-9-17 02078848.51.一种根据第二声音信号合成第一声音信号的方法，第一声音信号具有所需要的第一基频，并且第二声音信号具有第二基频，该方法包括步骤·确定第一声音信号的时域中所需要的基音声位置，该基音声位置通过第一基频的一个周期分开；·通过对第二声音信号的时域中的基音声位置上的第二声音信号进行加窗，提供基音声，该基音声位置通过第二基频的一个周期分开；·对于每一所需要的基音声位置，从所提供的基音声中随机地选择一基音声；·对所选择的基音声执行叠接和相加操作，以合成第一信号。2.权利要求1的方法，其中第二声音信号是包括噪声成分和周期性成分的混合声音。3.权利要求1或2的方法，第二声音信号是浊摩擦音信号。4.任一前述权利要求1、2或3的方法，第二声音信号是浊音信号，并且由此使用升余弦对第二声音信号进行加窗。5.任一前述权利要求1、2或3的方法，第二声音信号是清音信号，并且由此使用正弦窗对第二声音信号进行加窗。6.任一前述权利要求1至5的方法，第二声音信号具有频谱相似的周期，该频谱相似的周期基本上具有相同的信息内容。7.任一前述权利要求1至6的方法，所需要的第一基频和第二基频基本上相同。8.一种计算机程序产品，特别是数字存储媒体，包括用于根据第二声音信号合成第一声音信号的程序装置，第一声音信号具有所需要的第一基频，并且第二声音信号具有第二基频，该程序装置...

【专利技术属性】
技术研发人员：EF吉吉，
申请(专利权)人：皇家飞利浦电子股份有限公司，
类型：发明
国别省市：NL[荷兰]

全部详细技术资料下载我是这个专利的主人