一种获取韵律边界信息的方法及系统技术方案

技术编号：8216087 阅读：160 留言：0更新日期：2013-01-17 17:26

本发明专利技术实施例公开了一种获取韵律边界信息的方法及系统，其中，所述方法包括：获取待标注的文本数据，并获得所述文本数据对应的音频数据；向第一组标注者播放所述音频数据，根据各个标注者的标注结果，获取基于该第一组标注者确定的韵律边界信息；向第二组标注者展现根据所述文本数据生成的句法树，根据各个标注者的标注结果，获取基于该第二组标注者确定的韵律边界信息；将所述基于第一组标注者确定的韵律边界信息与所述基于第二组标注者确定的韵律边界信息进行比对，根据比对结果，确定各个位置的韵律边界信息。通过本发明专利技术，能够有效地获取到韵律边界信息，进而提高语音合成结果的自然度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般地涉及语音信号处理
，尤其是一种获取韵律边界信息的方法及系统。
技术介绍
语音合成是通过机械的、电子的方法产生人造语音的技术，其目的是能够让计算机将文本信息转化为语音朗读出来，相当于使计算机具有类似于人一样的说话能力。传统的语音合成技术中通常有以下实现方式以字为切分单位的单字式的字音转换，或者以语法词为切分单位的词组式的文语转换。然而，实际上人们在说话时并不是以字或语法词为切分单位，而是以韵律词、韵律短语等为切分单位，因此这些传统的语音合成方法都会导致计算机输出的合成语音的自然度比较低，会给人“一字一顿”的感觉，无法达到人们可以接受的程度。因此，韵律边界信息对于语音信号处理有着至关重要的作用。韵律边界信息用于指示对于一个文本而言，在阅读时应该在哪些地方进行停顿。显然，在语音合成过程中，如果能够使得计算机按照自然的韵律边界信息进行停顿，将有助于提升语音合成结果的自然度和流畅性。为了能够有效地利用韵律边界信息，通常需要预先建立语料库，该语料库中保存有带有正确韵律边界信息的音频或文本，这样，在语音合成过程中，就可以利用语料库中的韵律边界信息进行语音的合成。因此，如何有效地获取韵律边界信息以便建立起语料库成为迫切需要本领域技术人员解决的技术问题。
技术实现思路
有鉴于此，本专利技术实施例提供了一种获取韵律边界信息的方法及系统，能够有效地获取到韵律边界信息，进而提高语音合成结果的自然度。根据本专利技术实施例的一个方面，提供一种获取韵律边界信息的方法，包括获取待标注的文本数据，并获得所述文本数据对应的音频数据；向第一组标注者播放所述音频数据，根据各个...

【技术保护点】
一种获取韵律边界信息的方法，包括：获取待标注的文本数据，并获得所述文本数据对应的音频数据；向第一组标注者播放所述音频数据，根据各个标注者的标注结果，获取基于该第一组标注者确定的韵律边界信息；向第二组标注者展现根据所述文本数据生成的句法树，根据各个标注者的标注结果，获取基于该第二组标注者确定的韵律边界信息；将所述基于第一组标注者确定的韵律边界信息与所述基于第二组标注者确定的韵律边界信息进行比对，根据比对结果，确定各个位置的韵律边界信息。

【技术特征摘要】

【专利技术属性】
技术研发人员：张洁，孟遥，于浩，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人