一种文本转化成语音的方法及装置制造方法及图纸

技术编号：18352732 阅读：41 留言：0更新日期：2018-07-02 03:36

本发明专利技术属于文本转化技术领域，具体涉及到一种文本转化成语音的方法及装置。该方法包括：获取文本信息；根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件；按照每个文字信息在所述文本信息中的顺序信息，将每个文字信息对应的发音文件进行排序；将每个文字信息对应的序号发音文件一次性写入板卡中；按照每个文字信息对应的序号发音文件的序号，依次播放写入板卡中的每个文字信息对应的序号发音文件等。该方法可应用于IVR系统中将文本转化成语音，其可以避免由此带来的存储资源的消耗，不必进行定期管理与维护，大大缩减了成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本转化成语音的方法及装置
本专利技术属于文本转化
，具体涉及到一种文本转化成语音的方法及装置。
技术介绍
文本转语音(TTS，TextToSpeech)涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术，是中文信息处理领域的一项前沿技术，其在IVR(InteractiveVoiceResponse，互动式语音应答)业务里面频繁使用。但是目前在IVR系统中使用TTS的做法是根据文本信息直接从语音数据库中获取所需要的单个语音文件，并将多个单个语音文件合成一个与该文本信息相对应的合成语音文件，然后将与该合成语音文件放入板卡中，进行播放。目前在IVR系统中使用TTS的做法，会产生大量的与不同文本信息相对应的不同的合成语音文件，每个合成语音文件本身都会占用较大的内存，且每隔一段时间都会产生大量的合成语音文件，这不仅会导致占用较大的存储资源，也需要定期进行管理与维护，耗费较大。
技术实现思路
为了解决上述技术问题，本专利技术提供一种文本转化成语音的方法及装置，其可应用于IVR系统中将文本转化成语音，其不需要将多个单个语音文件合成相对应的合成语音文件，可以避免由此带来的存储资源的消耗，也不必进行定期管理与维护，大大缩减了成本。本专利技术提供如下技术方案：一方面，本专利技术实施例中提供一种文本转化成语音的方法，其包括以下步骤：获取文本信息，将所述文本信息拆分成单个文字信息，并生成每个文字信息在所述文本信息中的顺序信息；根据每个文字信息分别获取与其对应的发音文件地址信息，然后，根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件；按照每个文...
一种文本转化成语音的方法及装置

【技术保护点】
1.一种文本转化成语音的方法，其特征在于，包括以下步骤：获取文本信息，将所述文本信息拆分成单个文字信息，并生成每个文字信息在所述文本信息中的顺序信息；根据每个文字信息分别获取与其对应的发音文件地址信息，然后，根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件；按照每个文字信息在所述文本信息中的顺序信息，将每个文字信息对应的发音文件进行排序，并在每个文字信息对应的发音文件中标注对应的序号，形成每个文字信息对应的序号发音文件；将每个文字信息对应的序号发音文件一次性写入板卡中；按照每个文字信息对应的序号发音文件的序号，依次播放写入板卡中的每个文字信息对应的序号发音文件。

【技术特征摘要】
1.一种文本转化成语音的方法，其特征在于，包括以下步骤：获取文本信息，将所述文本信息拆分成单个文字信息，并生成每个文字信息在所述文本信息中的顺序信息；根据每个文字信息分别获取与其对应的发音文件地址信息，然后，根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件；按照每个文字信息在所述文本信息中的顺序信息，将每个文字信息对应的发音文件进行排序，并在每个文字信息对应的发音文件中标注对应的序号，形成每个文字信息对应的序号发音文件；将每个文字信息对应的序号发音文件一次性写入板卡中；按照每个文字信息对应的序号发音文件的序号，依次播放写入板卡中的每个文字信息对应的序号发音文件。2.根据权利要求1所述的文本转化成语音的方法，其特征在于，还包括：将所述文本信息中包含的每个标点符号分别拆分成对应的符号信息；且所述生成每个文字信息在所述文本信息中的顺序信息的同时，也生成每个符号信息在所述文本信息中的顺序信息；根据每个符号信息，查找对应的停顿时长和语调信息，并生成与该符号信息对应的符号文件；根据每个符号信息在所述文本信息中的顺序信息，将每个符号信息对应的符号文件进行排序，并在每个符号信息对应的符号文件中标注对应的序号，形成每个符号信息对应的序号符号文件；将每个符号信息对应的序号符号文件写入板卡中；所述播放写入板卡中的每个文字信息对应的序号发音文件之前，查询是否存在序号符号文件；如果存在序号符号文件，则按照每个文字信息对应的序号发音文件的序号及每个序号符号文件中的停顿时长和语调信息，依次播放每个序号符号文件的序号之前的每个序号发音文件；如果不存在序号符号文件，则按照每个文字信息对应的序号发音文件的序号，依次播放写入板卡中的每个文字信息对应的序号发音文件。3.根据权利要求1所述的文本转化成语音的方法，其特征在于，所述根据每个文字信息分别获取与其对应的发音文件地址信息包括：根据每个文字信息分别获取与每个文字信息对应的索引信息，并根据每个文字信息的索引信息，分别获取与每个索引信息对应的发音文件地址信息。4.根据权利要求1所述的文本转化成语音的方法，其特征在于，所述根据每个文字信息分别获取与其对应的发音文件地址信息之前，还包括：将文本信息中的每个文字信息的发音录制成与其对应的发音文件；将每个文字信息的发音文件存入内存中，并生成每个发音文件的发音文件地址信息；将每个文字信息与其发音文件地址信息相映射。5.根据权利要求4所述的文本转化成语音的方法，其特征在于，所述将每个文字信息与其发音文件地址信息相映射，包括：生成每个文字信息的索引信息，并将每个文字信息的索引信息与该文字信息相映射；将每个索引信息分别与每个文字信息的发音文件地址信息相映射。6.一种文本转化成语音的装置，其特征在于，包括：拆分模块，用于获取文本信息，将所述文本信息拆分成单个文字信息，并生成每个文字信...

【专利技术属性】
技术研发人员：牛杰，吴铮，贺改梅，饶宇，王昌平，张德时，晏利平，付清文，
申请(专利权)人：贵阳朗玛信息技术股份有限公司，
类型：发明
国别省市：贵州,52

全部详细技术资料下载我是这个专利的主人