一种文本转化成语音的方法及装置制造方法及图纸

技术编号:18352732 阅读:41 留言:0更新日期:2018-07-02 03:36
本发明专利技术属于文本转化技术领域,具体涉及到一种文本转化成语音的方法及装置。该方法包括:获取文本信息;根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件;按照每个文字信息在所述文本信息中的顺序信息,将每个文字信息对应的发音文件进行排序;将每个文字信息对应的序号发音文件一次性写入板卡中;按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件等。该方法可应用于IVR系统中将文本转化成语音,其可以避免由此带来的存储资源的消耗,不必进行定期管理与维护,大大缩减了成本。

【技术实现步骤摘要】
一种文本转化成语音的方法及装置
本专利技术属于文本转化
,具体涉及到一种文本转化成语音的方法及装置。
技术介绍
文本转语音(TTS,TextToSpeech)涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术,其在IVR(InteractiveVoiceResponse,互动式语音应答)业务里面频繁使用。但是目前在IVR系统中使用TTS的做法是根据文本信息直接从语音数据库中获取所需要的单个语音文件,并将多个单个语音文件合成一个与该文本信息相对应的合成语音文件,然后将与该合成语音文件放入板卡中,进行播放。目前在IVR系统中使用TTS的做法,会产生大量的与不同文本信息相对应的不同的合成语音文件,每个合成语音文件本身都会占用较大的内存,且每隔一段时间都会产生大量的合成语音文件,这不仅会导致占用较大的存储资源,也需要定期进行管理与维护,耗费较大。
技术实现思路
为了解决上述技术问题,本专利技术提供一种文本转化成语音的方法及装置,其可应用于IVR系统中将文本转化成语音,其不需要将多个单个语音文件合成相对应的合成语音文件,可以避免由此带来的存储资源的消耗,也不必进行定期管理与维护,大大缩减了成本。本专利技术提供如下技术方案:一方面,本专利技术实施例中提供一种文本转化成语音的方法,其包括以下步骤:获取文本信息,将所述文本信息拆分成单个文字信息,并生成每个文字信息在所述文本信息中的顺序信息;根据每个文字信息分别获取与其对应的发音文件地址信息,然后,根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件;按照每个文字信息在所述文本信息中的顺序信息,将每个文字信息对应的发音文件进行排序,并在每个文字信息对应的发音文件中标注对应的序号,形成每个文字信息对应的序号发音文件;将每个文字信息对应的序号发音文件一次性写入板卡中;按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件。较佳地,上述方法还包括:将所述文本信息中包含的每个标点符号分别拆分成对应的符号信息;且所述生成每个文字信息在所述文本信息中的顺序信息的同时,也生成每个符号信息在所述文本信息中的顺序信息;根据每个符号信息,查找对应的停顿时长和语调信息,并生成与该符号信息对应的符号文件;根据每个符号信息在所述文本信息中的顺序信息,将每个符号信息对应的符号文件进行排序,并在每个符号信息对应的符号文件中标注对应的序号,形成每个符号信息对应的序号符号文件;将每个符号信息对应的序号符号文件写入板卡中;所述播放写入板卡中的每个文字信息对应的序号发音文件之前,查询是否存在序号符号文件;如果存在序号符号文件,则按照每个文字信息对应的序号发音文件的序号及每个序号符号文件中的停顿时长和语调信息,依次播放每个序号符号文件的序号之前的每个序号发音文件;如果不存在序号符号文件,则按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件。优选地,所述根据每个文字信息分别获取与其对应的发音文件地址信息包括:根据每个文字信息分别获取与每个文字信息对应的索引信息,并根据每个文字信息的索引信息,分别获取与每个索引信息对应的发音文件地址信息。较佳地,所述根据每个文字信息分别获取与其对应的发音文件地址信息之前,还包括:将文本信息中的每个文字信息的发音录制成与其对应的发音文件;将每个文字信息的发音文件存入内存中,并生成每个发音文件的发音文件地址信息;将每个文字信息与其发音文件地址信息相映射。进一步地,所述将每个文字信息与其发音文件地址信息相映射,包括:生成每个文字信息的索引信息,并将每个文字信息的索引信息与该文字信息相映射;将每个索引信息分别与每个文字信息的发音文件地址信息相映射。另一方面,本专利技术实施例中还提供一种文本转化成语音的装置,其包括:拆分模块,用于获取文本信息,将所述文本信息拆分成单个文字信息,并生成每个文字信息在所述文本信息中的顺序信息;获取模块,用于根据每个文字信息分别获取与其对应的发音文件地址信息,然后,根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件;排序模块,用于按照每个文字信息在所述文本信息中的顺序信息,将每个文字信息对应的发音文件进行排序,并在每个文字信息对应的发音文件中标注对应的序号,形成每个文字信息对应的序号发音文件;写入模块,用于将每个文字信息对应的序号发音文件一次性写入板卡中;播放模块,用于按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件。较佳地,所述拆分模块,还用于将所述文本信息中包含的每个标点符号分别拆分成对应的符号信息;且所述生成每个文字信息在所述文本信息中的顺序信息的同时,也生成每个符号信息在所述文本信息中的顺序信息;且所述文本转化成语音的装置还包括查找模块,用于根据每个符号信息,查找对应的停顿时长和语调信息,并生成与该符号信息对应的符号文件;所述排序模块,还用于根据每个符号信息在所述文本信息中的顺序信息,将每个符号信息对应的符号文件进行排序,并在每个符号信息对应的符号文件中标注对应的序号,形成每个符号信息对应的序号符号文件;所述写入模块,还用于将每个符号信息对应的序号符号文件写入板卡中;所述播放模块包括查询单元和播放单元;其中,所述查询单元,用于所述播放写入板卡中的每个文字信息对应的序号发音文件之前,查询是否存在序号符号文件;所述播放单元,用于如果存在序号符号文件,则按照每个文字信息对应的序号发音文件的序号及每个序号符号文件中的停顿时长和语调信息,依次播放每个序号符号文件的序号之前的每个序号发音文件;如果不存在序号符号文件,则按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件。优选地,所述获取模块包括索引单元,用于根据每个文字信息分别获取与每个文字信息对应的索引信息,并根据每个文字信息的索引信息,分别获取与每个索引信息对应的发音文件地址信息。优选地,所述装置还包括:录制模块,用于所述根据每个文字信息分别获取与其对应的发音文件地址信息之前,将文本信息中的每个文字信息的发音录制成与其对应的发音文件;生成模块,用于将每个文字信息的发音文件存入内存中,并生成每个发音文件的发音文件地址信息;映射模块,用于将每个文字信息与其发音文件地址信息相映射。进一步地,所述映射模块包括:第一映射单元,用于生成每个文字信息的索引信息,并将每个文字信息的索引信息与该文字信息相映射;第二映射单元,用于将每个索引信息分别与每个文字信息的发音文件地址信息相映射。本专利技术实施例的文本转化成语音的方法可应用于IVR系统中,其只需要获取文本信息中每个文字信息对应的发音文件和每个文字信息在所述文本信息中的顺序信息,即可在板卡中按照顺序将所述文本信息播放出来。本专利技术实施例不需要将多个单个语音文件合成相对应的合成语音文件,可以避免由此带来的存储资源的消耗,也不必进行定期管理与维护,大大缩减了成本。附图说明为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对本专利技术或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员本文档来自技高网...
一种文本转化成语音的方法及装置

【技术保护点】
1.一种文本转化成语音的方法,其特征在于,包括以下步骤:获取文本信息,将所述文本信息拆分成单个文字信息,并生成每个文字信息在所述文本信息中的顺序信息;根据每个文字信息分别获取与其对应的发音文件地址信息,然后,根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件;按照每个文字信息在所述文本信息中的顺序信息,将每个文字信息对应的发音文件进行排序,并在每个文字信息对应的发音文件中标注对应的序号,形成每个文字信息对应的序号发音文件;将每个文字信息对应的序号发音文件一次性写入板卡中;按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件。

【技术特征摘要】
1.一种文本转化成语音的方法,其特征在于,包括以下步骤:获取文本信息,将所述文本信息拆分成单个文字信息,并生成每个文字信息在所述文本信息中的顺序信息;根据每个文字信息分别获取与其对应的发音文件地址信息,然后,根据每个文字信息的发音文件地址信息分别获取每个文字信息对应的发音文件;按照每个文字信息在所述文本信息中的顺序信息,将每个文字信息对应的发音文件进行排序,并在每个文字信息对应的发音文件中标注对应的序号,形成每个文字信息对应的序号发音文件;将每个文字信息对应的序号发音文件一次性写入板卡中;按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件。2.根据权利要求1所述的文本转化成语音的方法,其特征在于,还包括:将所述文本信息中包含的每个标点符号分别拆分成对应的符号信息;且所述生成每个文字信息在所述文本信息中的顺序信息的同时,也生成每个符号信息在所述文本信息中的顺序信息;根据每个符号信息,查找对应的停顿时长和语调信息,并生成与该符号信息对应的符号文件;根据每个符号信息在所述文本信息中的顺序信息,将每个符号信息对应的符号文件进行排序,并在每个符号信息对应的符号文件中标注对应的序号,形成每个符号信息对应的序号符号文件;将每个符号信息对应的序号符号文件写入板卡中;所述播放写入板卡中的每个文字信息对应的序号发音文件之前,查询是否存在序号符号文件;如果存在序号符号文件,则按照每个文字信息对应的序号发音文件的序号及每个序号符号文件中的停顿时长和语调信息,依次播放每个序号符号文件的序号之前的每个序号发音文件;如果不存在序号符号文件,则按照每个文字信息对应的序号发音文件的序号,依次播放写入板卡中的每个文字信息对应的序号发音文件。3.根据权利要求1所述的文本转化成语音的方法,其特征在于,所述根据每个文字信息分别获取与其对应的发音文件地址信息包括:根据每个文字信息分别获取与每个文字信息对应的索引信息,并根据每个文字信息的索引信息,分别获取与每个索引信息对应的发音文件地址信息。4.根据权利要求1所述的文本转化成语音的方法,其特征在于,所述根据每个文字信息分别获取与其对应的发音文件地址信息之前,还包括:将文本信息中的每个文字信息的发音录制成与其对应的发音文件;将每个文字信息的发音文件存入内存中,并生成每个发音文件的发音文件地址信息;将每个文字信息与其发音文件地址信息相映射。5.根据权利要求4所述的文本转化成语音的方法,其特征在于,所述将每个文字信息与其发音文件地址信息相映射,包括:生成每个文字信息的索引信息,并将每个文字信息的索引信息与该文字信息相映射;将每个索引信息分别与每个文字信息的发音文件地址信息相映射。6.一种文本转化成语音的装置,其特征在于,包括:拆分模块,用于获取文本信息,将所述文本信息拆分成单个文字信息,并生成每个文字信...

【专利技术属性】
技术研发人员:牛杰吴铮贺改梅饶宇王昌平张德时晏利平付清文
申请(专利权)人:贵阳朗玛信息技术股份有限公司
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1