文本转语音的优化方法、装置及电子设备、计算机程序产品制造方法及图纸

技术编号:43623348 阅读:15 留言:0更新日期:2024-12-11 15:03
本申请公开了一种文本转语音的优化方法、装置及电子设备、计算机程序产品,该方法包括:获取待处理文本及待处理文本中的数字内容;利用预设转换规则和当前转换场景,将待处理文本中的数字内容转换为目标语言的数字文本;将目标语言的数字文本与待处理文本进行重组,得到重组后的文本;将重组后的文本作为预处理后的文本输入至文本转语音系统中进行语音合成,输出合成后的语音。本申请的文本转语音的优化方法将待处理文本中数字内容的转换和重组等操作前置,通过预处理的方式生成符合不同场景需求的文本后再输入给TTS系统,不需要TTS系统逆向解析,同时解决了现有TTS系统的内部逻辑无法应对不同使用场景的转换需求的问题,提高了用户的使用体验。

【技术实现步骤摘要】

本申请涉及文本转语音,尤其涉及一种文本转语音的优化方法、装置及电子设备、计算机程序产品


技术介绍

1、在现有的tts(text-to-speech,文本转语音)系统中,如朗读语音为中文时,很多第三方ttssdk常常会出现将文本中的数字直接按字符逐个读出的情况。这种情况在许多应用场景中都会显得非常不自然,特别是在导航、通知和信息播报等场景中。

2、例如,“前方256米交通拥堵”被读作“前方二五六米交通拥堵”时,用户体验会受到很大的影响。此问题一般原因为tts系统在进行文本处理时的分词的问题,也就是在语义理解及分词时没有将256作为一个整体,识别成一个数字,然后再进行处理。

3、为了改善这一问题,常见的做法是对于需要tts处理的一段整体文本进行语音理解、分句、分词,然后识别出数字进行转换。这种做法虽然能够从根本上解决问题,但是需要tts系统具备较强的自然语言理解能力,逆向解析的过程难度大且往往效果不佳,优化周期往往很长,也不能考虑一些特殊情况,如不同语种混合朗读等情况。


技术实现思路b>

1本文档来自技高网...

【技术保护点】

1.一种文本转语音的优化方法,其中,所述文本转语音的优化方法包括:

2.如权利要求1所述文本转语音的优化方法,其中,所述获取待处理文本及待处理文本中的数字内容包括:

3.如权利要求1所述文本转语音的优化方法,其中,所述利用预设转换规则和当前转换场景,将所述待处理文本中的数字内容转换为目标语言的数字文本包括:

4.如权利要求1所述文本转语音的优化方法,其中,所述待处理文本中的数字内容包含多个数字部分,所述利用预设转换规则和当前转换场景,将所述待处理文本中的数字内容转换为目标语言的数字文本包括:

5.如权利要求1所述文本转语音的优化方法,其中,...

【技术特征摘要】

1.一种文本转语音的优化方法,其中,所述文本转语音的优化方法包括:

2.如权利要求1所述文本转语音的优化方法,其中,所述获取待处理文本及待处理文本中的数字内容包括:

3.如权利要求1所述文本转语音的优化方法,其中,所述利用预设转换规则和当前转换场景,将所述待处理文本中的数字内容转换为目标语言的数字文本包括:

4.如权利要求1所述文本转语音的优化方法,其中,所述待处理文本中的数字内容包含多个数字部分,所述利用预设转换规则和当前转换场景,将所述待处理文本中的数字内容转换为目标语言的数字文本包括:

5.如权利要求1所述文本转语音的优化方法,其中,所述目标语言包括中文,所述利用预设转换规则和当前转换场...

【专利技术属性】
技术研发人员:艾兵兵
申请(专利权)人:智道网联科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1