中英文语音混合合成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:29932322 阅读:17 留言:0更新日期:2021-09-04 19:02
本发明专利技术涉及一种中英文语音混合合成方法、装置、电子设备和存储介质,该方法包括:获取待合成文本;判断待合成文本中中文文字的数量大于还是小于英文单词数量;若中文文字的数量大于所述英文单词数量,对人名和/或地名以及中文文本按照中文方式合成语音;若中文文字的数量小于英文单词数量,对人名和/或地名以及英文文本按照英文方式合成语音。本申请实施例中实现了将中文英文混合的文本合成语音,如将报纸上的中文英文混合的文本合成语音,即通过语音朗读出来,本申请实施例中通过比较中文文字的数量和英文单词数量多少,对人名和/或地名、中文文本和英文文本采取不同的语音合成方式,与现有技术中合成的语音相比更地道。与现有技术中合成的语音相比更地道。与现有技术中合成的语音相比更地道。

【技术实现步骤摘要】
中英文语音混合合成方法、装置、电子设备和存储介质


[0001]本专利技术涉及语音处理
,具体涉及一种中英文语音混合合成方法、装置、电子设备和存储介质。

技术介绍

[0002]目前,合成中英文语音时,对合成文本进行解析,合成方法有两大类:用中文数据和英文数据分别构建中文合成模型和英文合成模型,中文部分用中文合成模型合成,英文部分用英文合成模型合成;用中文数据和英文数据构建模型,该模型同时支持中文合成和英文合成,中文部分和英文部分使用同一套模型合成。
[0003]但是,上述方法对于中英文混读合成中的人名和地名,如果按照现有方案进行合成,其发音不符合地道发音人的发音习惯,听起来不够地道。

技术实现思路

[0004]本专利技术提供一种中英文语音混合合成方法、装置、电子设备和存储介质,能够解决合成的中英文语音混合不地道的技术问题。
[0005]本专利技术解决上述技术问题的技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种中英文语音混合合成方法,包括:
[0007]获取待合成文本;
[0008]判断待合成文本中中文文字的数量大于还是小于英文单词数量;
[0009]若中文文字的数量大于所述英文单词数量,对人名和/或地名以及中文文本按照中文方式合成语音;
[0010]若中文文字的数量小于所述英文单词数量,对人名和/或地名以及英文文本按照英文方式合成语音。
[0011]在一些实施例中,按照中文方式合成语音,包括:
[0012]判断英文文本中是否包括人名和/或地名;
[0013]若判断结果为英文文本中包括所述人名和/或地名;
[0014]将人名和/或地名以及中文文本转换成国际音标输入到中文合成模型合成语音;以及将英文文本转换成国际音标输入到英文合成模型合成语音。
[0015]在一些实施例中,按照英文方式合成语音,包括:
[0016]判断中文文本中是否包括人名和/或地名;
[0017]若判断结果为中文文本中包括所述人名和/或地名;
[0018]将人名和/或地名以及英文文本转换成国际音标输入到英文合成模型合成语音;以及将中文文本转换成国际音标输入到中文合成模型合成语音。
[0019]在一些实施例中,中文合成模型的训练步骤如下:
[0020]获取多个中文文本国际音标以及语音对;
[0021]将多个中文文本国际音标作为输入,对应的语音作为输出进行训练得到中文合成
模型。
[0022]在一些实施例中,英文合成模型的训练步骤如下:
[0023]获取多个英文文本国际音标以及语音对;
[0024]将多个英文文本国际音标作为输入,对应的语音作为输出进行训练得到英文合成模型。
[0025]在一些实施例中,判断中文文本中是否包括人名和/或地名是通过命名实体识别模型判断的。
[0026]在一些实施例中,判断英文文本中是否包括人名和/或地名是通过命名实体识别模型判断的。
[0027]第二方面,本专利技术实施例还提供了一种中英文语音混合合成装置,包括:
[0028]获取模块:用于获取待合成文本;
[0029]判断模块:用于判断待合成文本中中文文字的数量大于还是小于英文单词数量;
[0030]合成模块:用于若中文文字的数量大于所述英文单词数量,对人名和/或地名以及中文文本按照中文方式合成语音;若中文文字的数量小于所述英文单词数量,对人名和/或地名以及英文文本按照英文方式合成语音。
[0031]第三方面,本专利技术实施例还提供了一种电子设备,包括:处理器和存储器;
[0032]所述处理器通过调用所述存储器存储的程序或指令,用于执行如上所述任一项所述中英文语音混合合成方法。
[0033]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如上所述任一项所述中英文语音混合合成方法。
[0034]本专利技术的有益效果是:本专利技术涉及一种中英文语音混合合成方法、装置、电子设备和存储介质,该方法包括:获取待合成文本;判断待合成文本中中文文字的数量大于还是小于英文单词数量;若中文文字的数量大于所述英文单词数量,对人名和/或地名以及中文文本按照中文方式合成语音;若中文文字的数量小于英文单词数量,对人名和/或地名以及英文文本按照英文方式合成语音。本申请实施例中实现了将中文英文混合的文本合成语音,如将报纸上的中文英文混合的文本合成语音,即通过语音朗读出来,本申请实施例中通过比较中文文字的数量和英文单词数量多少,对人名和/或地名、中文文本和英文文本采取不同的语音合成方式,与现有技术中合成的语音相比更地道。
附图说明
[0035]图1为本专利技术实施例提供的一种中英文语音混合合成方法图之一;
[0036]图2为本专利技术实施例提供的一种中英文语音混合合成方法图之二;
[0037]图3为本专利技术实施例提供的一种中英文语音混合合成方法图之三;
[0038]图4为本专利技术实施例提供的一种中英文语音混合合成方法图之四;
[0039]图5为本专利技术实施例提供的一种中英文语音混合合成方法图之五;
[0040]图6为本专利技术实施例提供的一种中英文语音混合合成装置图;
[0041]图7为本专利技术实施例提供的一种电子设备的示意性框图。
具体实施方式
[0042]以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。
[0043]为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本公开,而非对本申请的限定。基于所描述的本申请的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
[0044]需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0045]图1为本专利技术实施例提供的中英文语音混合合成方法图之一。
[0046]第一方面,如图1所示,本专利技术实施例提供了一种中英文语音混合合成方法,包括如下S101、S102和S103三个步骤:
[0047]S101:获取待合成文本。
[0048]具体的,本申请实施例中的待合成文本可以是杂志、报纸上的中英文文本,即文本中不仅包括中文文本而且包括英文文本。示例性的,Chinese是中国的语言文学、Beijing是中国的首都和Lucy是美国人等。
[0049]S102:判断待合成文本中中文文字的数量大于还是小于英文单词数量。
[0050]具体的,本申请实施例中,待合成文本中不仅包括中文文本而且包括英文文本,应理解,通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种中英文语音混合合成方法,其特征在于,包括:获取待合成文本;判断所述待合成文本中中文文字的数量大于还是小于英文单词数量;若所述中文文字的数量大于所述英文单词数量,对人名和/或地名以及中文文本按照中文方式合成语音;若所述中文文字的数量小于所述英文单词数量,对人名和/或地名以及英文文本按照英文方式合成语音。2.根据权利要求1所述的中英文语音混合合成方法,其特征在于,所述按照中文方式合成语音,包括:判断英文文本中是否包括人名和/或地名;若判断结果为所述英文文本中包括所述人名和/或地名;将所述人名和/或地名以及中文文本转换成国际音标输入到中文合成模型合成语音;以及将所述英文文本转换成国际音标输入到英文合成模型合成语音。3.根据权利要求1所述的中英文语音混合合成方法,其特征在于,所述按照英文方式合成语音,包括:判断中文文本中是否包括人名和/或地名;若判断结果为所述中文文本中包括所述人名和/或地名;将所述人名和/或地名以及英文文本转换成国际音标输入到英文合成模型合成语音;以及将所述中文文本转换成国际音标输入到中文合成模型合成语音。4.根据权利要求2或3所述的中英文语音混合合成方法,其特征在于,所述中文合成模型的训练步骤如下:获取多个中文文本国际音标以及语音对;将所述多个中文文本国际音标作为输入,对应的语音作为输出进行训练得到中文合成模型。5.根据权利要...

【专利技术属性】
技术研发人员:孙见青梁家恩
申请(专利权)人:厦门云知芯智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1