【技术实现步骤摘要】
文本转换方法及相关装置
[0001]本申请属于文本语音转换
,具体涉及一种文本转换方法及相关装置。
技术介绍
[0002]目前一般会参照预先构建的词典将文本自动转换成语音。随着词汇和语种的不断发展,在实际应用过程中发现存在许多词典中未包含的词,即OOV(Out of Vocabulary)词、或超出词表外的词。且在很多语种中存在同形异音的现象,即Polyphone、或多音字现象;然而,词典中通常情况下收录的是较为常用的发音。虽然OOV词和多音词数量较少,但是它们的发音对于整句话含义的表达产生十分重要的影响。如果合成的音频中的多音词或者OOV词发音错误,会给用户造成不知所云的感觉,导致合成的音频效果大打折扣。
技术实现思路
[0003]本申请提供一种文本转换方法及相关装置,以利用统一的方式一并解决OOV词和多音词的问题。
[0004]为解决上述技术问题,本申请采用的一个技术方案是:提供一种文本转换方法,包括:获得待转换文本中的词,并设置非标点符号的所述词的标签;其中,所述标签包括词典中的多音词、词 ...
【技术保护点】
【技术特征摘要】
1.一种文本转换方法,其特征在于,包括:获得待转换文本中的词,并设置非标点符号的所述词的标签;其中,所述标签包括词典中的多音词、词典中的非多音词或非词典中词;针对非标点符号的所述词,响应于所述词为词典中的非多音词,从所述词典中匹配获得所述词的音素序列和重音信息;响应于所述词为词典中的多音词和非词典中词,基于所述词构建对应的组合词,基于所述组合词和预测模型获得所述词的音素序列和重音信息;其中,当所述词为词典中的多音词时,所述组合词与所述词的上下文信息相关;当所述词为非词典中词时,所述组合词与所述词的上下文信息无关。2.根据权利要求1所述的文本转换方法,其特征在于,所述响应于所述词为词典中的多音词和非词典中词,基于所述词构建对应的组合词的步骤,包括:响应于所述词为词典中的多音词,将所述词和与所述词紧邻的其他词进行组合以获得对应的组合词;响应于所述词为非词典中词,将与所述词紧邻的其他词视为空词,将所述词和紧邻的空词进行组合以获得对应的组合词。3.根据权利要求2所述的文本转换方法,其特征在于,所述响应于所述词为词典中的多音词,将所述词和与所述词紧邻的其他词进行组合以获得对应的组合词的步骤,包括:获得与所述词紧邻的前词和后词;响应于所述前词或后词为标点符号,将为标点符号的所述前词或后词视为空词;从所述前词和后词中获得与所述词紧邻的部分字符,并将所述部分字符和所述词按照在所述待转换文本中的正向顺序排列以获得组合词。4.根据权利要求1所述的文本转换方法,其特征在于,所述基于所述组合词和预测模型获得所述词的音素序列和重音信息的步骤,包括:获得所述组合词的第一矩阵表示;其中,所述组合词中的每个字符映射为所述第一矩阵表示中的一行元素;将所述第一矩阵表示输入至所述预测模型中,获得所述组合词的第二矩阵表示;其中,所述第二矩阵表示中的一行元素表示所述第一矩阵表示中对应行元素的字符为元音还是辅音,且当所述字符为元音时是否带重音;将所述第二矩阵表示通过字典映射的形式还原以获得所述词的音素序列和重音信息。5.根据权利要求4所述的文本转换方法,其特征在于,所述第一矩阵表示包含M行N列元素;其中,M为预设所述组合词的最大字符长度,N为所述待转换文本所属语种的全部字符的个数;所述获得所述组合词的第一矩阵表示的步骤,包括:按照逆向顺序获得所述组合词中一个字符;获得当前所述字符在所属语种的字符序列中的排序位置,将所述第一矩阵表示中与当前所述字符对应的行元素中对应所述排序位置的元素设置为1,其余排序位置的元素设置为0;...
【专利技术属性】
技术研发人员:张威,倪嘉禾,高丽,祖漪清,江源,
申请(专利权)人:西安讯飞超脑信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。