【技术实现步骤摘要】
韵律预测方法、装置、设备和介质
本申请实施例涉及数据处理领域,尤其涉及语音合成技术。具体地,本实施例提供了一种韵律预测方法、装置、设备和介质。
技术介绍
在语音合成前,需要对语音的文本进行韵律预测。现有韵律预测方法包括:通过机器学习方法根据预先训练的预测模型对待预测的文本内容进行预测,获取该文本内容对应的停顿预测结果,其中,停顿预测结果可包括停顿位置,停顿类型(可包括长停顿、短停顿等)以及与停顿类型相对应的概率值。上述方案存在如下缺陷:对待预测的文本内容不进行语言种类的区分,当文本内容既包括中文又包括英文,也即待预测文本为中英混合文本时,很可能直接将英文单词看作多个字母进行处理。然而,直接将英文单词看作多个字母进行处理,会丢失单词的语义信息,从而降低了文本韵律预测的准确率。
技术实现思路
本申请实施例提供了一种韵律预测方法、装置、设备和介质,以提高对中英混合文本的韵律预测准确率。本申请实施例提供了一种韵律预测方法,该方法包括:对待预测的中英混合文本进行切分,得到中文
【技术保护点】
1.一种韵律预测方法,其特征在于,包括:/n对待预测的中英混合文本进行切分,得到中文文本和英文文本;/n确定中文文本中文字的字向量和英文文本中单词的词向量;/n根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。/n
【技术特征摘要】
1.一种韵律预测方法,其特征在于,包括:
对待预测的中英混合文本进行切分,得到中文文本和英文文本;
确定中文文本中文字的字向量和英文文本中单词的词向量;
根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果,包括:
根据文字和单词在所述中英混合文本中的位置,对所述文字的字向量和所述单词的词向量进行排序,生成文本向量序列;
根据所述文本向量序列确定所述中英混合文本的韵律预测结果。
3.根据权利要求1所述的方法,其特征在于,所述确定英文文本中单词的词向量,包括:
将英文文本中的单词切分为字母序列;
确定所述字母序列中字母的字母向量;
根据确定的字母向量,提取表示单词语义的词向量。
4.根据权利要求3所述的方法,其特征在于,所述根据确定的字母向量,提取表示单词语义的词向量,包括:
根据字母在所述字母序列中的排列位置,对所述字母向量进行排序,生成字母向量序列;
基于字母向量注意力分配概率,对所述字母向量序列进行编码,生成语义表示;
解码所述语义表示,得到所述词向量。
5.根据权利要求1所述的方法,其特征在于,通过中英混韵律识别模型确定中英混合文本的韵律预测结果;
其中所述中英混韵律识别模型包括中英混语言模型和韵律网络层;所述中英混语言模型基于无监督学习训练得到。
6.一种韵律预测装置,其特征在于,包括:
文本拆分模块,用于对待预测的中英混合文本进行切分,得到中文文本和英文文本;
词向量确定模块,用于确定中文文本中文字的字向量和英文文本中单词的词向量;
结果确定模块,用于根据确定的字向量和...
【专利技术属性】
技术研发人员:高占杰,聂志朋,卞衍尧,陈昌滨,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。