【技术实现步骤摘要】
本专利技术涉及语音合成,具体涉及文本特征的上采样方法、电子设备及存储介质。
技术介绍
1、在语音合成声学模型对语音进行处理时,会碰到文本特征(如音素)序列和声学特征(如梅尔谱)序列长度不匹配的问题。针对这一问题,一些算法方案是通过先预测文本特征的时长,再进行文本特征上采样来解决。如图1所示,在具体处理中,一般是将文本特征序列通过一个编码器编码成隐状态向量序列,再对每个隐状态向量重复一定的次数,重复后的序列长度和声学特征序列长度保持一致。
2、由于在语音信号处理领域对应音素边界的划分不准,一般会将语音信号划分成固定长度的帧来处理,但没有哪一种分帧方法能保证每一个音素的边界刚好落在语音帧的边界。如图2所示,某些语音帧会有音素重叠(即同时包含两个音素的语音片断),某些音素会有发音缺失。因此,在音素边界划分不准的情况下,这种简单重复的上采样方法会导致一定程度上的发音不连续、机械音等问题。
技术实现思路
1、有鉴于此,本专利技术实施例提供了一种文本特征的上采样方法、电子设备及存储介质,以
...【技术保护点】
1.一种文本特征的上采样方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:
3.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:
4.根据权利要求3所述的方法,其特征在于,所述获取所述当前文本特征的权重系数,包括:
5.根据权利要求3所述的方法,其特征在于,所述
...【技术特征摘要】
1.一种文本特征的上采样方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:
3.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:
4.根据权利要求3所述的方法,其特征在于,所述获取所述当前文本特征的权重系数,包括:
5.根据权利要求3所述的方法,其特征在于,所述权重系数包括调整权重系数,所述基于所述主权重项与所述第一系数...
【专利技术属性】
技术研发人员:雷延强,
申请(专利权)人:广州视源电子科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。