文本特征的上采样方法、电子设备及存储介质技术

技术编号:41267802 阅读:20 留言:0更新日期:2024-05-11 09:23
本发明专利技术涉及语音合成技术领域,具体涉及文本特征的上采样方法、电子设备及存储介质,该方法包括获取当前文本特征以及当前文本特征的相邻文本特征;对当前文本特征以及相邻文本特征的时长进行预测,确定当前文本特征以及相邻文本特征的语音帧数,以确定当前文本特征的上采样帧数;基于当前文本特征与相邻文本特征的前后位置关系,确定当前文本特征的第一权重以及相邻文本特征的第二权重;根据第一权重以及第二权重,对当前文本特征以及相邻文本特征进行上采样,确定上采样帧数的采样结果。利用第一权重与第二权重对当前文本特征以及相邻文本特征进行上采样,使得最终得到的采样结果保留了当前文本特征与相邻文本特征,能够保证后续语音合成的效果。

【技术实现步骤摘要】

本专利技术涉及语音合成,具体涉及文本特征的上采样方法、电子设备及存储介质


技术介绍

1、在语音合成声学模型对语音进行处理时,会碰到文本特征(如音素)序列和声学特征(如梅尔谱)序列长度不匹配的问题。针对这一问题,一些算法方案是通过先预测文本特征的时长,再进行文本特征上采样来解决。如图1所示,在具体处理中,一般是将文本特征序列通过一个编码器编码成隐状态向量序列,再对每个隐状态向量重复一定的次数,重复后的序列长度和声学特征序列长度保持一致。

2、由于在语音信号处理领域对应音素边界的划分不准,一般会将语音信号划分成固定长度的帧来处理,但没有哪一种分帧方法能保证每一个音素的边界刚好落在语音帧的边界。如图2所示,某些语音帧会有音素重叠(即同时包含两个音素的语音片断),某些音素会有发音缺失。因此,在音素边界划分不准的情况下,这种简单重复的上采样方法会导致一定程度上的发音不连续、机械音等问题。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种文本特征的上采样方法、电子设备及存储介质,以解决由于简单重复上采本文档来自技高网...

【技术保护点】

1.一种文本特征的上采样方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:

3.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:

4.根据权利要求3所述的方法,其特征在于,所述获取所述当前文本特征的权重系数,包括:

5.根据权利要求3所述的方法,其特征在于,所述权重系数包括调整权重...

【技术特征摘要】

1.一种文本特征的上采样方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:

3.根据权利要求1所述的方法,其特征在于,所述对基于所述当前文本特征与所述相邻文本特征的前后位置关系,确定所述当前文本特征的第一权重以及所述相邻文本特征的第二权重,包括:

4.根据权利要求3所述的方法,其特征在于,所述获取所述当前文本特征的权重系数,包括:

5.根据权利要求3所述的方法,其特征在于,所述权重系数包括调整权重系数,所述基于所述主权重项与所述第一系数...

【专利技术属性】
技术研发人员:雷延强
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1