语音合成方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:41857030 阅读:18 留言:0更新日期:2024-06-27 18:31
本申请提供了一种语音合成方法、装置、设备、介质及程序产品,属于人工智能技术领域。该方法包括:获取第一文本特征和声学特征;为第一文本特征中各个词语的第一词语特征确定第一融合权重;基于第一融合权重,对各个词语的第一词语特征进行特征融合,得到第二文本特征;将第二文本特征和声学特征进行特征拼接,得到拼接特征;为拼接特征中每个维度上的特征分量确定第二融合权重;基于第二融合权重,对拼接特征中每个维度上的特征分量进行特征融合,得到融合特征;对融合特征进行语音合成,得到目标对象的音频数据。该方案能够将各个特征充分融合,使得计算机设备能够充分了解各个词语的语义和对应的发声特点,进而能够合成质量更高的音频数据。

【技术实现步骤摘要】

本申请涉及人工智能,特别涉及一种语音合成方法、装置、设备、介质及程序产品


技术介绍

1、语音合成技术作为人工智能
的一个重要分支,时下受到了人们的广泛关注。其中,语音合成是一种将计算机生成的或外部输入的文本数据转换为音频数据的技术,目前广泛应用在有声读物、智能客服、音色转换、语音合成助手等多个场景中。

2、其中,合成的音频数据的质量会严重影响用户听觉体验。比如,合成的音频数据的音质和音色越佳,用户的听觉体验便越好;反之亦然。

3、为此,目前亟需一种新的语音合成方法,来提升音频数据的质量。


技术实现思路

1、本申请实施例提供了一种语音合成方法、装置、设备、介质及程序产品,能够将各个特征充分融合,使得计算机设备能够充分了解各个词语的语义和对应的发声特点,进而能够合成质量更高的音频数据。所述技术方案如下:

2、一方面,提供了一种语音合成方法,所述方法包括:

3、获取待转换的文本数据的第一文本特征和目标对象的声学特征,所述第一文本特征中包括所述文本数据中各个词语本文档来自技高网...

【技术保护点】

1.一种语音合成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述为所述各个词语的第一词语特征确定第一融合权重,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述第i个第一词语特征与所述第i-1个第二词语特征的相似度,确定所述第i-1个第二词语特征的权重,包括:

4.根据权利要求2所述的方法,其特征在于,所述权重包括多个子权重,每个子权重对应所述第i-1个第二词语特征在一个特征空间内的映射特征,所述子权重用于指示将对应的映射特征融合到所述第i个第一词语特征中;

5.根据权利要求1所述的方法,其特征在...

【技术特征摘要】

1.一种语音合成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述为所述各个词语的第一词语特征确定第一融合权重,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述第i个第一词语特征与所述第i-1个第二词语特征的相似度,确定所述第i-1个第二词语特征的权重,包括:

4.根据权利要求2所述的方法,其特征在于,所述权重包括多个子权重,每个子权重对应所述第i-1个第二词语特征在一个特征空间内的映射特征,所述子权重用于指示将对应的映射特征融合到所述第i个第一词语特征中;

5.根据权利要求1所述的方法,其特征在于,所述为所述各个词语的第一词语特征确定第一融合权重,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述第一融合权重,对所述各个词语的第一词语特征进行特征融合,得到第二文本特征,包括:

7.根据权利要求2所述的方法,其特征在于,为第i个第一词语特征确定的第一融合权重还包括其他第一词语特征的权重,所述其他第一词语特征是所述第一文本特征中除所述第i个第一词语特征之外的第一词语特征;

8.根据权利要求7所述的方法,其特征在于,确定所述其他第一词语特征的权...

【专利技术属性】
技术研发人员:陈孝良常乐黄赟贺涂贤玲
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1