System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据筛选方法、装置及语音合成方法、装置制造方法及图纸_技高网

数据筛选方法、装置及语音合成方法、装置制造方法及图纸

技术编号:40450189 阅读:7 留言:0更新日期:2024-02-22 23:09
本申请提供了一种数据筛选方法、装置及语音合成方法、装置,其中,该筛选方法包括:从样本数据中提取音频特征,利用聚类算法对所述音频特征进行聚类,以将所述样本数据分成不同的簇;利用聚类评估指标依次计算所述不同的簇中每两个簇的差异值;基于所述差异值,将特征均值与所述不同的簇中的其他簇的特征均值不同的簇筛选出来,作为具有显著性水平的样本数据。本申请解决了现有语音合成技术中合成的语音不够逼真的技术问题。

【技术实现步骤摘要】

本申请涉及语音合成,具体而言,涉及一种数据筛选方法、装置及语音合成方法、装置


技术介绍

1、当前的语音合成技术在模仿人类语音方面取得了巨大进展,这得益于深度学习模型的应用。深度学习模型通过神经网络学习声音特征和语音模式,使得合成语音在音色、语调和风格方面更接近于真实说话人。然而,尽管取得了显著进展,语音合成仍然面临着挑战,主要体现在合成语音的逼真度问题上。

2、存在上述问题的主要原因在于模型尚未能够全面理解人类语音的复杂性。真实语音中蕴含着丰富的情感、语境、以及个体特有的说话习惯,而当前的模型难以准确捕捉到这些微妙之处。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种数据筛选方法、装置及语音合成方法、装置,以至少解决现有语音合成技术中合成的语音不够逼真的技术问题。

2、根据本申请实施例的一个方面,提供了一种数据筛选方法,包括:从样本数据中提取音频特征,并使用聚类算法将所述音频特征进行聚类,得到不同的簇;利用聚类评估指标计算所述不同的簇中每两个簇的差异值;基于所述差异值,将特征均值与所述不同的簇中的其他簇的特征均值不同的簇筛选出来,作为具有显著性水平的样本数据。

3、根据本申请实施例的另一方面,还提供了一种数据筛选装置,包括:聚类模块,被配置为从样本数据中提取音频特征,利用聚类算法对所述音频特征进行聚类,以将所述样本数据分成不同的簇;计算模块,被配置为利用聚类评估指标依次计算所述不同的簇中每两个簇的差异值;筛选模块,被配置为基于所述差异值,将特征均值与所述不同的簇中的其他簇的特征均值不同的簇筛选出来,作为具有显著性水平的样本数据。

4、根据本申请实施例的又一个方面,提供了一种语音合成方法,包括:利用上述数据筛选方法筛选出的样本数据作为训练数据来训练语音合成模型;利用所述语音合成模型来进行语音合成。

5、根据本申请实施例的又一个方面,提供了一种语音合成装置,包括:如上所述的数据筛选装置;训练模块,被配置为利用所述数据筛选装置筛选出的样本数据作为训练数据来训练语音合成模型;合成模块,被配置为利用所述语音合成模型来进行语音合成。

6、在本申请实施例中,从样本数据中提取音频特征,并使用聚类算法将所述音频特征进行聚类,得到不同的簇;利用聚类评估指标计算所述不同的簇中每两个簇的差异值;基于所述差异值,将特征均值与所述不同的簇中的其他簇的特征均值不同的簇筛选出来,作为具有显著性水平的样本数据。通过上述方案,解决了现有语音合成技术中合成的语音不够逼真的技术问题。

本文档来自技高网...

【技术保护点】

1.一种数据筛选方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,利用聚类评估指标依次计算所述不同的簇中每两个簇的差异值,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述每两个簇之间的簇间均方和所述不同的簇中每个簇的簇内均方,来计算所述每两个簇的差异值,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述差异值,将特征均值与所述不同的簇中的其他簇的特征均值不同的簇筛选出来,包括:

5.根据权利要求1至4中任一项所述的方法,其特征在于,利用聚类算法对所述音频特征进行聚类,包括:

6.一种语音合成方法,其特征在于,包括:

7.一种数据筛选装置,其特征在于,包括:

8.一种语音合成装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有程序,其特征在于,在所述程序运行时,使得计算机执行如权利要求1至5中任一项所述的方法。

【技术特征摘要】

1.一种数据筛选方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,利用聚类评估指标依次计算所述不同的簇中每两个簇的差异值,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述每两个簇之间的簇间均方和所述不同的簇中每个簇的簇内均方,来计算所述每两个簇的差异值,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述差异值,将特征均值与所述不同的簇中的其他簇的特征均值不同的簇筛选出来,包括:

【专利技术属性】
技术研发人员:蒋正浩王建成
申请(专利权)人:世优北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1