一种基于人工智能的语音合成方法技术

技术编号:34371117 阅读:56 留言:0更新日期:2022-07-31 11:12
本发明专利技术涉及语音合成技术领域,具体公开了一种基于人工智能的语音合成方法,包括如下步骤:S1、获取语音数据,并根据语音数据生成语音样本数据集;S2、对语音样本数据集进行识别训练,获取语音样本对应的文本数据;S3、对语音数据进行分割处理,获得分割后的单字语音数据,与文本数据建立映射关系;S4、将不同的单字语音数据重新合成为连续的语音数据,并与语音文本数据集进行比较;S5:通过步骤S4的对比结果建立语音合成模型的损失函数;S6:利用损失函数对语音合成模型进行训练,对模型进行调整,获取最终的语音合成模型;S7:利用步骤S6获得的语音合成模型,通过文本输出合成后的语音信息;本发明专利技术实现了根据文本合成语音数据。本发明专利技术实现了根据文本合成语音数据。本发明专利技术实现了根据文本合成语音数据。

A speech synthesis method based on Artificial Intelligence

【技术实现步骤摘要】
一种基于人工智能的语音合成方法


[0001]本专利技术涉及语音合成
,具体为一种基于人工智能的语音合成方法。

技术介绍

[0002]随着人工智能技术的发展,语音合成技术越来越受到人们的重视,语音合成被广泛运用于智能阅读、智能播报等应用场景。如根据文本播放语音,或在具体流程中播放预设语音。
[0003]现有的语音合成技术,主要采用循环神经网络模型进行语音合成,但利用循环神经网络模型进行语音合成的方式存在合成效率低的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种基于人工智能的语音合成方法,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于人工智能的语音合成方法,包括如下步骤:
[0006]S1、获取语音数据,并根据语音数据生成语音样本数据集;
[0007]S2、对语音样本数据集进行识别训练,获取语音样本对应的文本数据;
[0008]S3、对语音数据进行分割处理,获得分割后的单字语音数据,与文本数据建立映射关系;
[0009]S4、将不同的单字语音数据重新合成为连续的语音数据,并与语音文本数据集进行比较;
[0010]S5:通过步骤S4的对比结果建立语音合成模型的损失函数;
[0011]S6:利用损失函数对语音合成模型进行训练,对模型进行调整,获取最终的语音合成模型;
[0012]S7:利用步骤S6获得的语音合成模型,通过文本输出合成后的语音信息。
[0013]优选的,所述步骤S1中,建立语音样本数据集前对语音数据进行分析处理,去除无效的语音信息。
[0014]优选的,所述步骤S2中,识别语音后获得的文本数据进行校正处理,剔除错别字。
[0015]优选的,所述步骤S3中,对于分割后的单字语音数据进行处理,删除单字语音前后的干扰音段。
[0016]优选的,所述步骤S4中,按照步骤S2识别出来的文本信息,将步骤S3中的单字语音数据重新按照顺序进行组合,生成连续的语音信息。
[0017]优选的,所述步骤S5中,生成的损失函数使步骤S4中所生成的语音信息趋向于步骤S1中的语音数据。
[0018]优选的,所述步骤S6中,语音合成模型为步骤S4中将单字语音数据重新合成为连续的语音数据的模型。
[0019]优选的,所述步骤S7中,语音合成模型接收待合成语音的文本信息,利用映射关系获取对应的单字语音数据,并将单字语音数据重新合成为连续的语音数据,之后利用损失函数进行处理,最后输出合成后的语音信息。
[0020]与现有技术相比,本专利技术的有益效果是:本专利技术通过单字语音数据合成为连续的语音数据来实现语音合成的目的,并通过重复训练处理利用损失函数来降低合成后语音的不协调杂音问题,保障合成后语音的连贯性;相较于传统的循环神经网络模型进行语音合成的方式,具有更高的效率。
附图说明
[0021]图1为本专利技术的流程示意。
具体实施方式
[0022]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0023]请参阅图1,本专利技术提供一种技术方案:一种基于人工智能的语音合成方法,包括如下步骤:
[0024]S1、获取语音数据,并根据语音数据生成语音样本数据集;
[0025]S2、对语音样本数据集进行识别训练,获取语音样本对应的文本数据;
[0026]S3、对语音数据进行分割处理,获得分割后的单字语音数据,与文本数据建立映射关系;
[0027]S4、将不同的单字语音数据重新合成为连续的语音数据,并与语音文本数据集进行比较;
[0028]S5:通过步骤S4的对比结果建立语音合成模型的损失函数;
[0029]S6:利用损失函数对语音合成模型进行训练,对模型进行调整,获取最终的语音合成模型;
[0030]S7:利用步骤S6获得的语音合成模型,通过文本输出合成后的语音信息。
[0031]进一步的,所述步骤S1中,建立语音样本数据集前对语音数据进行分析处理,去除无效的语音信息。
[0032]进一步的,所述步骤S2中,识别语音后获得的文本数据进行校正处理,剔除错别字。
[0033]进一步的,所述步骤S3中,对于分割后的单字语音数据进行处理,删除单字语音前后的干扰音段。
[0034]进一步的,所述步骤S4中,按照步骤S2识别出来的文本信息,将步骤S3中的单字语音数据重新按照顺序进行组合,生成连续的语音信息。
[0035]进一步的,所述步骤S5中,生成的损失函数使步骤S4中所生成的语音信息趋向于步骤S1中的语音数据。
[0036]进一步的,所述步骤S6中,语音合成模型为步骤S4中将单字语音数据重新合成为
连续的语音数据的模型。
[0037]进一步的,所述步骤S7中,语音合成模型接收待合成语音的文本信息,利用映射关系获取对应的单字语音数据,并将单字语音数据重新合成为连续的语音数据,之后利用损失函数进行处理,最后输出合成后的语音信息。
[0038]工作原理:在步骤S1中,利用语音数据建立样本数据集,并在建立数据集之前,对语音信息进行分析识别,去除无效的语音信息,保障数据集的有效。步骤S2中,通过语音识别技术对于语音样本数据集获取对应的文本数据,同时对获得的文本数据进行校正处理,以保障文本数据的有效。后续步骤S3中,对语音进行分割,获取单字语音数据,并形成与对应文本的映射,同时对于单字语音数据进行处理,删除单字语音前后的干扰音段,保障语音信息的纯净。步骤S4中,单字语音数据按照文本信息重新组合成连续的语音数据,并与预先的语音信息进行比对,在步骤S5中建立损失函数,通过损失函数使重新组合后的语音信息趋向于最先的语音信息。步骤S6中,利用损失信息建立语音合成模型,并重复训练完善模型;在步骤S7中,接收到合成语音的文本信息后,利用映射关系获取单字语音数据,模型将单字语音数据重新合成为连续的语音数据,同时通过损失函数进行处理,最后输出合成后的语音信息。
[0039]尽管已经示出和描述了本专利技术的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本专利技术的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由所附权利要求及其等同物限定。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的语音合成方法,其特征在于:包括如下步骤:S1、获取语音数据,并根据语音数据生成语音样本数据集;S2、对语音样本数据集进行识别训练,获取语音样本对应的文本数据;S3、对语音数据进行分割处理,获得分割后的单字语音数据,与文本数据建立映射关系;S4、将不同的单字语音数据重新合成为连续的语音数据,并与语音文本数据集进行比较;S5:通过步骤S4的对比结果建立语音合成模型的损失函数;S6:利用损失函数对语音合成模型进行训练,对模型进行调整,获取最终的语音合成模型;S7:利用步骤S6获得的语音合成模型,通过文本输出合成后的语音信息。2.根据权利要求1所述的一种基于人工智能的语音合成方法,其特征在于:所述步骤S1中,建立语音样本数据集前对语音数据进行分析处理,去除无效的语音信息。3.根据权利要求1所述的一种基于人工智能的语音合成方法,其特征在于:所述步骤S2中,识别语音后获得的文本数据进行校正处理,剔除错别字。4.根据权利要求1所述的一种基于人工智...

【专利技术属性】
技术研发人员:黄雪澄
申请(专利权)人:南京小灿灿网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1