System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音生成方法、装置、计算机设备和存储介质制造方法及图纸_技高网

语音生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:40679545 阅读:4 留言:0更新日期:2024-03-18 19:18
本申请涉及一种语音生成方法、装置、计算机设备和存储介质,涉及计算机技术领域。可用于金融科技领域或其他相关领域。所述方法包括:从预设的语音数据库中查找语音文本对应的音节标记数据;根据语音文本,确定语音文本的韵律参数信息;根据韵律参数信息和音节标记数据,对语音文本的语音波形数据进行修改,得到音节标记数据对应的待合成波形数据;根据待合成波形数据,生成语音文本对应的目标语音。采用本方法能够通过分析语音文本的上下文语义,确定语音文本的韵律参数,结合语音文本在语音数据库中的音节标记数据,修改语音文本各语音段对应的语音波形,得到具有与语音文本的上下文语义相匹配的韵律特征的目标语音,提高合成的语音的自然度。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种语音生成方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、在金融领域中,客户服务是用户与平台之间进行高效交流的重要途径,自动客服可以大大提高用户与平台之间的交流效率,自动客服的客服语音对改善用户体验发挥着重要作用。

2、传统技术主要采用线性预测编码技术(lpc)进行语音合成,线性预测编码技术是一种时间波形的编码技术,线性预测编码技术可以看作对语音的解码和拼接过程,然而,传统技术无法考虑到自然语流中的语音和孤立状况下的语音之间的区别,不利于提高合成的语音的自然度。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高合成的语音的自然度的语音生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种语音生成方法,包括:

3、从预设的语音数据库中查找语音文本对应的音节标记数据;所述预设的语音数据库包括至少一个经过预先音节标记的音节样本;

4、根据所述语音文本,确定所述语音文本对应的韵律参数信息;

5、根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据;

6、根据所述待合成波形数据,生成所述语音文本对应的目标语音。

7、在其中一个实施例中,所述根据所述语音文本,确定所述语音文本对应的韵律参数信息,包括:

8、按照预设的词调规则和语调规则,确定所述语音文本对应的调域信息和调型信息;

9、根据所述语音文本,确定所述语音文本对应的发音时长信息和发音停顿信息;

10、根据所述调域信息、所述调型信息、所述发音时长信息和所述发音停顿信息,确定所述语音文本对应的韵律参数信息。

11、在其中一个实施例中,所述根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

12、获取所述语音波形数据中各语音片段的基音周期,根据所述各语音片段的基音周期,确定各语音片段的基音标注位置;

13、根据所述基音周期和所述基音标注位置,生成所述各语音片段的片段波形数据对应的同步波形数据;所述同步波形数据与所述各语音片段的片段波形数据的基音标记相匹配;

14、根据所述韵律参数信息和所述音节标记数据,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据。

15、在其中一个实施例中,所述根据所述各语音片段的基音周期,确定各语音片段的基音标注位置,包括:

16、针对所述各语音片段中的任意一个浊音片段,将所述浊音片段中目标峰值数据对应的坐标位置作为标注点;

17、根据所述浊音片段中目标峰值数据对应的基音周期和所述标注点,确定所述浊音片段对应的候选标注位置;

18、基于动态规划,从所述候选标注位置中筛选出所述浊音片段的基音标注位置;所述基音标注位置满足预设的动态规划路径条件;

19、根据所述浊音片段的基音标注位置,确定所述各语音片段的基音标注位置。

20、在其中一个实施例中,所述根据所述韵律参数信息和所述音节标记数据,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

21、根据所述韵律参数信息,确定所述音节标记数据对应的基频修改参数和时长修改参数;

22、根据所述基频修改参数和所述时长修改参数,确定所述同步波形数据对应的合成时间信息和分析时间信息;

23、在所述合成时间信息和所述分析时间信息对应的时间点,按照所述基频修改参数和所述时长修改参数,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据。

24、在其中一个实施例中,所述按照所述基频修改参数和所述时长修改参数,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

25、根据所述基频修改参数和所述时长修改参数,确定所述同步波形数据对应的待修改标注点和待修改标注点间距信息;

26、根据所述待修改标注点和所述待修改标注点间距信息,修改所述同步波形数据的音长和音高,得到所述音节标记数据对应的待合成波形数据。

27、在其中一个实施例中,所述从预设的语音数据库中查找语音文本对应的音节标记数据,包括:

28、获取所述语音文本对应的音节数据;

29、在所述预设的语音数据库中的音节样本中查找与所述音节数据相匹配的候选音节数据;

30、将所述候选音节数据作为所述语音文本对应的音节标记数据。

31、第二方面,本申请还提供了一种语音生成装置,包括:

32、查找模块,用于从预设的语音数据库中查找语音文本对应的音节标记数据;所述预设的语音数据库包括至少一个经过预先音节标记的音节样本;

33、确定模块,用于根据所述语音文本,确定所述语音文本对应的韵律参数信息;

34、修改模块,用于根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据;

35、生成模块,用于根据所述待合成波形数据,生成所述语音文本对应的目标语音。

36、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

37、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

38、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

39、上述语音生成方法、装置、计算机设备、存储介质和计算机程序产品,通过从预设的语音数据库中查找语音文本对应的音节标记数据,从而利用预设的语音数据库中经过预先音节标记的音节样本,确定语音文本中各音节对应的音节信息;根据语音文本,确定语音文本对应的韵律参数信息,从而通过分析语音文本的语义,确定与语音文本的韵律相关的参数信息;根据韵律参数信息和音节标记数据,对语音文本的语音波形数据进行修改,得到音节标记数据对应的待合成波形数据,从而基于韵律参数信息和音节标记数据,针对性地修改语音文本的语音波形数据,得到待合成波形数据;根据待合成波形数据,生成语音文本对应的目标语音,能够通过分析语音文本的韵律特征,结合语音文本在预设的语音数据库中的音节标记数据,对语音文本的各语音段对应的语音波形进行针对性修改,得到待合成语音波形数据,并将待合成语音波形数据拼接和转换,得到目标语音,实现通过分析语音文本的上下文语义,确定语音文本的韵律参数,结合语音文本在预设的语音数据库中本文档来自技高网...

【技术保护点】

1.一种语音生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述语音文本,确定所述语音文本对应的韵律参数信息,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述各语音片段的基音周期,确定各语音片段的基音标注位置,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述韵律参数信息和所述音节标记数据,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

6.根据权利要求5所述的方法,其特征在于,所述按照所述基频修改参数和所述时长修改参数,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

7.根据权利要求1所述的方法,其特征在于,所述从预设的语音数据库中查找语音文本对应的音节标记数据,包括:

8.一种语音生成装置,其特征在于,所述装置包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种语音生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述语音文本,确定所述语音文本对应的韵律参数信息,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述各语音片段的基音周期,确定各语音片段的基音标注位置,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述韵律参数信息和所述音节标记数据,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:

6.根据权利要求5所述的方法,其特征在于,所述按照所述基频修改参...

【专利技术属性】
技术研发人员:周远侠
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1