一种基于蒙太奇的语音合成方法、系统及设备技术方案

技术编号:33162094 阅读:13 留言:0更新日期:2022-04-22 14:20
本申请公开了一种基于蒙太奇的语音合成方法、系统及设备,其中方法包括:对待处理文本已有的自然段落进行段落分段预处理后,基于场景类型、情感层次类型将待处理文本分为若干个实际段落;计算若干个实际段落中相邻段落的场景和情感层次的相关性;设定待处理文本的语调参数后,根据相关性计算待处理文本的语调变化比例和语调变化方向;根据语调变化比例和语调变化方向对待处理文本进行段落语音合成。解决了现有技术语音合成听起来十分生硬的技术问题。题。题。

【技术实现步骤摘要】
一种基于蒙太奇的语音合成方法、系统及设备


[0001]本申请涉及语音合成
,尤其涉及一种基于蒙太奇的语音合成方法、系统及设备。

技术介绍

[0002]蒙太奇通常是指电影中的场景转换,通过镜头、场面、段落的分切与组接,对素材进行选择和取舍,以使表现内容主次分明,达到高度的概括和集中,然而在语音合成中却难以实现,所以常常在合成语音(TTS)中,会出现长篇大论式的催眠,究其原因,缺少场景转换的方式,使得用户在多个场景中用同一个场景的表达方式,这是因为现有技术只是对语音进行简单的文字转换输出,导致语音合成听起来十分生硬。

技术实现思路

[0003]本申请提供了一种基于蒙太奇的语音合成方法、系统及设备,用于解决现有技术语音合成听起来十分生硬的技术问题。
[0004]有鉴于此,本申请第一方面提供了一种基于蒙太奇的语音合成方法,所述方法包括:对待处理文本已有的自然段落进行段落分段预处理后,基于场景类型、情感层次类型将待处理文本分为若干个实际段落;计算若干个所述实际段落中相邻段落的场景和情感层次的相关性;设定待处理文本的语调参数后,根据所述相关性计算待处理文本的语调变化比例和语调变化方向;根据所述语调变化比例和所述语调变化方向对待处理文本进行段落语音合成。
[0005]可选地,所述对待处理文本已有的自然段落进行段落分段预处理,具体包括:通过换行键对待处理文本已有的自然段落进行段落划分处理。
[0006]可选地,所述基于场景类型、情感层次类型将待处理文本分为若干个实际段落,具体包括:将场景类型相同且情感层次类型相同的不同段落合并为同一段落,将同一段落中场景类型不同且情感层次类型不同的子段落相应划分为若干个段落。
[0007]可选地,所述计算若干个所述实际段落中相邻段落的场景和情感层次的相关性,具体包括:通过人工对待处理文本进行场景和情感层次标注后进行相关性训练得到相关性计算模型,基于所述相关性计算模型计算若干个所述实际段落中相邻段落的场景和情感层次的相关性。
[0008]可选地,所述设定待处理文本的语调参数后,根据所述相关性计算待处理文本的语调变化比例和语调变化方向,具体包括:设定待处理文本的总调值变化的比例范围、基准语调和起调的上下限,计算相邻
段落的语调变化比例,以及计算所述总调值变化与所述相关性的比例和相邻段落的语调的升降并作为语调变化方向,从而得到待处理文本的语调变化比例和语调变化方向。
[0009]本申请第二方面提供一种基于蒙太奇的语音合成系统,所述系统包括:划分单元,用于对待处理文本已有的自然段落进行段落分段预处理后,基于场景类型、情感层次类型将待处理文本分为若干个实际段落;第一计算单元,用于计算若干个所述实际段落中相邻段落的场景和情感层次的相关性;第二计算单元,用于设定待处理文本的语调参数后,根据所述相关性计算待处理文本的语调变化比例和语调变化方向;合成单元,用于根据所述语调变化比例和所述语调变化方向对待处理文本进行段落语音合成。
[0010]可选地,所述划分单元,具体用于:通过换行键对待处理文本已有的自然段落进行段落划分处理;将场景类型相同且情感层次类型相同的不同段落合并为同一段落,将同一段落中场景类型不同且情感层次类型不同的子段落相应划分为若干个段落。
[0011]可选地,所述第一计算单元,具体用于:通过人工对待处理文本进行场景和情感层次标注后进行相关性训练得到相关性计算模型,基于所述相关性计算模型计算若干个所述实际段落中相邻段落的场景和情感层次的相关性。
[0012]可选地,所述第二计算单元,具体用于:设定待处理文本的总调值变化的比例范围、基准语调和起调的上下限,计算相邻段落的语调变化比例,以及计算所述总调值变化与所述相关性的比例和相邻段落的语调的升降并作为语调变化方向,从而得到待处理文本的语调变化比例和语调变化方向。
[0013]本申请第三方面提供一种基于蒙太奇的语音合成设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的基于蒙太奇的语音合成方法的步骤。
[0014]从以上技术方案可以看出,本申请具有以下优点:本申请提供了一种基于蒙太奇的语音合成方法,包括:对待处理文本已有的自然段落进行段落分段预处理后,基于场景类型、情感层次类型将待处理文本分为若干个实际段落;计算若干个实际段落中相邻段落的场景和情感层次的相关性;设定待处理文本的语调参数后,根据相关性计算待处理文本的语调变化比例和语调变化方向;根据语调变化比例和语调变化方向对待处理文本进行段落语音合成。与现有技术相比,本申请首先根据场景和情感层次对待处理文本进行划分,得到符合实际场景和情感的段落,再计算相邻段落的相关性,基于相关性确定然后确定段落的起调和该实际段落的基准语调等参数,从而得到待处理文本的语调变化比例和语调变化方向,最后根据上述确定的语调变化比例和语调变化方向,进行段落语音合成,使语音合成更加生动,符合人的听觉习惯。从而解决了现有技术语音合成听起来十分生硬的技术问题。
附图说明
[0015]图1为本申请实施例中提供的一种基于蒙太奇的语音合成方法实施例的流程示意图;图2为本申请实施例中提供的一种基于蒙太奇的语音合成系统实施例的结构示意图。
具体实施方式
[0016]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0017]请参阅图1,本申请实施例中提供的一种基于蒙太奇的语音合成方法实施例,包括:步骤101、对待处理文本已有的自然段落进行段落分段预处理后,基于场景类型、情感层次类型将待处理文本分为若干个实际段落;需要说明的是,本实施例首先通过换行键对待处理文本已有的自然段落进行段落划分处理,之后将场景类型相同且情感层次类型相同的不同段落合并为同一段落,将同一段落中场景类型不同且情感层次类型不同的子段落相应划分为若干个段落。可以理解的是,例如:1)虽然待处理文本是两个段落,但讲的是同一个场景、同一个层次,则两段合并成一段;2)虽然文本是一个段落,但里面涉及到多个场景,多个情感层次,但应根据场景类型和情感层次类型划分为不同段落。
[0018]步骤102、计算若干个实际段落中相邻段落的场景和情感层次的相关性;需要说明的是,本实施例通过人工对待处理文本进行场景和情感层次标注后进行相关性训练得到相关性计算模型,基于所述相关性计算模型计算若干个所述实际段落中相邻段落的场景和情感层次的相关性。可以理解的是,需要通过人工标注进行大量的相关性训练,例如A和B段场景相关性K=50%,相关性范围为:0%

100%。
[0019]步骤103、设定待处理文本的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于蒙太奇的语音合成方法,其特征在于,包括:对待处理文本已有的自然段落进行段落分段预处理后,基于场景类型、情感层次类型将待处理文本分为若干个实际段落;计算若干个所述实际段落中相邻段落的场景和情感层次的相关性;设定待处理文本的语调参数后,根据所述相关性计算待处理文本的语调变化比例和语调变化方向;根据所述语调变化比例和所述语调变化方向对待处理文本进行段落语音合成。2.根据权利要求1所述的基于蒙太奇的语音合成方法,其特征在于,所述对待处理文本已有的自然段落进行段落分段预处理,具体包括:通过换行键对待处理文本已有的自然段落进行段落划分处理。3.根据权利要求1所述的基于蒙太奇的语音合成方法,其特征在于,所述基于场景类型、情感层次类型将待处理文本分为若干个实际段落,具体包括:将场景类型相同且情感层次类型相同的不同段落合并为同一段落,将同一段落中场景类型不同且情感层次类型不同的子段落相应划分为若干个段落。4.根据权利要求1所述的基于蒙太奇的语音合成方法,其特征在于,所述计算若干个所述实际段落中相邻段落的场景和情感层次的相关性,具体包括:通过人工对待处理文本进行场景和情感层次标注后进行相关性训练得到相关性计算模型,基于所述相关性计算模型计算若干个所述实际段落中相邻段落的场景和情感层次的相关性。5.根据权利要求1所述的基于蒙太奇的语音合成方法,其特征在于,所述设定待处理文本的语调参数后,根据所述相关性计算待处理文本的语调变化比例和语调变化方向,具体包括:设定待处理文本的总调值变化的比例范围、基准语调和起调的上下限,计算相邻段落的语调变化比例,以及计算所述总调值变化与所述相关性的比例和相邻段落的语调的升降并作为语调变化方向,从而得到待处理文本的语调变化比例和语调变化方向。6.一种基于蒙太奇的语音合成系统,...

【专利技术属性】
技术研发人员:余勇钟少恒陈志刚王翊曹小冬吴启明蔡勇超林承勋吕华良丁铖林家树郭泽豪符春造方美明陈瑾李鸿盛
申请(专利权)人:广东电网有限责任公司佛山供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1