一种合成方法技术

技术编号：39841965 阅读：4 留言：0更新日期：2023-12-29 16:29

本发明专利技术公开了一种合成方法

全部详细技术资料下载

【技术实现步骤摘要】
一种合成方法、装置、设备及存储介质

[0001]本专利技术涉及语音处理
，尤其涉及一种合成方法
、
装置
、
设备及存储介质
。

技术介绍

[0002]目前语音合成技术取得了巨大的进步，以
NaturalSpeech2
等为代表的深度学习方法已经可以生成媲美真人的语音，但是其模型尺寸及算力需求较高，只能部署在云侧，与端侧设备通过网络进行传输，当网络受限时则无法使用
。
与此相对的，端侧语音合成技术不受网络情况的限制，可以随时为用户提供语音合成服务，但是受限于算力，往往合成效果不佳
。
[0003]现有应用及技术中，语音合成的端云协同主要体现在，有网络时调用云侧服务，无网络时调用端侧服务
。
两者的协同仅仅是调用侧发起的不同请求，而且切换请求时还需要放弃当前服务合成进度，由另一个服务重新开始合成，协同效果较差，以及在端云两侧产生了重复且无意义的算力消耗
。

技术实现思路

[0004]本专利技术提供了一种合成方法
、
装置
、
设备及存储介质，以解决现有技术中语音合成的端云协同，协同效果较差，以及在端云两侧产生了重复且无意义的算力消耗的问题
。
[0005]第一方面，本专利技术实施例提供了一种合成方法，包括：
[0006]从云侧合成服务和端侧合成服务中，选取对应云端网络状态的当前合成服务；
[0007]在基于所述当前合成服务合...

【技术保护点】

【技术特征摘要】
1.
一种合成方法，其特征在于，包括：从云侧合成服务和端侧合成服务中，选取对应云端网络状态的当前合成服务；在基于所述当前合成服务合成当前待合成文本的情况下，若云端网络状态发生变更，则确定所述当前合成服务对应的当前合成状态；确定合成所述当前待合成文本的目标合成服务，所述目标合成服务为所述云侧合成服务或所述端侧合成服务；基于所述目标合成服务在所述当前合成状态的基础上继续合成所述当前待合成文本，得到对应的音频
。2.
根据权利要求1所述的方法，其特征在于，所述当前合成服务为端侧合成服务，所述确定合成所述当前待合成文本的目标合成服务，包括：确定当前合成状态所指示剩余音频的时长；若所述剩余时长小于或等于所述云侧合成服务的合成延时，则将端侧合成服务确定为目标合成服务，将云侧合成服务确定为下一待合成文本的当前合成服务；否则，将云侧合成服务确定为目标合成服务
。3.
根据权利要求2所述的方法，其特征在于，所述基于所述目标合成服务在所述当前合成状态的基础上继续合成所述当前待合成文本，得到对应的音频，包括：将所述当前待合成文本传输至目标合成服务，通过目标合成服务在所述当前合成状态的基础上继续合成所述当前待合成文本，得到对应的音频；若所述目标合成服务仍为端侧合成服务，则不进行切换，继续执行当前合成进程；若所述目标合成服务为云侧合成服务，则所述端侧合成服务结束合成所述当前待合成文本的时机为获取到所述云侧合成服务返回的音频
。4.
根据权利要求1所述的方法，其特征在于，所述当前合成服务为云侧合成服务，所述确定合成所述当前待合成文本的目标合成服务，包括：在当前合成状态指示未收到所述云侧合成服务合成所述当前待合成文本的返回信息的情况下，将端侧合成服务确定为目标合成服务；在当前合成状态指示当前存在缓存信息不存在缓存音频的情况下，将中继端侧合成服务确定为目标合成服务；在当前合成状态指示存在缓存音频的情况下，将预热端侧合成服务确定为目标合成服务
。5.
根据权利要求4所述的方法...

【专利技术属性】
技术研发人员：张毅，陈博，付振，王明月，何金鑫，孙宇嘉，梁小明，王紫烟，
申请(专利权)人：一汽南京科技开发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人