定制化音色的语音生成方法、装置、设备及介质制造方法及图纸

技术编号:44172214 阅读:21 留言:0更新日期:2025-02-06 18:18
本发明专利技术涉及语音识别及金融科技技术领域,公开了一种定制化音色的语音生成方法、装置、设备及介质,包括:根据初始声音对生成初始语音种群,将初始语音种群中的初始声音与预设的目标文本进行合成,得到合成语音;获取目标用户对合成语音的筛选结果,根据筛选结果对初始语音种群进行突变,得到语音突变种群;将初始语音种群更新为语音突变种群,返回至将初始语音种群中的初始声音对进行合成,得到合成语音步骤,直至生成目标用户对应的目标合成语音;根据性格维度创建目标用户的独特声音,根据独特声音生成目标合成语音的反馈语义;利用反馈语义对目标合成语音进行优化,得到最佳合成语音。本发明专利技术可以提升定制化语音合成时的准确性。

【技术实现步骤摘要】

本专利技术涉及语音识别及金融科技,尤其涉及一种定制化音色的语音生成方法、装置、设备及介质


技术介绍

1、文本转语音(tts)系统正日益成为我们日常生活中不可或缺的一部分,它们无缝集成到各种领域,如虚拟代理、社交媒体平台、视频游戏以及辅助应用,例如屏幕阅读器或导航系统,以赋予它们更多能力,例如表达声音级别的感情,甚至处理多种语言。在过去几年中,其中一个显著改进的能力是多说话人功能,tts模型不仅限于合成单一声音的语音,而是基于多个说话人的声音进行条件化的,因此能够产生各种不同的声音音色。

2、现有的语音生成是基于文本转语音(tts)系统生成真实和自然的语音。实际应用中,定制tts声音的过程仍然是一个复杂的任务,大多数情况下需要该领域专家的知识,仅仅依赖文本转语音过于片面,从而对进行定制化语音合成时的准确性较低。


技术实现思路

1、本专利技术提供一种定制化音色的语音生成方法、装置、设备及介质,以解决进行定制化语音合成时的准确性较低的技术问题。

2、第一方面,提供了一种定制化音色的语音生成本文档来自技高网...

【技术保护点】

1.一种定制化音色的语音生成方法,其特征在于,包括:

2.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述将所述初始语音种群中的初始声音与预设的目标文本进行合成,得到合成语音,包括:

3.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述获取目标用户对所述合成语音的筛选结果,包括:

4.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据所述筛选结果对所述初始语音种群进行突变,得到语音突变种群,包括:

5.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据预设的性格维度创建目标用户的独特声音,...

【技术特征摘要】

1.一种定制化音色的语音生成方法,其特征在于,包括:

2.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述将所述初始语音种群中的初始声音与预设的目标文本进行合成,得到合成语音,包括:

3.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述获取目标用户对所述合成语音的筛选结果,包括:

4.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据所述筛选结果对所述初始语音种群进行突变,得到语音突变种群,包括:

5.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据预设的性格维度创建目标用户的独特声音,包括:

6.如权利要求1所述的定制化音色的语音生成方法,其特...

【专利技术属性】
技术研发人员:孙奥兰王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1