【技术实现步骤摘要】
本专利技术涉及语音识别及金融科技,尤其涉及一种定制化音色的语音生成方法、装置、设备及介质。
技术介绍
1、文本转语音(tts)系统正日益成为我们日常生活中不可或缺的一部分,它们无缝集成到各种领域,如虚拟代理、社交媒体平台、视频游戏以及辅助应用,例如屏幕阅读器或导航系统,以赋予它们更多能力,例如表达声音级别的感情,甚至处理多种语言。在过去几年中,其中一个显著改进的能力是多说话人功能,tts模型不仅限于合成单一声音的语音,而是基于多个说话人的声音进行条件化的,因此能够产生各种不同的声音音色。
2、现有的语音生成是基于文本转语音(tts)系统生成真实和自然的语音。实际应用中,定制tts声音的过程仍然是一个复杂的任务,大多数情况下需要该领域专家的知识,仅仅依赖文本转语音过于片面,从而对进行定制化语音合成时的准确性较低。
技术实现思路
1、本专利技术提供一种定制化音色的语音生成方法、装置、设备及介质,以解决进行定制化语音合成时的准确性较低的技术问题。
2、第一方面,提供了一种
...【技术保护点】
1.一种定制化音色的语音生成方法,其特征在于,包括:
2.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述将所述初始语音种群中的初始声音与预设的目标文本进行合成,得到合成语音,包括:
3.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述获取目标用户对所述合成语音的筛选结果,包括:
4.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据所述筛选结果对所述初始语音种群进行突变,得到语音突变种群,包括:
5.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据预设的性格维度创建
...【技术特征摘要】
1.一种定制化音色的语音生成方法,其特征在于,包括:
2.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述将所述初始语音种群中的初始声音与预设的目标文本进行合成,得到合成语音,包括:
3.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述获取目标用户对所述合成语音的筛选结果,包括:
4.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据所述筛选结果对所述初始语音种群进行突变,得到语音突变种群,包括:
5.如权利要求1所述的定制化音色的语音生成方法,其特征在于,所述根据预设的性格维度创建目标用户的独特声音,包括:
6.如权利要求1所述的定制化音色的语音生成方法,其特...
【专利技术属性】
技术研发人员:孙奥兰,王健宗,程宁,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。