显示设备及基于图像迁移的方言语音合成方法技术

技术编号:42302186 阅读:47 留言:0更新日期:2024-08-14 15:50
本申请一些实施例提供一种显示设备及基于图像迁移的方言语音合成方法,所述方法可以获取用户输入的语音数据,并根据语音数据生成语音频谱图;在发音词典中查询语音数据对应的方言音素标注,其中,发音词典中包括普通话的字级别标注与方言的音素级别标注的映射关系;以及将语音频谱图和方言音素标注输入至迁移模型中,以生成方言频谱图;并将方言频谱图输入至音频合成模型中,以生成方言音频波形,再基于方言音频波形生成方言音频。所述方法可以将用户输入的语音数据生成语音频谱图,并利用图像迁移将语音频谱图转换为方言频谱图,进而生成方言音频,所述方法能够在方言音频中保留用户的声音属性,提高方言音频的自然度和表现力。

【技术实现步骤摘要】

本申请涉及显示设备,尤其涉及一种显示设备及基于图像迁移的方言语音合成方法


技术介绍

1、显示设备内配置有语音合成系统,语音合成系统是一种将文字信息转换为语音信号的技术系统,应用于机器人对话、语音转写、资讯播报和语音内容分析等场景。语音合成系统可以基于对输入文本的预处理,理解文本含义和结构,并根据输入的文本内容,生成相应的声学参数,以及将声学参数转换为基于普通话的语音信息。

2、方言是区别于普通话的地区语言,不同于普通话发音方式的规范统一,方言的发音方式更加本土化,因此方言与普通话的声学参数不同。通过在语音合成系统中,建立普通话与方言的映射关系,可以使语音合成系统将普通话转换为方言语音。但是上述方法会导致合成的方言语音机械化,缺少说话人的声音属性,影响用户体验。


技术实现思路

1、本申请一些实施例提供一种显示设备及基于图像迁移的方言语音合成方法,以解决显示设备合成的方言语音机械化的问题。

2、第一方面,本申请一些实施例提供一种显示设备,包括:显示器、音频采集器以及控制器。其中,所述显示本文档来自技高网...

【技术保护点】

1.一种显示设备,其特征在于,包括:

2.根据权利要求1所述的显示设备,其特征在于,所述控制器执行根据所述语音数据生成语音频谱图,还被配置为:

3.根据权利要求2所述的显示设备,其特征在于,所述控制器执行对所述语音数据执行预处理,以得到包含多个信号帧的语音信号,还被配置为:

4.根据权利要求1所述的显示设备,其特征在于,所述控制器还被配置为:

5.根据权利要求1所述的显示设备,其特征在于,所述迁移模型包括第一生成器,所述控制器还被配置为:

6.根据权利要求5所述的显示设备,其特征在于,所述迁移模型还包括第一鉴别器,所述控制器还被...

【技术特征摘要】

1.一种显示设备,其特征在于,包括:

2.根据权利要求1所述的显示设备,其特征在于,所述控制器执行根据所述语音数据生成语音频谱图,还被配置为:

3.根据权利要求2所述的显示设备,其特征在于,所述控制器执行对所述语音数据执行预处理,以得到包含多个信号帧的语音信号,还被配置为:

4.根据权利要求1所述的显示设备,其特征在于,所述控制器还被配置为:

5.根据权利要求1所述的显示设备,其特征在于,所述迁移模型包括第一生成器,所述控制器还被配置为:

6.根据权利...

【专利技术属性】
技术研发人员:廖嘉璇许畅
申请(专利权)人:海信电子科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1