情感语音数据转换方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：27616963 阅读：26 留言：0更新日期：2021-03-10 10:49

本申请实施例属于人工智能技术领域，涉及一种情感语音数据转换方法及相关设备，可应用于智慧政务或智慧医疗领域，包括：获取源情感语音数据，基于预设的声码器提取所述源情感语音数据的第一基频、非周期数据和第一梅尔倒谱系数；通过线性变换将所述第一基频转换为第二基频，基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数，其中，所述预设转换模型为变分自编码器生成对抗网络结构；基于所述声码器对所述第二基频、所述第二梅尔倒谱系数和所述非周期数据进行傅里叶变换和自适应插值处理，得到目标情感数据。此外，本申请还涉及区块链技术，所述目标情感数据可存储于区块链中。本申请提高了情感语音数据的转换效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
情感语音数据转换方法、装置、计算机设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种情感语音数据转换方法、装置、计算机设备及存储介质。

技术介绍

[0002]语音信号不仅包含语义信息，还蕴含了说话人身份、说话时的情感等其他方面信息。情感语音转换是指将语音由一种情感转换成另一种情感，同时保持语义和说话人身份等其他信息不变的技术。现实中客服服务系统面临的使用场景、用户意图、用户身份等往往十分复杂，传统的解决方案只能支持单一情感的语音播报而不能随着实际的场景进行语音情感的转换，很容易给用户带来较差的使用体验，不利于高效的沟通和问题的解决。如果客服服务系统能在交互中根据实际情况灵活选择合适的情感进行语音播报，整体的工作效率将会得到很大的提升。
[0003]传统的情感语音转换方法几乎都需要平行语料。平行语料是指说话人和文本相同而说话时情感不同的数据。录制平行语料的工作费时费力，并且还需要对齐等后续数据处理，由此导致情感语音数据转换困难、效率低下的问题。

技术实现思路

[0004]本申请实施例的...

【技术保护点】

【技术特征摘要】
1.一种情感语音数据转换方法，其特征在于，包括下述步骤：获取源情感语音数据，基于预设的声码器提取所述源情感语音数据的第一基频、非周期数据和第一梅尔倒谱系数；通过线性变换将所述第一基频转换为第二基频，基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数，其中，所述预设转换模型为变分自编码器生成对抗网络结构；基于所述声码器对所述第二基频、所述第二梅尔倒谱系数和所述非周期数据进行傅里叶变换和自适应插值处理，得到目标情感数据。2.根据权利要求1所述的情感语音数据转换方法，其特征在于，所述预设转换模型包括编码器、解码器和判别器，所述基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数的步骤包括：获取所述源情感语音数据的情感标签，输入所述情感标签至所述编码器，得到情感信息表征，输入所述第一梅尔倒谱系数至所述编码器，得到内容信息表征；输入所述情感信息表征和所述内容信息表征至所述解码器，得到所述第一梅尔倒谱系数对应的待测梅尔倒谱系数；基于所述判别器确定所述待测梅尔倒谱系数是否为真实样本数据输出，在确定所述待测梅尔倒谱系数为所述真实样本数据输出时，确定所述待测梅尔倒谱系数为所述第二梅尔倒谱系数。3.根据权利要求2所述的情感语音数据转换方法，其特征在于，所述输入所述情感标签至所述编码器，得到情感信息表征的步骤包括：对所述情感标签进行独热编码得到独热矢量；将所述独热矢量输入至所述编码器中的嵌入层，所述嵌入层输出得到所述情感信息表征。4.根据权利要求2所述的情感语音数据转换方法，其特征在于，所述输入所述第一梅尔倒谱系数至所述编码器，得到内容信息表征的步骤包括：根据所述编码器对所述第一梅尔倒谱系数进行多层卷积处理，得到所述内容信息表征。5.根据权利要求1所述的情感语音数据转换方法，其特征在于，在所述基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数的步骤之前，包括：获取第一对抗损失函数、第二对抗损失函数、循环一致损失函数、恒等变换损失函数和散度损失函数；根据所述第一对抗损失函数、所述第二对抗损失函数、所述循环一致损失函数...

【专利技术属性】
技术研发人员：刘正晨，陈闽川，马骏，王少军，肖京，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人