语音转换方法技术

技术编号:39808234 阅读:3 留言:0更新日期:2023-12-22 02:42
本申请公开了一种语音转换方法

【技术实现步骤摘要】
语音转换方法、装置、电子设备以及存储介质


[0001]本申请涉及音频信息处理
,更具体地,涉及一种语音转换方法

装置

电子设备以及存储介质


技术介绍

[0002]语音转换技术就是将人物的说话特征进行改变,使其具有另一个人物的语音特征信息,例如将成年人的语音信息转换为小孩子的语音信息

[0003]目前,可以从语音库中获取待转换语音信息对应的多个语音单元,并对多个语音单元的语音信息进行处理,得到处理后的多个语音单元,然后将多个处理后的语音单元进行拼接,得到转换后的语音信息

但是,采用该方法,语音信息的转换效率较低


技术实现思路

[0004]有鉴于此,本申请实施例提出了一种语音转换方法

装置

电子设备以及存储介质

[0005]第一方面,本申请实施例提供了一种语音转换方法,所述方法包括:获取第一类别的待转换语音信息;对所述待转换语音信息进行特征提取,得到第一特征参数;将所述第一特征参数输入语音转换模型,得到所述语音转换模型输出的第二特征参数,所述语音转换模型用于将第一类别的语音信息的特征参数转换为第二类别的语音信息的特征参数;根据所述第一特征参数以及所述第二特征参数,获得转换后的语音信息

[0006]第二方面,本申请实施例提供了一种语音转换装置,所述装置包括:获取模块,用于获取第一类别的待转换语音信息;特征提取模块,用于对所述待转换语音信息进行特征提取,得到第一特征参数;转换模块,用于将所述第一特征参数输入语音转换模型,得到所述语音转换模型输出的第二特征参数,所述语音转换模型用于将第一类别的语音信息的特征参数转换为第二类别的语音信息的特征参数;获得模块,用于根据所述第一特征参数以及所述第二特征参数,获得转换后的语音信息

[0007]可选地,装置还包括训练模块,用于获取第一类别的第一样本语音信息以及第二类别的第二样本语音信息;对所述第一样本语音信息进行特征提取,得到第三特征参数,并对所述第二样本语音信息进行特征提取,得到第四特征参数;根据所述第三特征参数以及所述第四特征参数,构建本征空间;根据所述本征空间,构建高斯混合模型;通过所述第三特征参数以及所述第四特征参数对所述高斯混合模型进行训练,得到所述语音转换模型

[0008]可选地,所述训练模块,还用于通过线性预测编码技术,对所述第一样本语音信息进行特征提取,得到第三特征参数

[0009]可选地,所述训练模块,还用于根据所述第三特征参数的基音频率以及所述第四特征参数的基音频率,确定原始特征空间的散布矩阵;根据所述原始特征空间的散布矩阵确定本征向量;根据所述本征向量建立本征空间

[0010]可选地,所述获得模块,还用于对所述第一特征参数以及所述第二特征参数中的
线谱频率系数进行逆推操作,得到线性预测参数;根据所述第二特征参数中的小波系数以及所述线性预测参数进行小波重建,得到重建结果;根据所述重建结果以及所述第一特征参数,得到转换后的语音信息

[0011]可选地,所述获得模块,还用于通过预设的第一比例因子,对所述第一特征参数中的基音轮廓进行处理,得到第一语音信息;通过预设的第二比例因子,将所述重建结果中的基音能量缩放至所述第一语音信息中,得到所述转换后的语音信息

[0012]可选地,所述获得模块,还用于通过预设的第二比例因子,将所述重建结果中的基音能量缩放至所述第一语音信息,得到第二语音信息;根据所述待转换语音信息对所述第二语音信息进行时间校准操作,得到第三语音信息;对所述第三语音信息进行滤波处理,得到所述转换后的语音信息

[0013]第三方面,本申请实施例提供了一种电子设备,包括处理器以及存储器;一个或多个程序被存储在存储器中并被配置为由处理器执行以实现上述的方法

[0014]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有程序代码,其中,在程序代码被处理器运行时执行上述的方法

[0015]第五方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中

计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法

[0016]本申请实施例提供的一种语音转换方法

装置

电子设备以及存储介质,通过语音转换模型直接将待转换语音信息的第一特征参数转换为转换后的语音信息的第二特征参数,并根据第一特征参数以及第二特征参数,获得转换后的语音信息,并不需要对多个语音单元分别进行处理,节省大量的数据处理时间,提高了的特征参数的转换效率,从而提高了语音转换效率

附图说明
[0017]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0018]图1示出了本申请实施例提出的一种电子设备的结构示意图;
[0019]图2示出了本申请一个实施例提出的一种语音转换方法的流程图;
[0020]图3示出了本申请实施例中的语音转换模型的一种训练方法的流程图;
[0021]图4示出了本申请一个实施例提出的一种语音转换装置的框图;
[0022]图5示出了本申请实施例提供的一种计算机可读存储介质的结构框图

具体实施方式
[0023]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例

根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他
实施例,都属于本申请保护的范围

[0024]在以下的描述中,所涉及的术语“第一
\
第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一
\
第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施

[0025]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同

本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请

[0026]请参阅1,图1示出了本申请实施例提出的一种电子设备的结构示意图;电本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种语音转换方法,其特征在于,所述方法包括:获取第一类别的待转换语音信息;对所述待转换语音信息进行特征提取,得到第一特征参数;将所述第一特征参数输入语音转换模型,得到所述语音转换模型输出的第二特征参数,所述语音转换模型用于将第一类别的语音信息的特征参数转换为第二类别的语音信息的特征参数;根据所述第一特征参数以及所述第二特征参数,获得转换后的语音信息
。2.
根据权利要求1所述的方法,其特征在于,所述语音转换模型的训练方法包括:获取第一类别的第一样本语音信息以及第二类别的第二样本语音信息;对所述第一样本语音信息进行特征提取,得到第三特征参数,并对所述第二样本语音信息进行特征提取,得到第四特征参数;根据所述第三特征参数以及所述第四特征参数,构建本征空间;根据所述本征空间,构建高斯混合模型;通过所述第三特征参数以及所述第四特征参数对所述高斯混合模型进行训练,得到所述语音转换模型
。3.
根据权利要求2所述的方法,其特征在于,所述对所述第一样本语音信息进行特征提取,得到第三特征参数,包括:通过线性预测编码技术,对所述第一样本语音信息进行特征提取,得到第三特征参数
。4.
根据权利要求2所述的方法,其特征在于,所述根据所述第三特征参数以及所述第四特征参数,构建本征空间,包括:根据所述第三特征参数的基音频率以及所述第四特征参数的基音频率,确定原始特征空间的散布矩阵;根据所述原始特征空间的散布矩阵确定本征向量;根据所述本征向量建立本征空间
。5.
根据权利要求1所述的方法,其特征在于,所述根据所述第一特征参数以及所述第二特征参数,获得转换后的语音信息,包括:对所述第一特征参数以及所述第二特征参数中的线谱频率系数进行逆推操作,得到线性预测参数;根据所述第二特征参数中的小波系数以及所述线性预测参数进行小波重建,得到重建结果;根据所述重建结果以及所述第一特征参...

【专利技术属性】
技术研发人员:姚坤
申请(专利权)人:上海游密信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1