一种语音处理方法、装置、计算设备及存储介质制造方法及图纸

技术编号：24097187 阅读：26 留言：0更新日期：2020-05-09 10:58

本申请公开了一种语音处理方法、装置、计算设备及存储介质，用于解决设备在进行语音合成时合成的语音较为机械，缺乏真实感的技术问题。所述方法包括：先获取文本文字，并将获取到的文本文字转换为初始语音，然后将初始语音与语音合成库中的预定波形对进行合成，以获得初始合成语音，然后再获取基准语音的韵律特征信息，并根据获取的韵律特征信息对初始合成语音进行调整，以获得调整后的合成语音，最后将调整后的合成语音进行输出。

A speech processing method, device, computing equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种语音处理方法、装置、计算设备及存储介质
本申请涉及人工智能
，尤其涉及一种语音处理方法、装置、计算设备及存储介质。
技术介绍
语音合成，是一种可以将任意输入文本转换成相应语音的技术。随着人工智能技术的发展，语音合成技术越来越收到人们的重视，利用语音合成技术和语音识别技术，一方面，可以使智能设备生成用户听得懂的口语，另一方面，智能设备可以听懂用户说的话，从而可以实现人机语音通信。为了实现语音合成，可以采用传统的参数语音合成方法，将文本文字和键盘输入的文字经过文本分析之后，从语音合成库中选择匹配的波形片段进行编辑拼接，以形成合成语音，进而输出合成语音。在进行波形片段拼接的时候，可能会出现一些失真的情况，导致合成的语音与用户发出的自然语音存在一些差异，进而使得输出的合成语音不够自然。综上所述，现有技术中设备在合成语音时的语音合成效果较差，所以，如何提高语音合成的效果是需要解决的技术问题。
技术实现思路
本申请实施例提供一种语音处理方法、装置、计算设备及存储介质，用于解决设备在进行语音合...

【技术保护点】
1.一种语音处理方法，其特征在于，所述方法包括：/n获取文本文字，并将所述文本文字转换为初始语音；/n将所述初始语音与语音合成库中的预设波形进行合成，以获得初始合成语音；/n获取基准语音的韵律特征信息；/n根据所述韵律特征信息对所述初始合成语音进行调整，以获得调整后的合成语音；/n输出所述调整后的合成语音。/n

【技术特征摘要】
1.一种语音处理方法，其特征在于，所述方法包括：
获取文本文字，并将所述文本文字转换为初始语音；
将所述初始语音与语音合成库中的预设波形进行合成，以获得初始合成语音；
获取基准语音的韵律特征信息；
根据所述韵律特征信息对所述初始合成语音进行调整，以获得调整后的合成语音；
输出所述调整后的合成语音。

2.如权利要求1所述的方法，其特征在于，在获取基准自然语音的韵律特征信息之前，所述方法还包括：
确定所述初始合成语音的语音属性信息；
从多个预设的自然语音中确定与所述语音属性信息相符的候选自然语音；
根据所述候选自然语音确定所述基准语音。

3.如权利要求1所述的方法，其特征在于，根据所述韵律特征信息对所述初始合成语音进行调整，以获得调整后的合成语音，包括：
根据所述韵律特征信息，调整所述初始合成语音的基音周期，以获得第一调整合成语音；
根据所述韵律特征信息，调整所述第一调整合成语音的振幅，以获得第二调整合成语音；
将所述第二调整合成语音确定为所述调整后的合成语音。

4.如权利要求3所述的方法，其特征在于，根据所述韵律特征信息，调整所述初始合成语音的基音周期，包括：
确定所述初始合成语音的待调整声调波形；
确定所述待调整声调波形的原始标记点，其中，所述原始标记点包括所述初始合成语音的每个所述基音周期的起始点和终止点；
根据基准声调曲线，从所述待调整声调波形中确定目标位置，所述基准声调曲线是通过所述韵律特征信息确定的所述基准自然语音的声调波形；
将调整标记点插入所述目标位置，并根据所述调整标记点调整所述初始合成语音的基音周期。

5.如权利要求4所述的方法，其特征在于，根据所述韵律特征信息，调整所述第一调整合成语音的...

【专利技术属性】
技术研发人员：高杰，
申请(专利权)人：珠海格力电器股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人