翻译语音生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：21605912 阅读：30 留言：0更新日期：2019-07-13 18:21

本发明专利技术实施例公开了一种翻译语音生成方法、装置、计算机设备和存储介质。所述方法包括：获取指导语音和待调整翻译语音；其中，所述指导语音的语义与所述待调整翻译语音的语义相同，所述指导语音的语言体系与所述待调整翻译语音的语言体系不同；提取所述指导语音的情感特征信息，并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息；其中，所述语音调整信息包括：待调整情感音素以及与所述情感特征信息匹配的情感调整信息；根据所述语音调整信息，生成目标翻译语音。本发明专利技术实施例可以丰富翻译语音的情感信息，增加语音的丰富度。

Translated Speech Generation Method, Device, Computer Equipment and Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
翻译语音生成方法、装置、计算机设备和存储介质
本专利技术实施例涉及语音处理技术，尤其涉及一种翻译语音生成方法、装置、计算机设备和存储介质。
技术介绍
体育竞技项目中，为了提高运动的指导专业程度，通常聘请外籍教练员对运动员进行训练指导。但由于外籍教练员与运动员之间会存在语言沟通上的问题，通常会配备翻译员。其中，翻译员是指经过相关项目的专业术语训练的翻译人员。在训练中，翻译员将外籍教练员发出的指示信息翻译成运动员理解的语言体系。例如，在滑雪运动的训练过程中，外籍教练员通常伴随运动员一起在场地中滑雪。当外籍教练员需要纠正运动员动作时，可以通过呼喊直接向运动员发出指示。然而，翻译员通常为仅掌握语言技能的人员，几乎不可能在现场进行翻译。目前，由运动员和外籍教练员各自携带移动终端，分别与设置在训练场地外的控制中心进行语音通讯或视频通讯，由翻译员接受外籍教练员发出的指令，并以运动员能够理解的语言向运动员转述指令。但由于翻译员不在现场，无法基于现场情况判断教练员发出指令时，训练现场的具体情况，因此转述给运动员的指令只能在文字上转述教练指令，由此，运动员在接收到教练指令后无法基于教练员的情绪而准确知道教练指令的重要(或紧急)程度，甚至由于无法及时提示运动员造成运动员受伤等后果。
技术实现思路
本专利技术实施例提供一种翻译语音生成方法、装置、计算机设备和存储介质，可以丰富翻译语音的情感信息，增加语音的丰富度，提高用户体验。第一方面，本专利技术实施例提供了一种翻译语音生成方法，包括：获取指导语音和待调整翻译语音；其中，所述指导语音的语义与所述待调整翻译语音的语义相同，所述指导语音的...

【技术保护点】
1.一种翻译语音生成方法，其特征在于，包括：获取指导语音和待调整翻译语音；其中，所述指导语音的语义与所述待调整翻译语音的语义相同，所述指导语音的语言体系与所述待调整翻译语音的语言体系不同；提取所述指导语音的情感特征信息，并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息；其中，所述语音调整信息包括：待调整情感音素以及与所述情感特征信息匹配的情感调整信息；根据所述语音调整信息，生成目标翻译语音。

【技术特征摘要】
1.一种翻译语音生成方法，其特征在于，包括：获取指导语音和待调整翻译语音；其中，所述指导语音的语义与所述待调整翻译语音的语义相同，所述指导语音的语言体系与所述待调整翻译语音的语言体系不同；提取所述指导语音的情感特征信息，并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息；其中，所述语音调整信息包括：待调整情感音素以及与所述情感特征信息匹配的情感调整信息；根据所述语音调整信息，生成目标翻译语音。2.根据权利要求1所述的方法，其特征在于，所述语音调整信息还包括：待调整语义音素以及与从所述待调整翻译语音中提取的语义特征信息匹配的语义调整信息。3.根据权利要求2所述的方法，其特征在于，所述根据所述语音调整信息，生成目标调整语音，包括：按照第一预设频段对所述指导语音进行滤波处理，得到目标指导语音；按照第二预设频段对所述待调整翻译语音进行滤波处理，得到目标待调整翻译语音；其中，所述第一预设频段与所述第二预设频段不同；根据所述语音调整信息对所述目标指导语音和目标待调整翻译语音进行调整，并进行混音，生成混合语音作为所述目标翻译语音。4.根据权利要求3所述的方法，其特征在于，所述待调整情感音素包括所述目标指导语音中满足预设情感特征条件的音素，所述待调整语义音素包括所述目标待调整翻译语音中满足预设语义特征条件的音素；所述根据所述语音调整信息对所述目标指导语音和目标待调整翻译语音进行调整，并进行混音，包括：根据所述情感调整信息，调整所述目标指导语音中待调整情感音素的声压级，生成调整处理后的目标指导语音；根据所述语义调整信息，调整所述目标待调整翻译语音中待调整语义音素的声压级，生成调整处理后的目标待调整翻译语音；将所述调整处理后的目标指导语音和所述调整处理后的目标待调整翻译语音进行混音。5.根据权利要求4所述的方法，其特征在于，还包括：获取待指导用户的反应时间；其中，所述反应时间通过待指导用户的身体参数确定，所述身体参...

【专利技术属性】
技术研发人员：蔡永军，
申请(专利权)人：南京魔盒信息科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人