翻译语音生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21605912 阅读:30 留言:0更新日期:2019-07-13 18:21
本发明专利技术实施例公开了一种翻译语音生成方法、装置、计算机设备和存储介质。所述方法包括:获取指导语音和待调整翻译语音;其中,所述指导语音的语义与所述待调整翻译语音的语义相同,所述指导语音的语言体系与所述待调整翻译语音的语言体系不同;提取所述指导语音的情感特征信息,并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息;其中,所述语音调整信息包括:待调整情感音素以及与所述情感特征信息匹配的情感调整信息;根据所述语音调整信息,生成目标翻译语音。本发明专利技术实施例可以丰富翻译语音的情感信息,增加语音的丰富度。

Translated Speech Generation Method, Device, Computer Equipment and Storage Media

【技术实现步骤摘要】
翻译语音生成方法、装置、计算机设备和存储介质
本专利技术实施例涉及语音处理技术,尤其涉及一种翻译语音生成方法、装置、计算机设备和存储介质。
技术介绍
体育竞技项目中,为了提高运动的指导专业程度,通常聘请外籍教练员对运动员进行训练指导。但由于外籍教练员与运动员之间会存在语言沟通上的问题,通常会配备翻译员。其中,翻译员是指经过相关项目的专业术语训练的翻译人员。在训练中,翻译员将外籍教练员发出的指示信息翻译成运动员理解的语言体系。例如,在滑雪运动的训练过程中,外籍教练员通常伴随运动员一起在场地中滑雪。当外籍教练员需要纠正运动员动作时,可以通过呼喊直接向运动员发出指示。然而,翻译员通常为仅掌握语言技能的人员,几乎不可能在现场进行翻译。目前,由运动员和外籍教练员各自携带移动终端,分别与设置在训练场地外的控制中心进行语音通讯或视频通讯,由翻译员接受外籍教练员发出的指令,并以运动员能够理解的语言向运动员转述指令。但由于翻译员不在现场,无法基于现场情况判断教练员发出指令时,训练现场的具体情况,因此转述给运动员的指令只能在文字上转述教练指令,由此,运动员在接收到教练指令后无法基于教练员的情绪而准确知道教练指令的重要(或紧急)程度,甚至由于无法及时提示运动员造成运动员受伤等后果。
技术实现思路
本专利技术实施例提供一种翻译语音生成方法、装置、计算机设备和存储介质,可以丰富翻译语音的情感信息,增加语音的丰富度,提高用户体验。第一方面,本专利技术实施例提供了一种翻译语音生成方法,包括:获取指导语音和待调整翻译语音;其中,所述指导语音的语义与所述待调整翻译语音的语义相同,所述指导语音的语言体系与所述待调整翻译语音的语言体系不同;提取所述指导语音的情感特征信息,并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息;其中,所述语音调整信息包括:待调整情感音素以及与所述情感特征信息匹配的情感调整信息;根据所述语音调整信息,生成目标翻译语音。第二方面,本专利技术实施例还提供了一种翻译语音生成装置,包括:语音获取模块,用于获取指导语音和待调整翻译语音;其中,所述指导语音的语义与所述待调整翻译语音的语义相同,所述指导语音的语言体系与所述待调整翻译语音的语言体系不同;语音调整信息获取模块,用于提取所述指导语音的情感特征信息,并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息;其中,所述语音调整信息包括:待调整情感音素以及与所述情感特征信息匹配的情感调整信息;目标翻译语音生成模块,用于根据所述语音调整信息,生成目标翻译语音。第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本专利技术实施例中任一所述的翻译语音生成方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的翻译语音生成方法。本专利技术实施例通过获取指导语音,并提取情感特征信息,同时根据指导语音和获取的待调整翻译语音确定语音调整信息,语音调整信息中包括待调整情感音素和对应的与情感特征信息匹配的情感调整信息,根据语音调整信息,生成目标翻译语音,以使目标翻译语音中包括与指导语音情感特征信息匹配的情感特征,从而实现在目标翻译语音中添加与指导用户情感匹配的情感信息,解决了现有技术中翻译员远程翻译仅能文字转述教练指令,忽略教练的情感信息,导致运动员无法准确获取重点指令并及时做出反应的问题,突出目标翻译语音的情感信息,增加语音的丰富度,使运动员可以快速明确翻译语音中的重点信息,提高用户体验。附图说明图1是本专利技术实施例一中的一种翻译语音生成方法的流程图;图2是本专利技术实施例二中的一种翻译语音生成方法的流程图;图3是本专利技术实施例三中的一种翻译语音生成方法的流程图;图4a是本专利技术实施例四中所适用应用场景的示意图;图4b是本专利技术实施例四中的一种翻译语音生成方法的流程图;图5是本专利技术实施例五中的一种翻译语音生成装置的结构示意图;图6是本专利技术实施例六中的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一中的一种翻译语音生成方法的流程图,本实施例可应用于针对不同语言体系的指导语音和翻译语音,生成符合指导语音情感匹配的翻译语音情况。该方法可以由本专利技术实施例提供的翻译语音生成装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在提供声音采集功能的计算机设备中,例如智能手机、平板电脑、车载终端或服务器等。如图1所示,本实施例的方法具体包括:S110,获取指导语音和待调整翻译语音;其中,所述指导语音的语义与所述待调整翻译语音的语义相同,所述指导语音的语言体系与所述待调整翻译语音的语言体系不同。其中,指导语音用于教导待指导用户的行为,具体可以是指导用户使用指导终端设备发送的语音。待调整翻译语音用于将指导语音翻译为待指导用户能听懂的语言体系,具体可以是除外籍指导用户和待指导用户之外的翻译用户,通过集成有翻译语音生成装置的计算机设备采集的语音,或者也可以是对指导语音进行机械翻译,生成的翻译文本,并对应生成的机器语音。也即,指导语音与待调整翻译语音的文本语义相同,但语言体系不同。通常,翻译用户或机器语音是不包含情感特征,甚至翻译用户发出语音的感情色彩与外籍指导用户的感情色彩相反。需要说明的是,语言体系不同,可以是指语种不同,也可以是指方言与标准语言的不同。示例性的,指导语音为粤语,待调整翻译语言为普通话;或者指导语音为中文普通话,待调整翻译语言为美式英语。S120,提取所述指导语音的情感特征信息,提取所述指导语音的情感特征信息,并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息;其中,所述语音调整信息包括:待调整情感音素以及与所述情感特征信息匹配的情感调整信息。其中,情感特征信息用于表示发出指导语音的情感,例如,激动、愤怒、平静、悲伤、惊讶或高兴等。示例性的,具体可以通过指导用户的语速、音量和声调等参数中的至少一项体现。情感特征信息可以包括下述至少一项:基于韵律学特征、基于音质特征和基于频谱特征。具体的,基于韵律学特征包括下述至少一项:基频特征、时长特征和能量特征等;基于音质特征包括;共振峰参数。基于频谱特征包括:梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)和/或线性预测倒谱系数(LinearPredictionCepstrumCoefficient,LPCC)等。其中,基频特征可以通过自相关函数法提取;共振峰参数可以通过线性预测分析方法获取;梅尔频率倒谱系数可以通过预加重加窗、离散傅里叶变换、Mel滤波器、Log对数能量和离散余弦变换等步骤获取。此外,还可以通过其他方式获取情感特征信息,对此,本专利技术实施例不做具体限制。其中,语音调整信息用于在待调整翻译语音中添加情感信息,以生成目标翻译语音。需要说明的是,添加情感信息可以是指强化预设情感信本文档来自技高网...

【技术保护点】
1.一种翻译语音生成方法,其特征在于,包括:获取指导语音和待调整翻译语音;其中,所述指导语音的语义与所述待调整翻译语音的语义相同,所述指导语音的语言体系与所述待调整翻译语音的语言体系不同;提取所述指导语音的情感特征信息,并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息;其中,所述语音调整信息包括:待调整情感音素以及与所述情感特征信息匹配的情感调整信息;根据所述语音调整信息,生成目标翻译语音。

【技术特征摘要】
1.一种翻译语音生成方法,其特征在于,包括:获取指导语音和待调整翻译语音;其中,所述指导语音的语义与所述待调整翻译语音的语义相同,所述指导语音的语言体系与所述待调整翻译语音的语言体系不同;提取所述指导语音的情感特征信息,并根据所述指导语音、所述情感特征信息和所述待调整翻译语音确定语音调整信息;其中,所述语音调整信息包括:待调整情感音素以及与所述情感特征信息匹配的情感调整信息;根据所述语音调整信息,生成目标翻译语音。2.根据权利要求1所述的方法,其特征在于,所述语音调整信息还包括:待调整语义音素以及与从所述待调整翻译语音中提取的语义特征信息匹配的语义调整信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述语音调整信息,生成目标调整语音,包括:按照第一预设频段对所述指导语音进行滤波处理,得到目标指导语音;按照第二预设频段对所述待调整翻译语音进行滤波处理,得到目标待调整翻译语音;其中,所述第一预设频段与所述第二预设频段不同;根据所述语音调整信息对所述目标指导语音和目标待调整翻译语音进行调整,并进行混音,生成混合语音作为所述目标翻译语音。4.根据权利要求3所述的方法,其特征在于,所述待调整情感音素包括所述目标指导语音中满足预设情感特征条件的音素,所述待调整语义音素包括所述目标待调整翻译语音中满足预设语义特征条件的音素;所述根据所述语音调整信息对所述目标指导语音和目标待调整翻译语音进行调整,并进行混音,包括:根据所述情感调整信息,调整所述目标指导语音中待调整情感音素的声压级,生成调整处理后的目标指导语音;根据所述语义调整信息,调整所述目标待调整翻译语音中待调整语义音素的声压级,生成调整处理后的目标待调整翻译语音;将所述调整处理后的目标指导语音和所述调整处理后的目标待调整翻译语音进行混音。5.根据权利要求4所述的方法,其特征在于,还包括:获取待指导用户的反应时间;其中,所述反应时间通过待指导用户的身体参数确定,所述身体参...

【专利技术属性】
技术研发人员:蔡永军
申请(专利权)人:南京魔盒信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1