一种多语种语音翻译方法及系统技术方案

技术编号：33618620 阅读：21 留言：0更新日期：2022-06-02 00:38

本发明专利技术公开了一种多语种语音翻译方法及系统，涉及语音翻译技术领域，首先获取源语音音频和目标语种类别；对源语音音频进行音频预处理，得到预处理后的源语音音频；对于预处理后的源语音音频，进行语种识别，得到待翻译的源语种类别；依据源语种类别，采用对应的语音识别模型，将预处理后的源语音音频转换成源语音文本；将源语音文本输入文本翻译模型中，得到目标语种文本。本发明专利技术能够克服源语音的噪声影响，提高模型识别的准确率，并且能够对多种不同的语言类型进行准确的识别和翻译，提高用户的使用体验感。户的使用体验感。户的使用体验感。

全部详细技术资料下载

【技术实现步骤摘要】
一种多语种语音翻译方法及系统

[0001]本专利技术涉及语音翻译
，更具体的说是涉及一种多语种语音翻译方法及系统。

技术介绍

[0002]随着人工智能、自然语言处理等技术的发展，语音翻译技术在同传、外语教学等场景中得到了广泛的应用。语音翻译的目的是将一种语言的语音转化为另一种语言的文本。
[0003]语音翻译过程通常包括两个步骤，即，由语音翻译模型实现语音识别和文本翻译。具体地，首先，将一段语音经过语音识别技术，识别成与之同一语种的文本，然后，利用文本翻译技术将该识别文本翻译成另一语种的文本，从而实现语音翻译过程。
[0004]但是，联合语音识别技术和文本翻译技术进行语音翻译，存在错误累积的缺点，尤其对于初始的语音识别这一环节，容易受到源语音的噪声影响，导致识别结果准确率较低，并且由于大多的语音翻译仅支持单一的语种翻译，对于不同语种的音频进行翻译时，由于模型的单一性限制，导致语音识别不准确，因此，如何提高语音翻译过程，尤其是语音识别环节的准确性，是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此，本专利技术提供了一种多语种语音翻译方法及系统。
[0006]为了实现上述目的，本专利技术提供如下技术方案：
[0007]一种多语种语音翻译方法，包括以下步骤：
[0008]步骤1、获取源语音音频和目标语种类别；
[0009]步骤2、对源语音音频进行音频预处理，得到预处理后的源语音音频；
[0010]步骤3、对于预处理后的源语音音频...

【技术保护点】

【技术特征摘要】
1.一种多语种语音翻译方法，其特征在于，包括以下步骤：步骤1、获取源语音音频和目标语种类别；步骤2、对源语音音频进行音频预处理，得到预处理后的源语音音频；步骤3、对于预处理后的源语音音频，进行语种识别，得到待翻译的源语种类别；步骤4、依据源语种类别，采用对应的语音识别模型，将预处理后的源语音音频转换成源语音文本；步骤5、将源语音文本输入文本翻译模型中，得到目标语种文本。2.根据权利要求1所述的一种多语种语音翻译方法，其特征在于，所述步骤2中，所述预处理包括语音增强和噪声过滤。3.根据权利要求1所述的一种多语种语音翻译方法，其特征在于，所述步骤3中，进行语种识别的具体过程为：步骤3.1、对于待识别的语音音频，进行特征提取，得到多个音频特征；步骤3.2、基于神经网络的注意力机制，选出主要音频特征；步骤3.3、基于所述主要音频特征，确定语种识别结果。4.根据权利要求3所述的一种多语种语音翻译方法，其特征在于，所述步骤3.1中，进行特征提取的具体过程为：对待识别的语音音频进行分段，对于每段语音音频，提取其ZCPA特征作为音频特征。5.根据权利要求3所述的一种多语种语音翻译方法，其特征在于，所述步骤3.3中，需调用预设的语种特征库，根据音频特征，确定语种识别结果。6.根据权利要求1所述的一种多语种语音翻译方法，其特征在于，所述步骤4中，预设有多个语音识别模型，用于对不...

【专利技术属性】
技术研发人员：陈倩，
申请(专利权)人：郑州科技学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人