即时通话语音的翻译方法、装置以及终端制造方法及图纸

技术编号：24290018 阅读：32 留言：0更新日期：2020-05-26 20:12

本申请实施例提供了一种即时通话语音的翻译方法、装置及电子设备，该方法包括：获取待翻译的即时通话语音信号，并将待翻译的即时语音信号切分为预设个数的语音帧，然后确定各个语音帧分别对应的特征向量，然后基于神经网络的语音识别模型对各个语音帧分别对应的特征向量进行语音识别，以确定相应的语音识别结果，然后将语音识别结果翻译为与预设的目标语种匹配的翻译信息，并输出翻译信息。本申请实施例可以使得不同语种用户可以顺畅地进行即时通话，并可以降低使用不同语种的用户进行即时通话的复杂度，进而可以提升用户体验。

Translation method, device and terminal of instant call voice

全部详细技术资料下载

【技术实现步骤摘要】
即时通话语音的翻译方法、装置以及终端
本申请涉及语音智能翻译
，具体而言，本申请涉及一种即时通话语音的翻译方法、装置及电子设备。
技术介绍
随着科技的发展，手机已经成为人们日常通信交流的重要工具。随着国家同国家的贸易、交流的不断发展和进步，用户国际化的趋势必然导致不同国家用户在使用手机进行沟通时存在问题。以中、英文母语用户为例，当使用中文的用户向使用英文的用户发送即时通话时，由于使用中文的用户可能听不懂英文，使用英文的用户可能听不懂中文，双方均需要将接收到的语音录制并输入至翻译软件后，进行翻译，才可以获知对方的意思，从而导致使用不同语种的用户进行即时通话的复杂度较高，用户体验较差。
技术实现思路
本申请提供了一种即时通话语音的翻译方法、装置及终端，用于解决使用不同语种的用户进行即时通话的复杂度较高以及用户体验较差的问题。技术方案如下：第一方面，本申请提供一种即时通话语音的翻译方法，该方法包括：获取待翻译的即时通话语音信号，并将待翻译的即时语音信号切分为预设个数的语音帧；>确定各个语音帧分别本文档来自技高网...

【技术保护点】
1.一种即时通话语音的翻译方法，其特征在于，包括如下步骤：/n获取待翻译的即时通话语音信号，并将所述待翻译的即时语音信号切分为预设个数的语音帧；/n确定各个语音帧分别对应的特征向量；/n基于神经网络的语音识别模型对各个语音帧分别对应的特征向量进行语音识别，以确定相应的语音识别结果；/n将所述语音识别结果翻译为与预设的目标语种匹配的翻译信息；/n输出所述翻译信息。/n

【技术特征摘要】
1.一种即时通话语音的翻译方法，其特征在于，包括如下步骤：
获取待翻译的即时通话语音信号，并将所述待翻译的即时语音信号切分为预设个数的语音帧；
确定各个语音帧分别对应的特征向量；
基于神经网络的语音识别模型对各个语音帧分别对应的特征向量进行语音识别，以确定相应的语音识别结果；
将所述语音识别结果翻译为与预设的目标语种匹配的翻译信息；
输出所述翻译信息。

2.根据权利要求1所述的方法，其特征在于，基于神经网络的语音识别模型对各个语音帧分别对应的特征向量进行语音识别，以确定相应的语音识别结果，包括：
利用基于神经网络的语音识别模型对所述特征向量进行识别，确定与所述各个特征向量分别对应的状态值；
对所述各个特征向量分别对应的状态值进行解码，得到所述即时通话语音信号对应的文本信息。

3.根据权利要求2所述的方法，其特征在于，所述利用基于神经网络的语音识别模型对所述特征向量进行识别之前，所述方法还包括：
获取即时通话语音信号中的一个语音片段；
确定所述语音片段对应的语种；
所述利用基于神经网络的语音识别模型对所述特征向量进行识别，确定与所述各个特征向量分别对应的状态值，包括：
利用与确定的语种对应的语音识别模型对所述特征向量进行识别，确定与所述各个特征向量分别对应的状态值。

4.根据权利要求1所述的方法，其特征在于，所述将所述语音识别结果翻译为与预设的目标语种匹配的翻译信息，包括：
对所述语音识别结果进行处理，以确定所述语音识别结果对应的文本向量；
利用基于注意力机制的翻译模型对所述文本向量进行处理，得到与预设的目标语种匹配的文本信息。

5.根据权利要求1所述的方法，其特征在于，所述将所述语音识别结果翻译为与预设的目标语种匹配的翻译信息，包括：
对所述语音识别结果进行处理，以确定所述语音识别结果对应的文本向量；
利用基于注意力机制的翻译模型对所述文本向量进行处理，得到与预设的目标语种匹配的文本信息；
将所述文本信息合成与预设的目标语种匹配的语音信息。

6....

【专利技术属性】
技术研发人员：张乐杰，李玉峰，
申请(专利权)人：西安欧思奇软件有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人