语音翻译方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：26602159 阅读：54 留言：0更新日期：2020-12-04 21:25

本申请提供了一种语音翻译方法、装置、电子设备及计算机可读存储介质，该方法包括：将待翻译语音信号进行切分，并提取切分后的每个语音片段的语音特征；对每个语音片段的语音特征进行语音编码，得到每个语音片段的编码结果；对每个语音片段的编码结果进行解码，得到每个语音片段所对应的目标语言的文本。基于本申请实施例所提供的方案，至少能够提高翻译准确性和翻译效率中的至少一个方面。

全部详细技术资料下载

【技术实现步骤摘要】
语音翻译方法、装置、电子设备及计算机可读存储介质
本申请涉及计算机
，具体而言，本申请涉及一种语音翻译方法、装置、电子设备及计算机可读存储介质。
技术介绍
语音翻译，即将一种语言的语音翻译成另一种语言的文本，而随着信息国际化时代的到来和各种社会需求的提高，语音翻译已经在人们的生活中的一个重要部分，语音翻译技术的研究也受到越来越广泛的关注。虽然目前已经有各种不同的实现语音翻译的方案，但是现有技术中语音翻译结果的准确性仍有待提高。
技术实现思路
本申请的目的旨在提供了一种语音翻译方法、装置、电子设备及计算机可读存储介质，基于本申请实施例提供的该方案，至少能够有效提高语音翻译结果的准确性和语音翻译速度中的至少一项。为实现该目的，本申请提供的技术方案如下：第一方面，本申请实施例提供了一种语音翻译方法，该方法包括：将待翻译语音信号进行切分，并提取切分后的每个语音片段的语音特征；对每个语音片段的语音特征进行语音编码，得到每个语音片段的编码结果；对每个语音片段的编码结果进行解码，得...

【技术保护点】
1.一种语音翻译方法，其特征在于，包括：/n将待翻译语音信号进行切分，并提取切分后的每个语音片段的语音特征；/n对每个语音片段的语音特征进行语音编码，得到每个语音片段的编码结果；/n对每个语音片段的编码结果进行解码，得到每个语音片段所对应的目标语言的文本。/n

【技术特征摘要】
20190514 CN 20191040008401.一种语音翻译方法，其特征在于，包括：
将待翻译语音信号进行切分，并提取切分后的每个语音片段的语音特征；
对每个语音片段的语音特征进行语音编码，得到每个语音片段的编码结果；
对每个语音片段的编码结果进行解码，得到每个语音片段所对应的目标语言的文本。

2.根据权利要求1所述的方法，其特征在于，所述对每个语音片段的语音特征进行语音编码，得到每个语音片段的编码结果，包括：
对于每个语音片段，确定该语音片段的前序语音片段的语义完整性；
若该语音片段的前序语音片段的语义不完整，则将该语音片段和该语音片段的前序语音片段进行合并，将合并后的语音片段所对应的语音特征进行语音编码，得到该语音片段的编码结果；
若该语音片段的前序语音片段的语义完整，则对该语音片段的语音特征进行语音编码，得到该语音片段的编码结果。

3.根据权利要求2所述的方法，其特征在于，所述将该语音片段和该语音片段的前序语音片段进行合并，将合并后的语音片段所对应的语音特征进行语音编码，得到该语音片段的编码结果，包括：
将该语音片段的语音特征和该语音片段的前序语音片段的语音特征进行合并，将合并后的语音特征作为合并后的语音片段的语音特征，对合并后的语音特征进行语音编码，得到该语音片段的编码结果。

4.根据权利要求2或3所述的方法，其特征在于，所述确定该语音片段的前序语音片段的语义完整性，包括以下至少一项：
根据该语音片段的前序语音片段的语义特征，确定该语音片段的前序语音片段的语义完整性；
根据该语音片段的语音特征和该语音片段的前序语音片段的语义特征，确定该语音片段的前序语音片段的语义完整性。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述对每个语音片段的语音特征进行语音编码，得到每个语音片段的编码结果，包括：
根据每个语音片段的语音特征，确定每个语音片段的特征向量；
基于每个语音片段的特征向量得到每个语音片段的编码结果。

6.根据权利要求5所述的方法，其特征在于，所述根据每个语音片段的语音特征，确定每个语音片段的特征向量，包括：
对于每个语音片段，通过至少两种卷积处理参数对语音片段的语音特征进行特征提取，并将通过至少两种卷积处理参数提取后的特征进行特征映射，得到特征向量。

7.根据权利要求6所述的方法，其特征在于，所述通过至少两种卷积处理参数对语音片段的语音特征进行特征提取，并将通过至少两种卷积处理参数提取后的特征进行特征映射，得到特征向量，包括：
确定语音片段的语音长度；
若语音长度大于长度阈值，则根据通过至少两种卷积处理参数对语音片段的语音特征进行特征提取，并将通过至少两种卷积处理参数提取后的特征进行特征映射，得到特征向量；
若语音长度不大于长度阈值，则将语音片段的语音特征进行融合，得到特征向量。

8.根据权利要求6或7所述的方法，其特征在于，所述通过至少两种卷积处理参数对语音片段的语音特征进行特征提取，并将通过至少两种卷积处理参数提取后的特征进行特征映射，包括：
通过至少两种卷积处理参数对语音片段的语音特征进行特征提取，并对提取后的特征进行下采样；
将下采样后的特征进行特征映射。

9.根据权利要求8所述的方法，其特征在于，所述长度阈值是根据下采样的采样率、下采样的次数、以及所述卷积处理参数中的至少一项确定的。

10.根据权利要求6至9中任一项所述的方法，其特征在于，通过至少两种卷积处理参数对语音片段的语音特征进行特征提取，包括：
通过至少一层卷积层...

【专利技术属性】
技术研发人员：涂眉，刘炜，张帆，刘松，
申请(专利权)人：北京三星通信技术研究有限公司，三星电子株式会社，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人