语音翻译方法、装置、设备及存储介质制造方法及图纸

技术编号：30432212 阅读：63 留言：0更新日期：2021-10-24 17:26

本申请实施例提供了一种语音翻译方法、装置、设备及存储介。本方法通过对输入的语音信号，进行识别判断，积累至少一个所述实义要素形成判断单元，基于BERT分类模型和判断单元得到实义单元，再对所述实义单元进行分段，形成目标词段；最后基于Transformer翻译模型，对所述目标词段进行翻译并输出。采用本方案大大缩短了需翻译句子的长度，避免长句中语义以及语句成份复杂带来的翻译问题，提升了翻译的准确度；同时，语音的输入、目标词段的形成以及翻译可以同步进行，提高了翻译速度。提高了翻译速度。提高了翻译速度。

全部详细技术资料下载

【技术实现步骤摘要】
语音翻译方法、装置、设备及存储介质

[0001]本申请实施例涉及但不限于人工智能领域，尤其涉及一种语音翻译方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]机器翻译是一种借助程序将一种自然语言翻译成另一种自然语言的技术，该技术在各行各业已被广泛应用。机器翻译已经从早期基于规则技术发展到现在利用神经网络技术。目前机器翻译应用在书面翻译时效果较好，基本满足达到高准确度和低时延的要求。但应用在语音翻译如同声传译时，效果欠佳，翻译准确度和时延均有待改善。

技术实现思路

[0003]本申请实施例提供了一种语音翻译方法、装置、设备及计算机可读存储介质，通过对输入的语音信号直接进行源文本分段，并同步翻译，进而达到缩短时延的效果。
[0004]第一方面，本申请的实施例提供了一种语音翻译方法，包括：获取源语音信号，识别所述源语音信号中的实义要素；顺序积累至少一个所述实义要素形成判断单元；基于BERT分类模型，计算所述判断单元在预设分类结果条件下的概率值；若所述概率值大于第一阈值，则所述判断单...

【技术保护点】

【技术特征摘要】
1.一种语音翻译方法，包括：获取源语音信号，识别所述源语音信号中的实义要素；顺序积累至少一个所述实义要素形成判断单元；基于BERT分类模型，计算所述判断单元在预设分类结果条件下的概率值；若所述概率值大于第一阈值，则所述判断单元为实义单元；对所述实义单元进行分段，形成目标词段；基于Transformer翻译模型，对所述目标词段进行翻译并输出。2.根据权利要求1所述的语音翻译方法，其特征在于，所述基于BERT分类模型，计算所述判断单元在确定分类结果条件下的概率值，包括：顺序积累未进入所述判断单元的所述实义要素，形成预备单元，其中，预备单元包括至少一个实义要素；基于BERT分类模型，输入所述判断单元与所述预备单元，计算所述判断单元在分类结果为实义单元条件下的概率值。3.根据权利要求1所述的语音翻译方法，其特征在于，所述对所述实义单元进行分段，形成目标词段，包括：获取当前所述实义单元中每个实义要素的注意力值，并判断所述注意力值最大的实义要素所出现的位置，其中，所述注意力值通过注意力机制模型获得；若所述注意力值最大的实义要素出现在所述实义单元的预设位置，则对所述实义单元进行分段，形成目标词段。4.根据权利要求1所述的语音翻译方法，其特征在于，所述对所述实义单元进行分段，形成目标词段，包括：获取当前所述实义单元中每个实义要素的注意力值，并判断所述注意力值最大的实义要素所出现的位置，其中，所述注意力值通过注意力机制模型获得；若所述注意力值最大的实义要素出现在当前所述实义单元的非预设位置，则对当前所述实义单元进行扩展；获取扩展后的实义单元中每个所述实义要素的注意力值，并判断注意力值最大的所述单词所出现的位置，直至所述注意...

【专利技术属性】
技术研发人员：于凤英，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人