一种翻译方法、装置、设备及其存储介质制造方法及图纸

技术编号:43672316 阅读:26 留言:0更新日期:2024-12-18 20:57
本申请实施例属于语音翻译技术领域,应用于实时语音翻译场景中,涉及一种翻译方法、装置、设备及其存储介质,包括通过获取待翻译实时语音数据;进行文本化转换;将文本化转换结果输入到断句预测模型,进行断句预测;接收输出的所有句子;根据目标语种对所有句子进行文本翻译;根据所有句子在文本化转换结果中的序列信息,对文本翻译结果进行序列化整理;将文本翻译结果转换为目标语音数据。本申请的翻译方法能够通过断句预测模型对待翻译实时语音数据中每句话进行精确分割,从而实现了后续以句子为单元进行翻译,生成目标语音数据,使得翻译出的语音更加准确和科学化。

【技术实现步骤摘要】

本申请涉及语音翻译,应用于实时语音翻译场景中,尤其涉及一种翻译方法、装置、设备及其存储介质


技术介绍

1、语音跨语种翻译,通常指译员在不打断讲话者讲话的情况下,不间断地将内容口译给另一目标语音听众的翻译方式,随着ai技术的发展,越来越多的语音转换技术使用ai进行替代,例如:语音转文字、文字转语音等,因此,语音跨语种翻译也可以实现使用ai替代。

2、目前,平安集团在其智能客服系统中已经集成了语音跨语种翻译技术,可以实现多语言自动翻译功能,但是,“断句”对于语音翻译非常重要,如果源语言讲话者没有进行适当的断句,即使语音识别技术再先进,ai翻译也难以准确捕捉意思,容易导致翻译结果不准确。现有的句子边界检测方法需要等待整个文本输入完毕才能进行句子划分,而且还存在实时句末推断容易出现误判,导致了翻译速度较慢和翻译准确性过低的问题。


技术实现思路

1、本申请实施例的目的在于提出一种翻译方法、装置、设备及其存储介质,以解决现有技术在进行语音跨语种翻译时,还存在实时句末推断容易出现误判,导致了翻译速度较慢和翻译本文档来自技高网...

【技术保护点】

1.一种翻译方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的翻译方法,其特征在于,在执行所述将所述第一文本数据输入到预训练完成的断句预测模型,进行断句预测的步骤之前,所述方法还包括:

3.根据权利要求2所述的翻译方法,其特征在于,所述根据所述序列值对每个样本中所有字符设置不同的实时句尾分值,获得每个样本所对应的所有实时句尾分值序列的步骤,具体包括:

4.根据权利要求1所述的翻译方法,其特征在于,所述断句预测模型中包括句尾打分组件和延迟确定组件,所述将所述第一文本数据输入到预训练完成的断句预测模型,进行断句预测的步骤,具体包括:

5...

【技术特征摘要】

1.一种翻译方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的翻译方法,其特征在于,在执行所述将所述第一文本数据输入到预训练完成的断句预测模型,进行断句预测的步骤之前,所述方法还包括:

3.根据权利要求2所述的翻译方法,其特征在于,所述根据所述序列值对每个样本中所有字符设置不同的实时句尾分值,获得每个样本所对应的所有实时句尾分值序列的步骤,具体包括:

4.根据权利要求1所述的翻译方法,其特征在于,所述断句预测模型中包括句尾打分组件和延迟确定组件,所述将所述第一文本数据输入到预训练完成的断句预测模型,进行断句预测的步骤,具体包括:

5.根据权利要求4所述的翻译方法,其特征在于,在执行所述通过所述句尾打分组件对已输入的所有字符进行打分,获得每个字符分别对应的实时句...

【专利技术属性】
技术研发人员:瞿晓阳王健宗李俊杰
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1