【技术实现步骤摘要】
文本翻译方法、装置、设备及存储介质
[0001]本公开实施例涉及机器翻译
,尤其涉及一种文本翻译方法、装置、设备及存储介质。
技术介绍
[0002]机器翻译(Machine Translation,MT)是自然语言处理(Natural Language Processing,NLP)领域中的一个重要领域,旨在使用机器将一种语言翻译为另一种语言。MT经过多年的发展,从基于规则的方法到基于统计的方法,再到如今的基于神经网络的神经机器翻译(Neural Machine Translation,NMT)。一般来说,和许多其他主流的NLP任务一样,NMT也采用一个序列到序列的结构(Sequence to sequence,seq2seq),由编码器和解码器组成。编码器(encoder)将源端的句子编码为向量表示,然后解码器(decoder)根据向量表示逐词生成对应的翻译。
技术实现思路
[0003]本公开实施例提供一种文本翻译方法、装置、设备及存储介质,以实现对话文本的翻译,提高对话文本翻译的准确性。
[ ...
【技术保护点】
【技术特征摘要】
1.一种文本翻译方法,其特征在于,包括:对待翻译文本的至少两个句子采用设定分割标签进行分割;将分割后的所述待翻译文本输入机器翻译模型的编码器,获得所述待翻译文本的词序列及标记序列;将所述词序列及所述标记序列输入所述机器翻译模型的解码器,获得目标翻译结果。2.根据权利要求1所述的方法,其特征在于,所述待翻译文本包括在线文本;对待翻译文本的至少两个句子采用设定分割标签进行分割,包括:获取当前句子以及设定数量的前向句子,组成待翻译文本;对所述当前句子和所述前向句子采用设定分割标签进行分割。3.根据权利要求2所述的方法,其特征在于,在获取目标翻译结果之后,还包括:从所述目标翻译结果中截取出所述当前句子对应的翻译结果。4.根据权利要求2所述的方法,其特征在于,在将所述当前句子和所述前向句子采用设定分割标签进行分割之后,还包括:获取所述前向句子对应的历史翻译结果;相应的,将分割后的所述待翻译文本输入机器翻译模型的编码器,获得所述待翻译文本的词序列及标记序列,包括:将所述历史翻译结果和所述待翻译文本输入机器翻译模型的编码器,获得所述待翻译文本的词序列及标记序列。5.根据权利要求1所述的方法,其特征在于,所述机器翻译模型的训练过程为:获取原始文本及所述原始文本的原始翻译结果;对所述原始文本的至少两个句子采用所述设定分割标签进行分割;对分割后的所述原始文本按照设定规则进行预处理,获得训练文本;根据所述设定规则对所述训练文本添加标记,获得原始标记序列;基于所述训练文本、所述原始翻译结果及所述原始标记序列对所述机器翻译模型进行训练。6.根据权利要求5所述的方法,其特征在于,基于所述训练文本、所述原始翻译结果及所述原始标记序列对所述机器翻译模型进行训练,包括:将所述训练文本输入所述机器翻译模型的解码器,...
【专利技术属性】
技术研发人员:赵程绮,王涛,王明轩,李磊,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。