翻译方法和装置、存储介质和电子设备制造方法及图纸

技术编号:25440331 阅读:26 留言:0更新日期:2020-08-28 22:28
本发明专利技术公开了一种翻译方法和装置、存储介质和电子设备,包括:在预先训练好的第一目标翻译模型中获取待翻译的第一语种的N个词,N为自然数,第一目标翻译模型用于将第一语种的词翻译成第二语种的词;通过第一目标翻译模型确定N个词的对应的第一目标过去特征向量和第一目标未来特征向量,将第一目标过去特征向量和第一目标未来特征向量(根据N个词对应的N个第一编码向量确定得到的向量)与N个词对应的M个第一解码向量(将N个第一编码向量解码得到的向量)进行拼接,得到M个第一目标拼接向量;使用M个第一目标拼接向量确定第二语种的M个词,第二语种的M个词是第一目标翻译模型对第一语种的N个词进行翻译得到的第二语种的词。

【技术实现步骤摘要】
翻译方法和装置、存储介质和电子设备
本专利技术涉及计算机领域,具体而言,涉及一种翻译方法和装置、存储介质和电子设备。
技术介绍
目前,在机器翻译过程中,需要对过去部分和未来部分进行建模,相关技术中,一般采用的直觉性目标函数存在准确率地的问题,而且在这种建模中缺少对文本上下文信息的利用。另外,对已翻译部分和未翻译部分的建模主要有两点功能,一是准确地发现已翻译部分和未翻译部分,二是利用这些信息来帮助未来的模型预测。但是,相关技术中,混淆了这两种功能。因此,相关技术中,在对文本进行机器翻译时,存在无法准确确定已翻译部分文本和未翻译部分文本的问题,尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种翻译方法和装置、存储介质和电子设备,以至少解决在对文本进行机器翻译时,存在无法准确确定已翻译部分文本和未翻译部分文本的技术问题。根据本专利技术实施例的一个方面,提供了一种翻译方法,包括:在预先训练好的第一目标翻译模型中获取待翻译的第一语种的N个词,其中,N为自然数,上述第一目标翻译模型用于将上述第一语种的词翻本文档来自技高网...

【技术保护点】
1.一种翻译方法,其特征在于,包括:/n在预先训练好的第一目标翻译模型中获取待翻译的第一语种的N个词,其中,N为自然数,所述第一目标翻译模型用于将所述第一语种的词翻译成第二语种的词;/n通过所述第一目标翻译模型确定所述N个词的对应的第一目标过去特征向量和第一目标未来特征向量,并将所述第一目标过去特征向量和所述第一目标未来特征向量与所述N个词对应的M个第一解码向量进行拼接,得到M个第一目标拼接向量,其中,所述第一目标过去特征向量和所述第一目标未来特征向量是根据所述N个词对应的N个第一编码向量确定得到的向量,所述M个第一解码向量是将所述N个第一编码向量解码得到的,M为自然数;/n使用所述M个第一目...

【技术特征摘要】
1.一种翻译方法,其特征在于,包括:
在预先训练好的第一目标翻译模型中获取待翻译的第一语种的N个词,其中,N为自然数,所述第一目标翻译模型用于将所述第一语种的词翻译成第二语种的词;
通过所述第一目标翻译模型确定所述N个词的对应的第一目标过去特征向量和第一目标未来特征向量,并将所述第一目标过去特征向量和所述第一目标未来特征向量与所述N个词对应的M个第一解码向量进行拼接,得到M个第一目标拼接向量,其中,所述第一目标过去特征向量和所述第一目标未来特征向量是根据所述N个词对应的N个第一编码向量确定得到的向量,所述M个第一解码向量是将所述N个第一编码向量解码得到的,M为自然数;
使用所述M个第一目标拼接向量确定所述第二语种的M个词,其中,所述第二语种的M个词是所述第一目标翻译模型对所述第一语种的N个词进行翻译得到的所述第二语种的词。


2.根据权利要求1所述的方法,其特征在于,在所述通过所述第一目标翻译模型确定所述N个词的对应的第一目标过去特征向量和第一目标未来特征向量之前,所述方法还包括:
通过所述第一目标翻译模型中的第一目标编码器对所述第一语种的所述N个词进行编码,得到所述N个第一编码向量,其中,所述N个第一编码向量用于表示所述第一语种的所述N个词;
通过所述第一目标翻译模型中的第一目标解码器对所述N个第一编码向量进行解码,得到所述M个第一解码向量。


3.根据权利要求2所述的方法,其特征在于,所述将所述第一目标过去特征向量和所述第一目标未来特征向量与所述N个词对应的M个第一解码向量进行拼接,得到M个第一目标拼接向量,包括:
对所述M个第一解码向量分别拼接所述第一目标过去特征向量和所述第一目标未来特征向量,得到M个第一目标拼接向量,其中,所述第一目标过去特征向量和所述第一目标未来特征向量是根据所述N个第一编码向量确定得到的向量。


4.根据权利要求2所述的方法,其特征在于,所述通过所述第一目标翻译模型确定所述N个词的对应的第一目标过去特征向量和第一目标未来特征向量,包括:
将所述N个第一编码向量转换为多个第一目标低层级胶囊向量;
将所述多个第一目标低层级胶囊向量转换为多个目标高层级胶囊向量;
将所述多个目标高层级胶囊向量划分为所述第一目标过去特征向量和所述第一目标未来特征向量。


5.根据权利要求1至4任一项中所述的方法,其特征在于,所述方法还包括:
通过预先训练好的第二目标翻译模型确定所述M个词是否为所述N个词的准确翻译,其中,所述第二目标翻译模型用于将所述第二语种的词翻译成第一语种的词。


6.根据权利要求5所述的方法,其特征在于,所述通过预先训练好的第二目标翻译模型确定所述M个词是否为所述N个词的准确翻译,包括:
使用所述第二目标翻译模型中的第二目标编码器对所述第二语种的N1个词进行编码,得到N1个第二编码向量,并根据N1个第二编码向量,确定出第二目标过去特征向量,其中,所述第二语种的N1个词为当前时刻已通过所述第一目标翻译模型翻译得到的所述第二语种的词;
使用所述第二目标编码器对所述第二语种的N2个词进行编码,得到N2个第二目标编码向量,并根据N2个第二目标编码向量,确定出第二目标未来特征向量,其中,所述第二语种的N2个词为所述当前时刻之后待通过所述第一目标翻译模型翻译的所述第一语种的词对应的所述第二语种的词;
根据所述所述第一目标过去特征向量和所述第一目标未来特征向量与所述第二目标过去特征向量和所述目标第二未来特征向量,确定所述当前时刻的目标损失值;
在所述目标损失值满足目标阈值的情况下,确定所述M个词为所述N个词的准确翻译。


7.一种翻译方法,其特征在于,包括:
在对第一训练翻译模型进行第t次迭代时,使用第一训练翻译模型中的第一训练编码器对第一语种的第Nt个词进行编码,得到第Nt个第一训练编码向量,其中,所述第Nt个第一训练编码向量用于表示所述第一语种的所述第Nt个词,Nt为自然数,所述第一训练翻译模型用于将所述第一语种的词翻译成第二语种的词;
根据所述第Nt个第一训练编码向量,确定出第一过去特征向量和第一未来特征向量;
使用第二训练翻译模型中的第二训练编码器对所述第二语种的Nt1个词进行编码,得到Nt1个第二训练编码向量,并根据Nt1个第二训练编码向量,确定出第二过去特征向量,其中,所述第二语种的Nt1个词为所述第t次迭代之前已通过所述第一训练翻译模型翻译得到的所述第二语种的词;
使用所述第二训练编码器对所述第二语种的Nt2个词进行编码,得到Nt2个第二训练编码向量,并根据Nt2个第二训练编码向量,确定出第二未来特征向量,其中,所述第二语种的Nt2个词为所述第t次迭代之后待通过所述第一训练翻译模型翻译的所述第一语种的词对应的所述第二语种的词;
根据所述第一过去特征向量和所述第一未来特征向量与所述第二过去特征向量和所述第二未来特征向量,确定第t次迭代的第一损失值;
在所述第t...

【专利技术属性】
技术研发人员:颜建昊孟凡东周杰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1