The embodiment of the present invention provides a translation processing method and system, in which the method includes: acquiring the statement of the source language; encoding the statement of the source language to obtain a vector sequence, which includes the word vectors separately converted from each participle separated from the statement; and word-by-word according to the vector sequence. Predict the corresponding candidate words in the target language; generate the sentences of the target language according to the predicted candidate words; in the prediction processing of any of the candidate words, obtain multiple primary words from the presupposed translation vocabulary, and calculate the translation probability of each primary word according to the pre-trained machine translation model, so as to translate according to the said translation. The probability is to select the candidate words from the primary words. The embodiment of the present invention enables sparse language pairs to obtain better translation quality.
【技术实现步骤摘要】
一种翻译处理方法及系统
本专利技术涉及机器翻译
,更具体地,涉及一种翻译处理方法及系统。
技术介绍
随着国际交流的日益深入,人们对语言翻译的需求与日俱增。然而,世界上存在的语言种类繁多,各有特征,形式灵活,使得训练所有语言对之间的机器翻译模型,成为尚待解决的难题。为了实现自动的机器翻译,目前的技术通常基于神经网络的方法。神经网络是数据驱动的,为此,需要收集大规模高质量的平行语料以获得可靠的翻译模型。然而,高质量的平行语料常常只存在于少量的几种语言之间,并且往往受限于某些特定的领域,比如政府文件、新闻等。因此,基于神经网络的机器翻译面临着一个很大的问题:大部分的语言对没有质量很高、数量很多的平行语料。在小规模的数据上训练的神经机器翻译模型翻译效果是很差的,因此导致了大多数的语言对没办法训练一个可靠的神经网络翻译模型。为了解决这个问题,现有技术提出了用多语言的神经机器翻译模型来缓解数据稀疏问题。这些方法的核心思想是“共享”,即同时利用多个语言对的平行预料来训练神经机器翻译模型,共享神经网络的一些子节点甚至是整个神经网络,从而可以在一定程度上解决训练语料稀疏的问题。然而,由于每种语言都有自己独特的特性如语序、词汇等等,只利用“共享”的神经网络去训练多语言翻译模型可能会忽略每种语言的特性,从而导致翻译模型的翻译效果变差。
技术实现思路
本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种翻译处理方法及系统。根据本专利技术实施例的第一个方面,提供一种翻译处理方法,包括:获取源语言的语句;将所述源语言的语句进行编码,得到向量序列,所述向量序列包括由从所述语 ...
【技术保护点】
1.一种翻译处理方法,其特征在于,包括:获取源语言的语句;将所述源语言的语句进行编码,得到向量序列,所述向量序列包括由从所述语句分得的各个分词分别转换成的词向量;根据所述向量序列逐词地预测目标语言中相应的候选词;根据预测得到的候选词生成目标语言的语句;其中,在任一所述候选词的预测处理中,从预设的翻译词表中获取多个初选词,根据预先训练的机器翻译模型计算每个初选词的翻译概率,以根据所述翻译概率从所述初选词中选取所述候选词;所述预先训练的机器翻译模型根据公有翻译模型输出的隐状态和私有翻译模型输出的隐状态建立,所述公有翻译模型根据多个样本语言对训练而成,所述私有翻译模型根据所述源语言和目标语言对应的样本语言对训练而成。
【技术特征摘要】
1.一种翻译处理方法,其特征在于,包括:获取源语言的语句;将所述源语言的语句进行编码,得到向量序列,所述向量序列包括由从所述语句分得的各个分词分别转换成的词向量;根据所述向量序列逐词地预测目标语言中相应的候选词;根据预测得到的候选词生成目标语言的语句;其中,在任一所述候选词的预测处理中,从预设的翻译词表中获取多个初选词,根据预先训练的机器翻译模型计算每个初选词的翻译概率,以根据所述翻译概率从所述初选词中选取所述候选词;所述预先训练的机器翻译模型根据公有翻译模型输出的隐状态和私有翻译模型输出的隐状态建立,所述公有翻译模型根据多个样本语言对训练而成,所述私有翻译模型根据所述源语言和目标语言对应的样本语言对训练而成。2.根据权利要求1所述的翻译处理方法,其特征在于,所述根据所述翻译概率从所述初选词中选取所述候选词,之后还包括:获取所述候选词的词向量。3.根据权利要求2所述的翻译处理方法,其特征在于,所述机器翻译模型包括公有翻译模型、私有翻译模型和softmax模型;相应地,所述从预设的翻译词表中获取多个初选词,根据预先训练的机器翻译模型计算每个初选词的翻译概率,以根据所述翻译概率从所述初选词中选取所述候选词,具体为:从预设的翻译词表中获取若干个词汇作为初选词;根据所述向量序列和在获取若干个词汇之前预测出的候选词的词向量,计算每个所述初选词的公有翻译模型的隐状态;根据所述向量序列和在获取若干个词汇之前预测出的候选词的词向量,计算每个所述初选词的私有翻译模型的隐状态;根据计算得到的所述初选词的公有翻译模型的隐状态和私有翻译模型的隐状态以及在获取若干个词汇之前预测出的候选词的词向量,结合所述softmax模型计算每个初选词的翻译概率;对计算得到的翻译概率进行排序,将翻译概率最高的初选词选为所述候选词。4.根据权利要求3所述的翻译处理方法,其特征在于,所述公有翻译模型包括公有编码器、公有注意力模块以及公有解码器;相应地,所述根据所述向量序列和在获取若干个词汇之前预测出的候选词的词向量,计算每个所述初选词的公有翻译模型的隐状态,具体为:将所述向量序列逐词输入至所述公有编码器中,输出对应所述向量序列中各词向量的公有隐状态;将所述初选词与所述向量序列中各词向量之间在公有翻译模型的权重以及所述向量序列中各词向量的公有隐状态输入至所述公有注意力模块,输出所述初选词的公有翻译模型的上下文信息;将所述在获取若干个词汇之前预测出的候选词的词向量、所述在获取若干个词汇之前预测出的候选词的公有翻译模型的隐状态以及所述初选词的公有翻译模型的上下文信息输入至所述公有解码器,输出所述初选词的公有翻译模型的隐状态。5.根据权利要求3所述的翻译处理方法,其特征在于,所述私有翻译模型包括私有编码器、私有注意力模块以及私有解码器;相应地,所述根据所述向量序列和在获取若干个词汇之前预测出的候...
【专利技术属性】
技术研发人员:刘洋,丁延卓,栾焕博,孙茂松,翟飞飞,许静芳,
申请(专利权)人:清华大学,北京搜狗科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。