翻译方法、装置、设备和存储介质制造方法及图纸

技术编号:21399336 阅读:15 留言:0更新日期:2019-06-19 07:05
本发明专利技术提供一种翻译方法、装置、设备和存储介质,该方法包括:获取待翻译的第一字符串,将待翻译的第一字符串输入到预先获得的翻译模型中,得到对该第一字符串的翻译结果,其中,该翻译模型为基于神经网络对字符串样本进行训练得到的模型,字符串样本的语言与第一字符串的语言一致。本发明专利技术实施例提供的翻译方法、装置、设备和存储介质,提高了翻译的准确度。

【技术实现步骤摘要】
翻译方法、装置、设备和存储介质
本专利技术涉及机器翻译技术,尤其涉及一种翻译方法、装置、设备和存储介质。
技术介绍
随着经济的全球化发展,各国之间的交流越来越密切,因此准确的翻译显得格外重要。现有技术中,为了提高翻译的准确度,引入了先验知识,具体地,采用独热编码将先验知识的类别标签表示成一个独热向量,或者将先验知识的类别标签直接映射成一个随机向量,然后将该向量和词向量直接进行拼接,从而得到一个更大的词向量,参与到神经网络机器翻译(NeuralMachineTranslation,NMT)中。然而,采用现有直接拼接的方式将先验知识引入翻译中,会导致翻译结果不准确。
技术实现思路
为解决现有技术中存在的问题,本专利技术提供一种翻译方法、装置、设备和存储介质,以完成对字符串的翻译,提高翻译的准确度。第一方面,本专利技术实施例提供一种翻译方法,包括:获取待翻译的第一字符串;将所述待翻译的第一字符串输入到预先获得的翻译模型中,得到对所述第一字符串的翻译结果;其中,所述翻译模型为基于神经网络对字符串样本进行训练得到的模型,所述字符串样本的语言与所述第一字符串的语言一致。可选的,所述翻译模型是按照如下训练方式得到:获取多个字符串样本;采用开源工具对所述多个字符串样本进行分类,获取每个字符串样本的先验知识对应的向量;将所述先验知识对应的向量和编码层进行拼接,得到每个字符串样本的多个新向量;对所述多个新向量的权重进行训练,得到所述翻译模型。可选的,所述将所述先验知识对应的向量和编码层进行拼接,得到每个字符串样本的多个新向量,包括:将所述先验知识对应的向量和编码层的隐含向量进行拼接,得到每个字符串样本的多个新向量,其中,所述隐含向量和所述每个字符串样本对应的词向量之间的关系为预设函数关系;所述编码层包括每个字符串样本对应的词向量和所述词向量对应的隐含向量。可选的,对所述多个新向量的权重进行训练,得到所述翻译模型,包括:根据所述多个新向量和每个字符串样本的翻译结果,对所述多个新向量的权重进行训练,得到所述翻译模型。可选的,所述采用开源工具对所述多个字符串样本进行分类,获取每个字符串样本的先验知识对应的向量,包括:采用所述开源工具对所述多个字符串样本进行分类,得到每个字符串样本的先验知识对应的分类概率;根据所述分类概率,获取每个字符串样本的先验知识对应的向量。第二方面,本专利技术实施例提供一种翻译装置,包括:获取模块,用于获取待翻译的第一字符串;处理模块,还用于将所述待翻译的第一字符串输入到预先获得的翻译模型中,得到对所述第一字符串的翻译结果;其中,所述翻译模型为基于神经网络对字符串样本进行训练得到的模型,所述字符串样本的语言与所述第一字符串的语言一致。可选的,所述装置还包括训练模块:所述获取模块,还用于获取多个字符串样本;所述处理模块,还用于采用开源工具对所述多个字符串样本进行分类,获取每个字符串样本的先验知识对应的向量;将所述先验知识对应的向量和编码层进行拼接,得到每个字符串样本的多个新向量;所述训练模块,用于对所述多个新向量的权重进行训练,得到所述翻译模型。可选的,所述处理模块具体用于:将所述先验知识对应的向量和编码层的隐含向量进行拼接,得到每个字符串样本的先验知识对应的多个新向量;其中,所述隐含向量和所述每个字符串样本对应的词向量之间的关系为预设函数关系,所述编码层包括每个字符串样本对应的词向量和所述词向量对应的隐含向量。可选的,所述训练模块具体用于:根据所述多个新向量和每个字符串样本的翻译结果,对所述多个新向量的权重进行训练,得到所述翻译模型。可选的,所述处理模块,还用于采用所述开源工具对所述多个字符串样本进行分类,得到每个字符串样本的先验知识对应的分类概率;所述获取模块,还用于:根据所述分类概率,获取每个字符串样本的先验知识对应的向量。第三方面,本专利技术实施例提供一种终端设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述终端设备执行如第一方面所述的方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现如第一方面所述的方法。本专利技术实施例提供一种翻译方法、装置、设备和存储介质,该方法包括:获取待翻译的第一字符串,将待翻译的第一字符串输入到预先获得的翻译模型中,得到对该第一字符串的翻译结果,其中,该翻译模型为基于神经网络对字符串样本进行训练得到的模型,字符串样本的语言与第一字符串的语言一致。本专利技术实施例提供的翻译方法、装置、设备和存储介质,将先验知识的分类概率作为该先验知识的向量,并结合神经网络训练得到先验知识的权重,提高了翻译的准确度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的神经网络机器翻译系统的整体架构示意图;图2为本专利技术实施例提供的翻译方法的流程示意图一;图3为本专利技术实施例提供的先验知识的分类示意图;图4为本专利技术实施例提供的翻译方法的流程示意图二;图5a为本专利技术实施例提供的先验知识对应的向量和词向量拼接的示意图;图5b为本专利技术实施例提供的先验知识对应的向量和隐含向量拼接的示意图;图6为本专利技术实施例提供的翻译装置的结构示意图一;图7为本专利技术实施例提供的翻译装置的结构示意图二;图8为本专利技术实施例提供的终端设备的硬件结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的翻译方法可以应用于需要对字符串进行翻译的应用场景中,尤其应用于对翻译的准确度要求较高的场景中。图1为本专利技术实施例提供的神经网络机器翻译系统的整体架构示意图,如图1所示,神经网络机器翻译(NeuralMachineTranslation,NMT)是一种机器翻译方法,其包括编码encoder层、解码decoder层、中attention层,encoder、attention把源语言序列进行编码,并提取源语言中信息,通过decoder再把这种信息转换到另一种语言即目标语言中来,从而完成对源语言的翻译。目前,通常基于NMT进行翻译,在NMT系统中,结合先验知识进行翻译的具体方式是:将各种先验知识的类别标签直接表示成一个独热向量,举例来说,假如先验知识为词性(名词、动词、副词等),先验知识的类别有10类,则名词对应的独热向量可以为(0,0,1,0,0,0,0,0,0,0),即一个10维的向量。或者,将先验知识的类别标签直接映射成一个随机向量,然后将该独热向量或随机向量该向量和词向量直接进行拼接,其中词向量为待翻译的字符串对应的词向量,词向量的实现方式和现有技术中的实现方式类似,在此不再赘述。应理解,先验知识可以为待翻译的本文档来自技高网...

【技术保护点】
1.一种翻译方法,其特征在于,包括:获取待翻译的第一字符串;将所述待翻译的第一字符串输入到预先获得的翻译模型中,得到对所述第一字符串的翻译结果;其中,所述翻译模型为基于神经网络对字符串样本进行训练得到的模型,所述字符串样本的语言与所述第一字符串的语言一致。

【技术特征摘要】
1.一种翻译方法,其特征在于,包括:获取待翻译的第一字符串;将所述待翻译的第一字符串输入到预先获得的翻译模型中,得到对所述第一字符串的翻译结果;其中,所述翻译模型为基于神经网络对字符串样本进行训练得到的模型,所述字符串样本的语言与所述第一字符串的语言一致。2.根据权利要求1所述的方法,其特征在于,所述翻译模型是按照如下训练方式得到:获取多个字符串样本;采用开源工具对所述多个字符串样本进行分类,获取每个字符串样本的先验知识对应的向量;将所述先验知识对应的向量和编码层进行拼接,得到每个字符串样本的多个新向量;对所述多个新向量的权重进行训练,得到所述翻译模型。3.根据权利要求2所述的方法,其特征在于,所述将所述先验知识对应的向量和编码层进行拼接,得到每个字符串样本的多个新向量,包括:将所述先验知识对应的向量和编码层的隐含向量进行拼接,得到每个字符串样本的多个新向量,其中,所述隐含向量和所述每个字符串样本对应的词向量之间的关系为预设函数关系;所述编码层包括每个字符串样本对应的词向量和所述词向量对应的隐含向量。4.根据权利要求3所述的方法,其特征在于,对所述多个新向量的权重进行训练,得到所述翻译模型,包括:根据所述多个新向量和每个字符串样本的翻译结果,对所述多个新向量的权重进行训练,得到所述翻译模型。5.根据权利要求4所述的方法,其特征在于,所述采用开源工具对所述多个字符串样本进行分类,获取每个字符串样本的先验知识对应的向量,包括:采用所述开源工具对所述多个字符串样本进行分类,得到每个字符串样本的先验知识对应的分类概率;根据所述分类...

【专利技术属性】
技术研发人员:张传强毕天驰熊皓何中军李芝王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1