模型参数搜索方法以及装置制造方法及图纸

技术编号:21513988 阅读:47 留言:0更新日期:2019-07-03 09:04
本申请提供模型参数搜索方法以及装置,其中,所述模型参数搜索方法包括:获取至少两个翻译模型对语料库中的语料进行翻译后输出的各自的译文,以及所述译文中每个译句的翻译概率;基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组;将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数。本申请提供的模型参数搜索方法,结合语料库中的语料和语料经翻译模型翻译后的翻译概率在参数空间中对翻译模型的权重参数进行搜索,提升了参数搜索效率,并且使应用搜索获得的目标权重参数的翻译模型的翻译准确率更高,得到更准确的翻译结果。

Method and Device of Model Parameter Search

【技术实现步骤摘要】
模型参数搜索方法以及装置
本申请涉及机器翻译
,特别涉及一种模型参数搜索方法。本申请同时涉及一种模型参数搜索装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
自然语言处理是研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法,而随着自然语言处理的飞速发展,作为计算语言学一个传统分支的机器翻译也受到了广泛关注,机器翻译又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程,机器翻译是人工智能的终极目标之一,具有重要的实用价值,在促进政治、经济、文化交流等方面起到越来越重要的作用。目前,机器翻译重要的一种实现方式就是通过建立机器翻译模型,通过将待翻译的内容输入预先建立并训练好的多个机器翻译模型,多个翻译模型分别按照不同的算法进行翻译输出的翻译结果,然后通过一定的手段评价每个机器翻译模型的翻译结果,将评价最好的翻译结果作为待翻译的内容进行翻译后的译文。但目前在确定机器翻译模型的翻译结果中选择译文的过程中,对机器翻译模型的考虑的损失不够充分,无法充分反映采用不同算法的机器翻译模型针对不同内容进行翻译获得的翻译结果的损失,最终得到的译文的准确率较低。
技术实现思路
有鉴于此,本申请实施例提供了一种模型参数搜索方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种模型参数搜索装置,一种计算设备,以及一种计算机可读存储介质。本申请提供一种模型参数搜索方法,包括:获取至少两个翻译模型对语料库中的语料进行翻译后输出的各自的译文,以及所述译文中每个译句的翻译概率;基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组;将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数。可选的,所述基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组,包括:基于所述译文和所述译文中每个译句的翻译概率构建搜索树;所述参数空间中的权重参数组与所述搜索树中的搜索节点一一对应;按照所述搜索树在所述参数空间中搜索所述至少两个翻译模型对应的权重参数组。可选的,所述基于所述译文和所述译文中每个译句的翻译概率构建搜索树子步骤执行过程中,针对所述参数空间中的权重参数组对应所述搜索树中的搜索节点,执行如下操作:根据所述搜索节点对应的所述参数空间中的权重参数组,将所述权重参数组作为所述至少两个翻译模型的权重参数,并结合所述译文中每个译句的翻译概率计算所述搜索节点的启发代价;其中,所述搜索节点的启发代价根据所述至少两个翻译模型中每个翻译模型的模型启发代价计算获得,每个翻译模型的模型启发代价为该翻译模型的权重参数与所述译文中每个译句的翻译概率的乘积之和。可选的,所述搜索树中任意一个搜索节点的下层搜索节点,采用如下方式确定:采用高斯算法确定所述搜索树中与所述搜索节点相邻且具有连接关系的相邻搜索节点的搜索节点集合;根据计算获得的所述搜索节点集合中每个相邻搜索节点的启发代价,在所述搜索节点集合中选择启发代价最高的至少一个相邻搜索节点作为所述搜索节点的下层搜索节点。可选的,所述采用高斯算法确定所述搜索树中与所述搜索节点相邻且具有连接关系的相邻搜索节点的搜索节点集合子步骤执行之后,且所述根据计算获得的所述搜索节点集合中每个相邻搜索节点的启发代价,在所述搜索节点集合中选择启发代价最高的至少一个相邻搜索节点作为所述搜索节点的下层搜索节点子步骤执行之前,包括:针对所述搜索节点集合中的搜索节点,根据所述搜索节点对应的所述参数空间中的权重参数组,将所述权重参数组作为所述至少两个翻译模型的权重参数;以所述至少两个翻译模型的所述权重参数为依据,采用重排序对所述至少两个翻译模型各自输出的文本译文进行融合,获得所述待翻译文本的参考文本译文;将所述参考文本译文与所述语料的真实译文进行比对,确定所述参考文本译文相对于所述真实译文的翻译准确率和/或翻译损失;判断所述翻译准确率和/或所述翻译损失是否大于所述搜索节点的上层搜索节点对应的翻译准确率和/或翻译损失;若不大于,将所述搜索节点从其所属的搜索节点集合中剔除。可选的,所述基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组步骤,基于集束搜索算法实现。可选的,所述将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数步骤执行之后,包括:将待翻译文本分别输入所述至少两个翻译模型进行文本翻译,分别输出针对所述待翻译文本的文本译文;采用重排序对所述至少两个翻译模型各自输出的文本译文进行融合,获得所述待翻译文本的最优文本译文。可选的,所述至少两个翻译模型中每个翻译模型输出的文本译文由至少一个文本译句组成,且所述文本译文中的译句分别对应所述待翻译文本中的待翻译句。可选的,所述采用重排序对所述至少两个翻译模型各自输出的文本译文进行融合,获得所述待翻译文本的最优文本译文,包括:针对所述待翻译文本中的每个待翻译句,根据所述至少两个翻译模型的目标权重参数在所述待翻译句对应的文本译句集中选择最优文本译句;所述文本译句集由所述待翻译句在所述至少两个翻译模型输出的文本译文中对应的至少两个文本译句组成;根据所述待翻译文本中所有待翻译句各自对应的最优文本译句,将所述待翻译文本中所有待翻译句各自对应的最优文本译句融合成所述最优文本译文。可选的,所述针对所述待翻译文本中的每个待翻译句,根据所述至少两个翻译模型的目标权重参数在所述待翻译句对应的文本译句集中选择最优文本译句,包括:根据所述至少两个翻译模型的目标权重参数,以及所述至少两个翻译模型各自输出的所述待翻译文本中每个待翻译句的翻译概率,计算所述待翻译句对应的文本译句集中每个文本译句的翻译评价分数;在所述待翻译句对应的文本译句集中选择翻译评价分数最高的文本译句作为所述待翻译句的所述最优文本译句。本申请还提供一种模型参数搜索装置,包括:语料翻译模块,被配置为获取至少两个翻译模型对语料库中的语料进行翻译后输出的各自的译文,以及所述译文中每个译句的翻译概率;权重参数组搜索模块,被配置为基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组;目标权重参数确定模块,被配置为将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数。可选的,所述权重参数组搜索模块,包括:搜索树构建子模块,被配置为基于所述译文和所述译文中每个译句的翻译概率构建搜索树;所述参数空间中的权重参数组与所述搜索树中的搜索节点一一对应;搜索子模块,被配置为按照所述搜索树在所述参数空间中搜索所述至少两个翻译模型对应的权重参数组。可选的,所述模型参数搜索装置,包括:译文翻译模块,被配置为将待翻译文本分别输入所述至少两个翻译模型进行文本翻译,分别输出针对所述待翻译文本的文本译文;译文融合模块,被配置为采用重排序对所述至少两个翻译模型各自输出的文本译文进行融合,获得所述待翻译文本的最优文本译文。本申请还提供一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器执行所述计算机可执行指令时实现所述模型参数搜索方法的步骤。本申请还本文档来自技高网...

【技术保护点】
1.一种模型参数搜索方法,其特征在于,包括:获取至少两个翻译模型对语料库中的语料进行翻译后输出的各自的译文,以及所述译文中每个译句的翻译概率;基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组;将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数。

【技术特征摘要】
1.一种模型参数搜索方法,其特征在于,包括:获取至少两个翻译模型对语料库中的语料进行翻译后输出的各自的译文,以及所述译文中每个译句的翻译概率;基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组;将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数。2.根据权利要求1所述的模型参数搜索方法,其特征在于,所述基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组,包括:基于所述译文和所述译文中每个译句的翻译概率构建搜索树;所述参数空间中的权重参数组与所述搜索树中的搜索节点一一对应;按照所述搜索树在所述参数空间中搜索所述至少两个翻译模型对应的权重参数组。3.根据权利要求2所述的模型参数搜索方法,其特征在于,所述基于所述译文和所述译文中每个译句的翻译概率构建搜索树子步骤执行过程中,针对所述参数空间中的权重参数组对应所述搜索树中的搜索节点,执行如下操作:根据所述搜索节点对应的所述参数空间中的权重参数组,将所述权重参数组作为所述至少两个翻译模型的权重参数,并结合所述译文中每个译句的翻译概率计算所述搜索节点的启发代价;其中,所述搜索节点的启发代价根据所述至少两个翻译模型中每个翻译模型的模型启发代价计算获得,每个翻译模型的模型启发代价为该翻译模型的权重参数与所述译文中每个译句的翻译概率的乘积之和。4.根据权利要求3所述的模型参数搜索方法,其特征在于,所述搜索树中任意一个搜索节点的下层搜索节点,采用如下方式确定:采用高斯算法确定所述搜索树中与所述搜索节点相邻且具有连接关系的相邻搜索节点的搜索节点集合;根据计算获得的所述搜索节点集合中每个相邻搜索节点的启发代价,在所述搜索节点集合中选择启发代价最高的至少一个相邻搜索节点作为所述搜索节点的下层搜索节点。5.根据权利要求4所述的模型参数搜索方法,其特征在于,所述采用高斯算法确定所述搜索树中与所述搜索节点相邻且具有连接关系的相邻搜索节点的搜索节点集合子步骤执行之后,且所述根据计算获得的所述搜索节点集合中每个相邻搜索节点的启发代价,在所述搜索节点集合中选择启发代价最高的至少一个相邻搜索节点作为所述搜索节点的下层搜索节点子步骤执行之前,包括:针对所述搜索节点集合中的搜索节点,根据所述搜索节点对应的所述参数空间中的权重参数组,将所述权重参数组作为所述至少两个翻译模型的权重参数;以所述至少两个翻译模型的所述权重参数为依据,采用重排序对所述至少两个翻译模型各自输出的文本译文进行融合,获得所述待翻译文本的参考文本译文;将所述参考文本译文与所述语料的真实译文进行比对,确定所述参考文本译文相对于所述真实译文的翻译准确率和/或翻译损失;判断所述翻译准确率和/或所述翻译损失是否大于所述搜索节点的上层搜索节点对应的翻译准确率和/或翻译损失;若不大于,将所述搜索节点从其所属的搜索节点集合中剔除。6.根据权利要求1所述的模型参数搜索方法,其特征在于,所述基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组步骤,基于集束搜索算法实现。7.根据权利要求1所述的模型参数搜索方法,其特征在于,所述将搜索到的目标权重参数组包含的权重参数分别作...

【专利技术属性】
技术研发人员:李长亮李小龙唐剑波王勇博
申请(专利权)人:北京金山数字娱乐科技有限公司成都金山互动娱乐科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1