一种用于统计机器翻译的参数调整方法技术

技术编号:8682711 阅读:232 留言:0更新日期:2013-05-09 02:42
一种用于统计机器翻译的参数调整方法,涉及一种参数调整方法。是要解决现有方法在参数调整过程中容易造成参数的过拟合现象及陷入局部最优解的问题。方法:步骤一:利用单语语料库构建翻译所需的语言模型;步骤二:利用双语平行语料库构建翻译模型;步骤三:利用目标函数对参数进行调整。本发明专利技术的方法易于实现,能够防止在参数调整过程中出现过拟合现象,并能结合较多的特征数目。另外,由于目标函数是凸的,因此在训练过程中亦能够得到全局的最优解。本发明专利技术方法用于翻译系统的参数调整。

【技术实现步骤摘要】

本专利技术涉及一种参数调整方法。
技术介绍
随着互联网的快速发展以及经济全球化的深入,不同国别之间的人与人交往越来越频繁,语言问题越发成为限制人们自由交流的障碍。为实现用本国语言与世界无障碍的沟通,人们对翻译服务的需求越来越广泛。由人类操作员实现对文本或者口语的人工翻译可能不仅费时且费钱。机器翻译的目标就是实现一种语言到另一种语言的自动翻译。目前存在多种机器翻译的方法,包括基于实例的机器翻译和基于统计的机器翻译。其中,基于统计的机器翻译方法是目前的主流方法。对于给定的源语言句子,统计机器翻译试图找到最优可能的目标语言翻译句子。以f表示源语言,e表示目标语言,统计机器翻译试图找到如下的e:

【技术保护点】
一种用于统计机器翻译的参数调整方法,其特征在于该方法按以下步骤进行:步骤一:利用单语语料库构建翻译所需的语言模型;步骤二:利用双语平行语料库构建短语翻译模型;步骤三:利用目标函数minλΣs=1n[-Σm=1Mλmhm(es,fs)+logΣe∈Csexp{Σm=1Mλmhm(fs,e′)+l(e′,es)}]对参数λm进行参数调整;其中es表示参考译文,e′表示机器译文,fs表示待翻译的源语言句子,hm(es,fs)和hm(fs,e′)表示翻译系统构建过程中所使用的特征,特征包含语言模型、短语翻译列表、调序模型和词惩罚四大类,m=1,...,M,M表示特征总的个数,l(e′,es)为消耗函数,Cs表示候选机器译文的集合,e′∈Cs。

【技术特征摘要】
1.一种用于统计机器翻译的参数调整方法,其特征在于该方法按以下步骤进行: 步骤一:利用单语语料库构建翻译所需的语言模型; 步骤二:利用双语平行语料库构建短语翻译模型; 步骤三:利用目标函数2.根据权利要求1所述的一种用于统计机器翻译的参数调整方法,其特征在于步骤三的目标函数中3.根据权利要求1所述的一种用于统计机器翻译的参数调整方法,其特征在于步骤三的目...

【专利技术属性】
技术研发人员:曹海龙张文文刘乐茂赵铁军杨沐昀郑德权朱聪慧徐冰
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1