基于双语片段的交互式机器翻译方法技术

技术编号:17655010 阅读:50 留言:0更新日期:2018-04-08 08:22
本发明专利技术涉及一种基于双语片段的交互式机器翻译方法,步骤为:建立数学模型:对于每个源语言片段,对译员提供多个翻译选项,其中最优译文通过数学模型获得;设计译员界面:包括交互区和编辑区,交互区给出短语切分后的源语句和翻译选项,编辑区在译员完成确认并点击“翻译”按钮时,给出机器译文;解码:在译员完成交互区中双语片段的确认之后,捕获译员对每个片段fi的翻译选项的选择和源语句的当前切分结果,通过多栈解码算法实现基于短语的统计机器翻译解码器。本发明专利技术改进了交互协议,允许译员确认双语片段,给译员提供更多的线索,并给予解码器更直接的指导,减少人机交互过程中的人类劳动,促进交互式机器翻译效率和翻译质量的提升。

【技术实现步骤摘要】
基于双语片段的交互式机器翻译方法
本专利技术涉及一种自然语言翻译技术,具体为一种基于双语片段的交互式机器翻译方法。
技术介绍
统计机器翻译和神经机器翻译技术使机器翻译系统的性能得到了很大改善。但是,在很多有较高质量要求的任务中,机器翻译的输出质量仍然不够,而必须由人类译员在后编辑过程中进行修改才可以使用。为了增强人机协作,Foster提出了交互式机器翻译技术。在交互式机器翻译系统中,反复进行一种修改-预测过程。首先,交互式机器翻译系统提供一个初始译文。然后,译员确认其中的最长正确前缀,并修改下一个单词。接下来,系统预测一个被期待比先前更好的新后缀。这个过程不断重复,直到获得正确译文。最近,这种自左向右的协议(即上段所述的交互过程)被扩展,以使人机交互更为灵活。在扩展的协议中,译员可以确认应被保留在译文中的片段。但是,该协议仍然存在三个问题:第一,被确认片段的位置是未知的,所以搜索过程只能以一种软约束的形式被优化;第二,译员的确认被限制在系统提供的译文上,而无法获得关于其它翻译选项的线索;第三,从错误译文中识别正确片段往往需要很多的认知劳动,特别是译文质量较低的时候
技术实现思路
针对现本文档来自技高网
...
基于双语片段的交互式机器翻译方法

【技术保护点】
一种基于双语片段的交互式机器翻译方法,其特征在于包括以下步骤:1)建立数学模型:对于每个源语言片段,对译员提供多个翻译选项,其中最优译文通过数学模型获得;2)设计译员界面:包括交互区和编辑区,交互区给出短语切分后的源语句和翻译选项,编辑区在译员完成确认并点击“翻译”按钮时,给出机器译文;3)解码:在译员完成交互区中双语片段的确认之后,捕获译员对每个片段fi的翻译选项的选择和源语句的当前切分结果,通过多栈解码算法实现基于短语的统计机器翻译解码器。

【技术特征摘要】
1.一种基于双语片段的交互式机器翻译方法,其特征在于包括以下步骤:1)建立数学模型:对于每个源语言片段,对译员提供多个翻译选项,其中最优译文通过数学模型获得;2)设计译员界面:包括交互区和编辑区,交互区给出短语切分后的源语句和翻译选项,编辑区在译员完成确认并点击“翻译”按钮时,给出机器译文;3)解码:在译员完成交互区中双语片段的确认之后,捕获译员对每个片段fi的翻译选项的选择和源语句的当前切分结果,通过多栈解码算法实现基于短语的统计机器翻译解码器。2.按权利要求1所述的基于双语片段的交互式机器翻译方法,其特征在于:所述数学模型通过以下公式实现:为(1)其中ei是译员确认的fi的正确译文,fi为第i个源语言片段,t为候选译文,N为双语片段数量,i为双语片段序号,P为候选译文的翻译概率,S为源语句。3.按权利要求1所述的基于双语片段的交互式机器翻译方法,其特征在于:译员界面还具有三个辅助功能,即片段拆分-合并、翻译选项重排序以及后缀预测,其中片段拆分-合并是在每个片段上方,设置两种双向箭头,一种双向向外指示的箭头为拆分箭头,将片段拆分为两个较短的片段;另一种双向向内指示的箭头是合并箭头,将当前片段和当前片段的下一个片段合并为一个较长的片段。4.按权利要求3所述的基于双语片段的交互式机器翻译方法,其特征在于:如果短语表中不存在更短或更长的片段,那么两种双向箭头不出现;否则如果短语表中存在更短或更长的片段,当鼠标置于片段上方时,箭头出现。5.按权利要求3所述的基于双语片段的交互式机器翻译方法,其特征在于所述翻译选项重排序为:译员在开始翻译之前选择默认模式或重新排序模式;当产生新片段时,其翻译选项也随之改变,默认情况下,片段的选项按短语表中的顺序排列和显示;选择重新排序模式时,短语表中排名最高的N个翻译选项被重新排序,以产生一个新的选项列表。6.按权利要求5所述的基于双语片段的交互式机器翻译方法,其特征在于重新排序为:对于每个源语言短语p,设置一个新的选项列...

【专利技术属性】
技术研发人员:叶娜
申请(专利权)人:沈阳航空航天大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1