基于层次短语模型的译文词序概率确定方法及装置制造方法及图纸

技术编号：8735104 阅读：174 留言：0更新日期：2013-05-26 11:43

本发明专利技术实施例公开了一种基于层次短语模型的译文词序概率确定方法及装置。该方法包括：确定源语句的候选翻译模式；针对每一候选翻译模式提取用于表征词序概率的特征量；根据预先获得的模型训练结果确定所述特征量的词序概率；根据所述特征量的词序概率，确定所述每一候选翻译模式的词序概率；根据所述候选翻译模式中词序概率的最大值，确定所述源语句的译文词序概率。本发明专利技术实施例通过在候选翻译模式中提取表征词序概率的特征量，进而确定源语句的译文词序概率，增加对调序过程的控制，提高了翻译模式选择的正确性，减少了调序错误的出现，由此改善了将源语句转换为目标语言数据处理过程的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般地涉及数据处理的
，尤其是一种基于层次短语模型的译文词序概率确定方法及装置。
技术介绍
层次短语模型(Hierarchical Phrase-based Model)是在将源语言转换为目标语言的数据处理过程中比较成熟的模型，该模型具有良好的短语调序能力，性能要好于传统的基于短语的模型(Phrase-based Model)。层次短语模型使用的翻译模式主要包括两种:包含非终结符X的模式和不包含X的模式。层次短语模型通过非终结符来扩展译文，通过源语言与目标语言之间的词对应关系来调序。如图1所示，演示了一实例中层次短语模型的转换过程，例如，翻译过程，通过层次短语模型的一翻译模式，交换X1、X2的位置起到了调序的作用，从而得到了正确的源语言与目标语言之间的转换结果，在该例中即为翻译结果。虽然层次短语模型有着很强的调序能力，但是现有的翻译过程中，由于该模型缺少对调序过程的控制，无法获得源语句的译文词序概率，容易导致翻译模式选择错误，进而造成一些调序错误频繁地出现。如图2所示，源语言本该使用模式〈XI氨水溶液X2，Xl ammonia solution X2>按顺序翻译，由于选择了错误的翻译模式〈XI氨水溶液X2, X2Xlammonia solution〉,将X2调序到最前面,导致翻译结果错误。
技术实现思路
有鉴于此，本专利技术实施例提供了一种基于层次短语模型的译文词序概率确定方法及装置，能够获得源语句的译文词序概率，进而可以增加翻译模式选择的正确性，提高从源语言到目标语言的转换过程的正确率，由此改善数据处理性能。根据本专利技术实施例的一个...

【技术保护点】
一种基于层次短语模型的译文词序概率确定方法，包括：确定源语句的候选翻译模式；针对每一候选翻译模式提取用于表征词序概率的特征量；根据预先获得的模型训练结果确定所述特征量的词序概率；根据所述特征量的词序概率，确定所述每一候选翻译模式的词序概率；根据所述候选翻译模式中词序概率的最大值，确定所述源语句的译文词序概率。

【技术特征摘要】

【专利技术属性】
技术研发人员：郑仲光，孟遥，于浩，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人