当前位置: 首页 > 专利查询>唐亮专利>正文

多语言智能预处理实时统计机器翻译系统的后处理模块技术方案

技术编号:15938672 阅读:92 留言:0更新日期:2017-08-04 21:39
本发明专利技术公开了一种多语言智能预处理实时统计机器翻译系统的后处理模块,所述后处理模块包括单词标点规范化模块、大小写转换模块和格式转换模块;所述单词标点规范化模块用于将翻译结果中的单词和标点规范化为目标语言的表现形式,所述大小写转换模块用于对翻译结果中的大小写进行转换。本发明专利技术机器翻译的后处理模块能够对机器翻译的翻译结果进行单词标点规范化、大小写转换及格式转换等基本操作,使最终的输出结果格式与输入的格式一致,并且输出结果符合翻译目标语言的常用表现形式。

Post processing module of multi language intelligent preprocessing real time statistical Machine Translation system

The invention discloses a processing module of multi language intelligent preprocessing the real-time statistics of the Machine Translation system, the postprocessing module includes word punctuation standardization module, case conversion module and format conversion module; the word punctuation standardization module is used to translate the results in the form of words and punctuation standardization as target language the size of the write conversion module is used for the translation results in the case of conversion. The invention of the Machine Translation postprocessing module can Machine Translation translation results for the word punctuation standardization, case conversion and format conversion and other basic operations, so that the final output format consistent with the input, and the output results are consistent with the common forms of the target language translation.

【技术实现步骤摘要】
多语言智能预处理实时统计机器翻译系统的后处理模块
人工智能机器翻译
,具体来说,涉及一种多语言智能预处理实时统计机器翻译系统的后处理模块。
技术介绍
机器翻译是利用计算机对人类自然语言进行自动翻译的技术,是利用计算机把一种自然语言转换成另一种自然语言的过程,而且两种自然语言在意义上应该是等价的。目前,一种比较成熟而且主流的机器翻译方法是基于统计的方法,该方法的优点在于几乎不需要人工撰写翻译规则,所有的翻译信息都是自动地从语料中学习而获得,因此该方法最大程度地发挥了计算机高速运算的特点,极大地降低了人工成本。基于统计模型的机器翻译技术从平行语料库中学习从一种语言A到另一种语言B的短语翻译。在翻译新的句子时,把输入语言A的句子分解成若干短语,根据学习来的短语(A语言)-短语(B语言)的共现概率,把语言A的句子翻译成语言B的句子。整个学习、翻译过程完全根据统计模型。目前基于统计模型的机器翻译技术的后处理模块功能弱小,大多数都是将机器翻译的结果直接作为最终的结果输出,因此,会造成输出结果不准确、西文作为翻译目标语言时输出格式有问题等。
技术实现思路
针对相关技术中的上述技术问题,本专利技术本文档来自技高网...
多语言智能预处理实时统计机器翻译系统的后处理模块

【技术保护点】
一种多语言智能预处理实时统计机器翻译系统的后处理模块,其特征在于,所述后处理模块包括单词标点规范化模块、大小写转换模块和格式转换模块;所述单词标点规范化模块用于将翻译结果中的单词和标点规范化为目标语言的表现形式,所述大小写转换模块用于对翻译结果中的大小写进行转换。

【技术特征摘要】
1.一种多语言智能预处理实时统计机器翻译系统的后处理模块,其特征在于,所述后处理模块包括单词标点规范化模块、大小写转换模块和格式转换模块;所述单词标点规范化模块用于将翻译结果中的单词和标点规范化为目标语言的表现形式,所述大小写转换模块用于对翻译结果中的大小写进行转换。2.根据权利要求1所述的一种多语言智能预处理实时统计机器翻译系统的后处理模块,其特征在于,待翻译语言为英语,翻译目标语言为中文时,单词标点规范化模块将翻译结果里中文单词间的空格去掉。3.根据权利要求1所述的一种多语言智能预处理...

【专利技术属性】
技术研发人员:张昱琪唐亮
申请(专利权)人:唐亮
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1