一种在自动化翻译处理中自动保护标记语言中标记方法技术

技术编号:10040247 阅读:165 留言:0更新日期:2014-05-14 10:51
本发明专利技术为一种在自动化翻译处理中自动保护标记语言中的标记的方法,包括:通过前处理模块,将原文中标记位置信息提取出,并保存到缓存模块中。通过自动化翻译引擎,将原文与译文各字符段之间的对齐信息提取出,并保存到缓存模块中。在提取原文与译文各字符段之间的对齐信息的同时,自动化翻译引擎将原文自动翻译为译文。后处理模块根据保存在缓存模块中的原文与译文各字符段之间的对齐信息,将缓存的标记重新插入译文。用户使用时,减少翻译在译后编辑中的工作量,翻译聚焦于语言,减少对标记语言关注度,提升效率,加快产品上市时间。自动将标记精准插入到译文,避免人为插入标记或调整时引入的错误,提升翻译质量,减少后续质量保证成本。

【技术实现步骤摘要】

本专利技术涉及一种在自动化翻译处理中自动保护标记语言中的标记的方法,用于CAT软件或者多语言翻译系统中的开发和应用,属多语言机器翻译
 
技术介绍
标记语言最具代表性的文档是 HTML和XML。 HTML是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全相同的解释超文本标记语言(15张),因而可能会有不同的显示效果。 HTML之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接”点。所谓超级链接,就是一种URL指针,通过激活(点击)它,可使浏览器方便地获取新的网页。这也是HTML获得广泛应用的最重要的原因之一。 网页的本质就是HTML,通过结本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201210424599.html" title="一种在自动化翻译处理中自动保护标记语言中标记方法原文来自X技术">在自动化翻译处理中自动保护标记语言中标记方法</a>

【技术保护点】
在自动化翻译处理中自动保护标记语言中的标记的方法,其特征在于: 1)提取标记位置信息的方法;2)在自动化翻译过程中,根据原文和译文各字符段之间的对齐信息,重新插入标记的方法。

【技术特征摘要】
1.在自动化翻译处理中自动保护标记语言中的标记的方法,其特征在于: 
1)提取标记位置信息的方法;2)在自动化翻译过程中,根据原文和译文各字符段之间的对齐信息,重新插入标记的方法。
2.根据权利要求1所述的自动化翻译处理中自动保护标记语言中的标记的方法,其特征在于: 1)前处理模块:提供将原文中标记位置信息的提取出并保存到缓存模...

【专利技术属性】
技术研发人员:杜金林朱懿杜勇
申请(专利权)人:上海勇金懿信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1