【技术实现步骤摘要】
一种全原文参考的在线翻译系统
本专利技术涉及文档解析技术和机器辅助翻译(CAT)
,尤其涉及到一种在线翻译方法。
技术介绍
目前市面上所有相关“在线辅助翻译平台”所使用的技术方案均是将文档中的纯文本格式的内容提取出来,进行断句并切分,最终将所有句子列举整合到翻译表格中。翻译表格的第1列为原文句子列表,第2列为译文编辑框。除了纯文本格式的文字之外,其它格式的对象,如文本框、公式、图片等对象都不会出现在翻译界面中。这样做的弊端显而易见,翻译人员在平台上进行翻译的过程中,丧失了对全文上下文内容的整体观感。特别是一些工程类稿件或者是产品介绍类的稿件中,必须要对着原文附图才能理解文章句子的真实意思。另外,由于目前自然语言学处理能力还并非完全成熟,采用软件程序进行“断句”操作的时候难免会产生错误,而错误的断句导致句子意思连贯性的损失,对译员的翻译也会带来很严重的影响。因此,现有技术采用的仅仅将纯文本提取出源文档并最终形成一种表格模式的翻译形式,影响翻译效率以及翻译质量。
技术实现思路
本专利技术所要解决的技术问题是提供一种全原文参考的在线翻译系统,以克服传统在线翻译平台的弊 ...
【技术保护点】
一种全原文参考的在线翻译系统,其特征在于,包括:第一子系统,用于调用现有的商业化组件,将原始的待翻译文档转换成为HTML文件;第二子系统,用于整理所述HTML文件;所述整理HTML文件包括:对HTML文件中的文本进行断句,重新生成一个个句子,同时顺序标注包括句子在内的各元素的位置。一个重新生成的句子包括原文段和译文段,分别存放原文文本和译文文本,原文段、译文段分别设有原文标识和译文标识;第三子系统,用于创建基于web浏览器的翻译界面,所述翻译界面包括原文译文展示窗口和译员交互窗口;读取所述HTML文件,将HTML文件中的元素全部显示在所述原文译文展示窗口内,原文译文展示窗口 ...
【技术特征摘要】
1.一种全原文参考的在线翻译系统,其特征在于,包括:第一子系统,用于调用现有的商业化组件,将原始的待翻译文档转换成为HTML文件;第二子系统,用于整理所述HTML文件;所述整理HTML文件包括:对HTML文件中的文本进行断句,重新生成一个个句子,同时顺序标注包括句子在内的各元素的位置。一个重新生成的句子包括原文段和译文段,分别存放原文文本和译文文本,原文段、译文段分别设有原文标识和译文标识;第三子系统,用于创建基于web浏览器的翻译界面,所述翻译界面包括原文译文展示窗口和译员交互窗口;读取所述HTML文件,将HTML文件中的元素全部显示在所述原文译文展示窗口内,原文译文展示窗口实际上保留显示了原文的全部元素而不仅仅是原文的文本;以句子为单位,接收译员的对该句子的翻译文本输入及编辑,并将翻译文本写入所述该句子的译文标识指向的译文段,然后,刷新显示原文译文展示窗口,此时,原文译文展示窗口中被翻译过的句子的原文后有译文显示;第四子系统,用于调用现有的商业化组件,将HTML文件中的翻译文本转换成为与原始的待翻译文档相同格式的文档。2.根据权利要求...
【专利技术属性】
技术研发人员:罗伟峰,闫昊,车双武,
申请(专利权)人:语联网武汉信息技术有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。