一种实现协同翻译的方法技术

技术编号:3947807 阅读:241 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种实现协同翻译的方法,将稿件转化为超文本标记语言HTML文件;解析所述HTML文件,创建翻译数据库文件TransIDB,所述HTML文件放置在所述TransIDB中,将所述TransIDB上传到服务器;本地终端下载所述TransIDB,建立本地翻译数据库;在所述TransIDB下,对所述HTML文件进行处理,并将改动的内容同步到服务器。本发明专利技术在脱离微软的Sharepoint程序的情况下,实现了office文档之间的同步操作,从而实现翻译和审校的同步工作。

【技术实现步骤摘要】

本专利技术涉及一种数据协同处理方法,具体说,涉及。
技术介绍
协同办公是指利用网络、计算机、信息化等手段,实现多人沟通、共享、协同一起办 公。随着企业对协同办公要求的提高,许多文件要求实时更新,如今基于OFFICE文档即时 同步的,仅见于微软的Sharepoint程序,由于其不提供开放源码,加之其服务器架构昂贵, 使得很多需要远程即时同步OFFICE文档的需求无法满足。
技术实现思路
本专利技术所解决的技术问题是提供,实现了不同终端下 office文档之间的同步操作。技术方案如下,包括将稿件转化为超文本标记语言HTML文件;解析所述HTML文件,创建翻译数据库文件TransIDB,所述HTML文件放置在所述 TransIDB中,将所述TransIDB上传到服务器;本地终端下载所述TransIDB,建立本地翻译数据库;在所述TransIDB下,对所述HTML文件进行处理,并将改动的内容同步到服务器。进一步,本地终端下载所述TransIDB,建立本地翻译数据库具体包括创建 TransIDB并上传到所述服务器,下载稿件的同时从所述服务器下载对应的TransIDB到所 述本地终端,建立本地翻译数据库,每个稿件生成一个单独的TransIDB。进一步所述TransIDB和所述HTML文件相对应。进一步,解析所述HTML文件的步骤包括拆解文件中的翻译单元,定义翻译单元, 确定翻译单元的标志。进一步所述翻译数据库包括源文件数据表和翻译数据表。进一步对所述HTML文件中的文本内容进行同步并更新后,将定稿后的HTML文件 还原为office文档。进一步,还原过程包括读取源文件数据表,在临时目录中还原生成HTML文件和图片文件;读取翻译数据表,将所述HTML文件置于临时目录中;启动office程序,打开主文件,将定稿后的HTML文件变为office格式文件。进一步对所述HTML文件中的文本内容进行断句或者分段处理。本专利技术技术方案带来的技术效果包括1、在脱离微软的Shar印oint程序的情况下,本专利技术实现了 office文档之间的同 步操作,从而实现翻译和审校的同步工作。32、多个译员可以协同办公,共同处理同一篇稿件。 附图说明图1是本专利技术中的主流程图;图2是本专利技术中ppt文件生成的html文件目录结构示意图。 具体实施例方式本专利技术利用翻译数据库文件(TransIDB),实现不同客户端中office文档的同步。 每个客户端都需要将翻译数据库文件TransIDB下载到本地,以便于进行office文档的同 步。不同地的客户端对同一 office原稿要使用完全相同的TransIDB,以中间文件数据库的 记录为同步单位,同步已翻译的记录。当然,基于其他类文字处理或者办公软件,利用本专利技术也可以实现的内容同步。下面参考附图,对本专利技术技术方案做详细描述。步骤101 需要将office文档转化为超文本标记语言(HTML,Hyper Text Mark-up Language) t^f牛。生成的HTML文件包括图片文件、样式文件等。如图2所示,是本专利技术中ppt文件生成的html文件目录结构示意图。以如下的一 个两页的ppt文件《演示稿件.PPt))为例,使用PowerPoint打开《演示稿件.ppt)),另存为 HTML文件后生成的HTML文件目录。其中,幻灯片文件是需要翻译的文件,图片文件、脚本文 件、主文件为不需要翻译的文件,其他文件中包括模板、备注等信息,可根据需要翻译。 步骤102 解析HTML文件。《演示稿件.ppt))为例,需要解析的是幻灯片文件,解析方式如下1、定义翻译单元。在幻灯片中,每个图形或表格作为一个翻译单元。2、确定翻译单元的标志。一个图形或者表格中的文本内容一般在标签<div V:Shape>XX</diV>中,因此 ppt稿件的每个翻译单元就是一组<div v:shape>xx</div>标记。如(1)普通图形翻译单元<div ν: shape = “ _x0000_s 16387“ class = CB><div><span> 第一段 &#13 ;</span></div><div><span>&#13 ;</span></div><div><span> 第二段 </span></div></div>(2)表格中翻译单元<div ν: shape = " _x0000_sl9461 “ ><div class = Tbll style =' mso-margin-left-alt:288' ></div><div class = Tbl2 style=' mso-margin-left-alt:576' ></div><div class = Tbl3 style =' mso-margin-left-alt: 864' ></div>4= Tbl4 style =' mso-margin-left-alt: 1152' ></div><div class = Tblstyle=' mso-margin-left_alt:0 ;position: absolute ;top: 30. 25% ;left:12. 35% ;width:38. 38% ;height:4. 0%' XspanIang = ZH-CN style = ' font-family:宋体;mso-fareast-font-famiIy宋体;mso-ansi-language:EN-US' > 第一格</span></div></div>3、拆解文件中的翻译单元。根据上述逻辑,将一个幻灯片HTML文件中所有翻译单元分析出来,并保存为数据 库记录或链表记录。用户也可根据在软件中的控制需要,在每组翻译单元前后加一些自定 义控制标签。步骤103 进行断句或者分段处理,具体来说,是对HTML文件中的文本内容进行断 句或者分段处理。断句不是必须的,断句的主要目的是由于在计算机辅助翻译领域中,最小的翻译 单位是“句”,且提供给用户的翻译帮助主要为语料,即原文-译文句对。但单纯的协同工作 或翻译则不限于必须以句为单位。步骤104 生成翻译数据库TransIDB并分发给译员。将TransIDB文件上传到服务器并分发给译员。上传到服务器再分发并不是唯一 形式,也可通过其他方式如电子邮件直接分发给译员。翻译数据库的内容包括(I)Office稿件转化为HTML后生成的所有文件;(2)对幻灯片HTML文件解析后的翻译单元列表。考虑到用户之间office版本的不统一性,如果由各翻译用户自行创建TransIDB, 可能造成数据的不一致,导致无法交互。因此,建议由专人统一创建TransIDB,并上传到服 务器,使用者从服务器下载对应的TransIDB建立本地翻译数据库。用户软件通过使用T本文档来自技高网...

【技术保护点】
一种实现协同翻译的方法,包括:将稿件转化为超文本标记语言HTML文件;解析所述HTML文件,创建翻译数据库文件TransIDB,所述HTML文件放置在所述TransIDB中,将所述TransIDB上传到服务器;本地终端下载所述TransIDB,建立本地翻译数据库;在所述TransIDB下,对所述HTML文件进行处理,并将改动的内容同步到服务器。

【技术特征摘要】

【专利技术属性】
技术研发人员:江潮
申请(专利权)人:传神联合北京信息技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1