一种快速翻译装置及方法制造方法及图纸

技术编号:16135385 阅读:44 留言:0更新日期:2017-09-05 19:58
一种快速翻译方法,包括预先将待翻译文件分配为待翻译单句的步骤,还包括将待翻译单句与历史记忆库中的单句比较的步骤;首次筛选步骤:判断该待翻译单句是否在待翻译文件中首次出现;恢复步骤,在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。一种快速翻译装置,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置,所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句;所述首次判断模块判断输入分配模块分配得到的每一待翻译单句。本发明专利技术所述快速翻译装置及方法,减少了翻译文字数量并保证了译文翻译质量。

Fast translation apparatus and method

A fast approach to translation, including pre file allocation for the sentence translation steps, including the translation of sentences and historical memory sentence comparison steps; first screening steps: the judgment of the sentence to be translated is first appeared in the file to be translated; recovery steps in translation is completed, will the historical memory and the first screening of all sentences in the library of the translation in accordance with the corresponding relations back to the corresponding position of the file to be translated. A fast translation device, including historical memory, input distribution module, a judging module, for the first time, the first screening contrast module library, identification module and recovery module and display device, the comparison module is connected with the historical memory, get the sentence and input distribution module distribution ratio in the library every sentence to be translated; the the first judging module judges the input assignment module assigns each sentence to be translated by. The quick translation device and method of the invention reduce the quantity of translated text and guarantee the quality of translation.

【技术实现步骤摘要】
一种快速翻译装置及方法
本专利技术属于软件领域,涉及一种语言翻译软件,特别是一种快速翻译装置及方法。
技术介绍
从上世纪80年代中期开始,基于语料和多引擎机译方法的广泛运用,翻译软件的性能和效率有了明显提高,各式各样的翻译软件如雨后春笋般问世。采用预先编写的软件程序翻译,极大提高了文本翻译的速度。由于语言表达的特殊性,翻译软件的翻译质量一直屡遭诟病,翻译软件的原理是将两种语言的语义一一对应的存储,翻译时机械调用替换,由于语言表达的多样性,每个字或单词往往对应不止一个意思,完全使用软件翻译所得到的译文通常不能正确表达原文含义,因此人工翻译仍然是获得高翻译质量的保证。人工翻译的固有缺点仍然是翻译速度过慢,译员翻译时首先需要将词翻译,再组合形成符合目标语言表达习惯的句式,时间较长且不能由翻译软件替代。
技术实现思路
为克服翻译软件翻译质量差,人工翻译翻译速度慢的缺陷,本专利技术公开了一种快速翻译装置及方法。本专利技术所述一种快速翻译装置,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置;待翻译文件输入所述输入分配模块,并以整句为单位分配;所述首次判断模块判断输入分配模块分配得到的每一待翻译单句,判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;显示装置显示做出全部不翻译标识的待翻译文件;所述恢复模块用于在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。优选的,所述输入分配模块还将待翻译文件中的字母缩写识别为单句。具体的,所述标识模块做出的不翻译标识为色彩显示异于正常显示,且为不可编辑状态。本专利技术还公开了一种快速翻译方法,包括预先将待翻译文件分配为待翻译单句的步骤,还包括:I1将待翻译单句与历史记忆库中的单句比较的步骤:比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;做出不翻译标识的单句不再进入I2步骤;I2首次筛选步骤:判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;I3恢复步骤:在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。优选的,设置一匹配数组D,对每一单句,若D中没有存储与之相同的单句,则将该单句存储在D中,否则将该单句作出不翻译标识。具体的,所述预先将待翻译文件分配为待翻译单句的步骤包括待翻译文件中的字母缩写识别为单句。采用本专利技术所述的快速翻译装置及方法,对待翻译文件利用历史文件库进行预先筛选,结合自身对比进行重复过滤,减少了翻译文字数量,以句为单位对比保证译文的翻译质量,经过实际测试,本专利技术可以减少翻译工作量30%以上。附图说明图1为本专利技术所述快速翻译装置的一种具体实施方式结构示意图;图2为本专利技术所述快速翻译方法的一种具体实施方式结构示意图。具体实施方式下面结合附图,对本专利技术的具体实施方式作进一步的详细说明。本专利技术所述快速翻译装置,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置;待翻译文件输入所述输入分配模块,并以整句为单位分配;所述首次判断模块判断输入分配模块分配得到的每一待翻译单句,判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;显示装置显示做出全部不翻译标识的待翻译文件;所述恢复模块用于在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。应用本专利技术时,首先将待翻译文件输入至输入分配模块,输入分配模块按照一定规则将待翻译文件分为单句,通常的处理方式为以标点符号,例如句号、问号、省略号等作为单句分割标识符划分出单句。历史记忆库将待翻译文件划分出的单句与历史记忆库中预先存储的单句进行比对,比对原则是完全一致,即单句中每一单词及全部单词的前后排列顺序完全一致,符合完全一致的单句做出不翻译标识。在识别单句的过程中,本专利技术优选的将拥有公知含义的字母缩写作为单句单独划分出来,而不考虑该字母缩写是否被标点符号分隔,例如WTO(世界贸易组织),USA(美利坚合众国)等,通常字母缩写位于一个句子内,则首先对比缩写,再对比该缩写所在的句子。以最常见的英译汉为例,历史记忆库是根据以往积累或公开英汉对照文献所积累的单句或能表达完整意思的短语为单位存储的数据文件库,包括一一对应的英语原文和汉语译文,众所周知,在英语中每一单词可能存在多个意思表示,但在每一特定的句子中,该单词的意思通常固定不变,单句和约定俗成的短语的意思即使在不同的上下文语境中,意思表述也基本一致。使用对比模块对比历史记忆库中单句文件与待翻译文件中被分割的单句单位,按照完全相同的比对原则进行筛选,筛选出的完全相同的单句在待译文件中做出不翻译标识。做出不翻译标识的单句不再进行后续的首次出现判断。历史记忆库对比完成后,继续对剩余单句进行首次出现判断,即该单句是否在该待翻译文件中首次出现,首次判断模块利用待翻译文件自身进行筛选,将重复出现的句式过滤,同一篇文章之中,由于是同一作者撰写的同一主题的描述,有相当多单句或短语可能多次出现,首次判断模块依次判断每一单句在待翻译文件中是否首次出现,只要不是首次出现,则做出不翻译标识,是首次出现则存储在首次筛选库中。历史记忆库对比应该早于首次判断对比,可以减少判断计算量,例如某句话在文中第一次出现,如果该句话还出现在历史记忆库中,则只需要进行历史记忆对比即可做出不翻译标识。如果首先进行首次判断对比,则还需要进行历史记忆判断才可得到结果,对于一篇文章来说,一般情况下,重复出现的单句数量总是少于只出现一次的单句数量,并且由于历史记忆库的单句积累量巨大,出现在历史记忆库中的单句往往数量上大于重复出现的单句,因此应该将首次判断置后。在系统内部被作出不翻译标识的单句,在显示模块的显示状态应该异于其他单句,例如色彩显示异于正常显示,为防止翻译人员自行翻译或误动作,将不翻译的单句可以设定为不可编辑状态。翻译人员只需要操作和翻译显示模块显示出的待翻译文件中需要翻译的单句,以及首次判断模块中存储的在待翻译文件中多次出现的单句。翻译完成后,得到的是包含若干空缺的译文,空缺处是作出不翻译标识的单句对应位置,系统根据历史记忆库中存储的译文和首次判断模块中的单句译文,按照对应关系将这些作出不翻译标识的单句的译文回填到译文的空缺处,得到完整译文。如图2给出采用循环嵌套算法批量实时处理待翻译文件的一种具体实施方式,系统一次读入N篇待翻译文件,对每一篇待翻译文件采取本专利技术所述的翻译方法,即首先将全文断句,得到C个单句,对每一单句,依次进行判断识别,判断识别采用循环累加方式,即对第J句,首先判断是否出现在历本文档来自技高网...
一种快速翻译装置及方法

【技术保护点】
一种快速翻译装置,其特征在于,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置;待翻译文件输入所述输入分配模块,并以整句为单位分配;所述首次判断模块判断输入分配模块分配得到的每一待翻译单句,判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;显示装置显示做出全部不翻译标识的待翻译文件;所述恢复模块用于在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。

【技术特征摘要】
1.一种快速翻译装置,其特征在于,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置;待翻译文件输入所述输入分配模块,并以整句为单位分配;所述首次判断模块判断输入分配模块分配得到的每一待翻译单句,判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;显示装置显示做出全部不翻译标识的待翻译文件;所述恢复模块用于在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。2.如权利要求1所述的一种快速翻译装置,其特征在于,所述输入分配模块还将待翻译文件中的字母缩写识别为单句。3.如权利要求1所述的一种快速翻译装置,其特征在于,所述标识模块做出的不翻译标识为色彩显示异于正常显示...

【专利技术属性】
技术研发人员:张马成王兴强杨明
申请(专利权)人:成都优译信息技术股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1