计算机辅助翻译的方法和装置制造方法及图纸

技术编号:2824962 阅读:145 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了计算机辅助翻译的方法和计算机辅助翻译的装置。根据本发明专利技术的计算机辅助翻译的方法包括:为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;当与上述相似的第一语种的例句相比上述待翻译的第一语种的句子具有至少一个相同部分和至少一个区别部分时,为上述至少一个区别部分的每一个分别准备相应的译文;将与上述相似的第一语种的例句对应的第二语种的例句以及上述至少一个区别部分的每一个的译文组合,生成参考译文;以及利用上述相似的第一语种的例句以及与其对应的第二语种的例句的对齐信息,提示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中对应的部分的对应关系。

【技术实现步骤摘要】

本专利技术涉及信息处理技术,具体地,涉及基于双语对齐技术的计算机辅助翻译(Computer Aided Translation,CAT)技术。
技术介绍
计算机辅助翻译系统是一种利用计算机来帮助人工翻译的系统。辅助翻译系统使用翻译记忆(Translation Memory)技术来存储已经翻译过的句子及其译文作为翻译实例(Translation Example)。在用户进行翻译的过程中,系统会自动查找与输入句子相似的例句及其译文,并将查到的例句的译文提供给用户作为参考译文,从而对人工翻译提供帮助。但是,用户必须根据输入句子和例句之间的差异手工编辑参考译文来确定最终正确的译文。目前,机器辅助翻译系统在显示参考例句时,输入句子和参考例句的源语言句子中的相同部分(或区别部分)会被突出显示。但是这些突出显示的部分在例句的译文中对应的译文部分没有被标识或识别出来。所以,在译文中包含了不需要的译文片段。因此,在编辑参考译文的过程中,翻译者必须反复对照输入句子和例句源语言句子中的相同或区别部分,来确定所需的译文片段。这个过程中翻译者需要浏览整个参考例句,降低了翻译效率。
技术实现思路
为了解决上述现有技术中存在的问题,本专利技术提供了计算机辅助翻译的方法和计算机辅助翻译的装置。-->根据本专利技术的一个方面,提供了一种计算机辅助翻译的方法,包括:为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;当与上述相似的第一语种的例句相比上述待翻译的第一语种的句子具有至少一个相同部分和至少一个区别部分时,为上述至少一个区别部分的每一个分别准备相应的译文;将与上述相似的第一语种的例句对应的第二语种的例句以及上述至少一个区别部分的每一个的译文组合,生成参考译文;以及利用上述相似的第一语种的例句以及与其对应的第二语种的例句的对齐信息,提示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中对应的部分的对应关系。根据本专利技术的另一个方面,提供了一种计算机辅助翻译的方法,包括:为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;判断上述相似的第一语种的例句与上述待翻译的第一语种的句子的相似性是否小于一个预定阈值;当上述相似的第一语种的例句与上述待翻译的第一语种的句子的相似性小于上述预定阈值时,利用上述进行了对齐的双语例句库中的多个例句对的组合获得参考译文,其中上述多个例句对的每一个的第一语种的例句包含上述待翻译的第一语种的句子的至少一个片段;以及利用上述多个例句对的对齐信息,提示上述待翻译的第一语种的句子中的每个片段与上述参考译文中的相应的片段的对应关系。根据本专利技术的另一个方面,提供了一种计算机辅助翻译的装置,包括:查找单元(searching unit),用于为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;翻译单元(translating unit),用于当与上述相似的第一语种的例句相比上述待翻译的第一语种的句子具有至少一个相同部分和-->至少一个区别部分时,为上述至少一个区别部分的每一个分别准备相应的译文;组合单元(combining unit),用于将与上述相似的第一语种的例句对应的第二语种的例句以及上述至少一个区别部分的每一个的译文组合,生成参考译文;以及提示单元(indicating unit),用于利用上述相似的第一语种的例句以及与其对应的第二语种的例句的对齐信息,提示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中对应的部分的对应关系。根据本专利技术的另一个方面,提供了一种计算机辅助翻译的装置,包括:查找单元(searching unit),用于为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;判断单元(determining unit),用于判断上述相似的第一语种的例句与上述待翻译的第一语种的句子的相似性是否小于一个预定阈值;组合单元(combining unit),用于当上述相似的第一语种的例句与上述待翻译的第一语种的句子的相似性小于上述预定阈值时,利用上述进行了对齐的双语例句库中的多个例句对的组合获得参考译文,其中上述多个例句对的每一个的第一语种的例句包含上述待翻译的第一语种的句子的至少一个片段;以及提示单元(indicating unit),用于利用上述多个例句对的对齐信息,提示上述待翻译的第一语种的句子中的每个片段与上述参考译文中的相应的片段的对应关系。附图说明相信通过以下结合附图对本专利技术具体实施方式的说明,能够使人们更好地了解本专利技术上述的特点、优点和目的。图1是根据本专利技术的一个实施例的计算机辅助翻译的方法的流程图;图2是根据图1的实施例的显示参考译文的示意图;图3是根据本专利技术的另一个实施例的计算机辅助翻译的方法的流程图;-->图4是根据图3的实施例的查找最佳例句对组合的方法的流程图;图5是根据图3的实施例的显示参考译文的示意图;图6是根据图3的实施例的进行显示和编辑的流程图;图7是根据图3的实施例的突出显示编辑部分的示意图;图8是根据图3的实施例的例句对的对齐信息的示意图;图9是根据本专利技术的另一个实施例的计算机辅助翻译的装置的方框图;以及图10是根据本专利技术的另一个实施例的计算机辅助翻译的装置的方框图。具体实施方式下面就结合附图对本专利技术的各个实施例进行详细的说明。图1是根据本专利技术的一个实施例的计算机辅助翻译的方法的流程图。如图1所示,首先,在步骤101,输入待翻译的第一语种的句子。例如:Mary played a small role in the drama.接着,在步骤102,为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,进行了对齐的双语例句库是由专业人员(例如,翻译人员)手工或计算机自动进行了词对齐的双语例句库,其包括多对互为译文的相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息。例如查找到的相似例句对及其对齐信息如下。接着,在步骤103,将待翻译的第一语种的句子和相似的第一语种的例句进行比较,如果待翻译的第一语种的句子和相似的第一语种的例句不完全相同,找出它们之间的区别部分,并可以利用相似的第一语种的例句和与其对应的第二语种的例句之间的词对齐信息,确定所述区别部分在对应的第二语种的例句中位置。-->对于上述实例,待翻译句子和相似例句之间的区别在于Mary和John,以及small和critical。这两个区别部分在与相似例句对应的中文例句中的位置分别为第一位置和第五位置。接着,在步骤104,为待翻译的第一语种的句子和相似的第一语种的例句之间的区别部分本文档来自技高网...

【技术保护点】
一种计算机辅助翻译的方法,包括以下步骤:    为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;    当与上述相似的第一语种的例句相比上述待翻译的第一语种的句子具有至少一个相同部分和至少一个区别部分时,为上述至少一个区别部分的每一个分别准备相应的译文;    将与上述相似的第一语种的例句对应的第二语种的例句以及上述至少一个区别部分的每一个的译文组合,生成参考译文;以及    利用上述相似的第一语种的例句以及与其对应的第二语种的例句的对齐信息,提示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中对应的部分的对应关系。

【技术特征摘要】
1. 一种计算机辅助翻译的方法,包括以下步骤:为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;当与上述相似的第一语种的例句相比上述待翻译的第一语种的句子具有至少一个相同部分和至少一个区别部分时,为上述至少一个区别部分的每一个分别准备相应的译文;将与上述相似的第一语种的例句对应的第二语种的例句以及上述至少一个区别部分的每一个的译文组合,生成参考译文;以及利用上述相似的第一语种的例句以及与其对应的第二语种的例句的对齐信息,提示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中对应的部分的对应关系。2. 根据权利要求1所述的计算机辅助翻译的方法,其中,上述提示步骤包括分别对应地显示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中的部分。3. 根据权利要求1或2所述的计算机辅助翻译的方法,进一步包括:允许用户编辑上述参考译文。4. 根据权利要求1-3中任何一项所述的计算机辅助翻译的方法,进一步包括:允许用户设定上述待翻译的第一语种的句子和上述参考译文之间的对齐信息。5. 根据权利要求1-4中任何一项所述的计算机辅助翻译的方法,进一步包括:将用户确认后的第二语种的参考译文和上述待翻译的第一语种的句子以及它们之间的对齐信息保存到上述双语例句库中。6. 根据权利要求1-5中任何一项所述的计算机辅助翻译的方法,其中,为上述至少一个区别部分的每一个分别准备相应的译文的步骤包括从上述双语例句库中查找与该区别部分对应的第二语种的译文。7. 一种计算机辅助翻译的方法,包括以下步骤:为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;判断上述相似的第一语种的例句与上述待翻译的第一语种的句子的相似性是否小于一个预定阈值;当上述相似的第一语种的例句与上述待翻译的第一语种的句子的相似性小于上述预定阈值时,利用上述进行了对齐的双语例句库中的多个例句对的组合获得参考译文,其中上述多个例句对的每一个的第一语种的例句包含上述待翻译的第一语种的句子的至少一个片段;以及利用上述多个例句对的对齐信息,提示上述待翻译的第一语种的句子中的每个片段与上述参考译文中的相应的片段的对应关系。8. 根据权利要求7所述的计算机辅助翻译的方法,其中,上述提示步骤包括分别对应地显示上述待翻译的第一语种的句子中的每个片段和其在上述参考译文中的片段。9. 根据权利要求7或8所述的计算机辅助翻译的方法,其中,利用动态规划算法获得上述多个例句对的组合。10. 根据权利要求9所述的计算机辅助翻译的方法,其中,上述动态规划算法包括以下步骤:将上述待翻译的第一语种的句子分割成多个片段;以及为每个上述分割的多个片段,在上述双语例句库中查找包括该片段的例句对。11. 根据权利要求10所述的计算机辅助翻译的方法,其中,上述动态规划算法还包括以下步骤:如果在上述双语例句库中没有包括上述片段的例句对,将上述片段再次分割成多个片段;以及为每个上述再次分割的多个片段,在上述双语例句库中查找包括该片段的例句对。12. 根据权利要求10或11所述的计算机辅助翻译的方法,还包括以下步骤:计算上述多个片段的每一个的权重;根据上述计算的权重,计算上述多个例句对的组合的得分;其中,将得分最高的例句对的组合作为上述多个例句对的组合。13. 根据权利要求12所述的计算机辅助翻译的方法,其中,所述计算上述多个片段的每一个的权重的步骤基于每个片段的长度、在所述双语例句库中出现的次数或上述多个例句对的对齐信息进行。14. 根据权利要求7所述的计算机辅助翻译的方法,还包括:当上述相似的第一语种的例句与上述待翻译的第一语种的句子的相似性大于上述预定阈值,并且与上述相似的第一语种的例句相比上述待翻译的第一语种的句子具有至少一个相同部分和至少一个区别部分时,为上述至少一个区别部分的每一个准备相应的译文;将与上述相似的第一语种的例句对应的第二语种的例句以及上述至少一个区别部分的每一个的译文组合,生成参考译文;以及利用上述相似的第一语种的例句以及与其对应的第二语种的例句的对齐信息,提示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中对应的部分的对应关系。15. 根据权利要求14所述的计算机辅助翻译的方法,其中,上述提示步骤包括分别对应地显示上述待翻译的第一语种的句子中的上述至少一个相同部分和/或上述至少一个区别部分的每一个以及其在上述参考译文中的部分。16. 根据权利要求14或15所述的计算机辅助翻译的方法,其中,为上述至少一个区别部分的每一个分别准备相应的译文的步骤包括从上述双语例句库中查找与该区别部分对应的第二语种的译文。17. 根据权利要求7-16中任何一项所述的计算机辅助翻译的方法,进一步包括:允许用户编辑上述参考译文。18. 根据权利要求7-17中任何一项所述的计算机辅助翻译的方法,进一步包括:允许用户设定上述待翻译的第一语种的句子和上述参考译文之间的对齐信息。19. 根据权利要求7-18中任何一项所述的计算机辅助翻译的方法,进一步包括:将用户确认后的第二语种的参考译文和上述待翻译的第一语种的句子以及它们之间的对齐信息保存到上述双语例句库中。20. 一种计算机辅助翻译的装置,包括:查找单元(searching unit),用于为待翻译的第一语种的句子,在进行了对齐的双语例句库中查找相似的第一语种的例句,其中,上述进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息;翻译单元(translating unit),用于当与上述相似的第一语种的例句相比上述待翻译的第一语种的句子具有至少一个相同部分和至少一个区别部分时,为上述至少一个区别部分的每一个分别准备相应的译文;组合单元(combining uni...

【专利技术属性】
技术研发人员:刘占一吴华王海峰唐凯
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1