软件翻译系统中的纠错模块及其纠错方法技术方案

技术编号:4096585 阅读:258 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种软件翻译系统中的纠错模块,纠错模块用于接收从外部输入的原文和译文,按照阶梯过滤模式和识别规则对所述原文和译文进行纠错检查,提取出所述原文和译文的日期、时间、数字元素并置于记录列表中;比较模块用于提取出所述记录列表中的元素,按照比较规则逐级比较原文和译文的日期、时间、数字元素,将比较结果发送给显示模块;显示模块用于将比较结果汇总并显示。本发明专利技术还公开了一种软件翻译系统中的纠错方法。本发明专利技术能够准确识别原文和译文中的日期、时间和数字元素,并检查出译文中是否存有日期、时间、数字方面的漏译、多译和错译,及时显示给用户。

【技术实现步骤摘要】

本专利技术涉及一种软件翻译技术,具体说,涉及一种软件翻译系统中的纠错模块及 其纠错方法。
技术介绍
现有技术中,当需要对译员翻译的双语稿件进行校对时,不能准确判断原文中各 种格式或写法的日期、时间和数字在译文里是否得到正确翻译。例 句 1 :As of Sept. 19 Japan time Journal reporter,the police have 29suspects to the taking of measures,including the arrest of 18 people.番羽译为 中文为截至9月19日本刊记者发稿时,警方已经对29名犯罪嫌疑人采取强制措施,其中 逮捕18人。例句 2 :Methods To retrospectively analyze the data of 12 cases of intractable postpartum hemorrhage treated by IIAL from Sept. 200 4to Apr. 2009in our hospital.翻译为中文为方法分析2004年9月至2009年4月间发生的难治性产后 出血并行骼内动脉结扎的12例患者的临床资料。例句3 :His work starts at half past eight,and finished at a quarter to five.翻译为中文为他的工作八点半幵始,四点四十五结束。M^J 4 :She gets up at seven every day. She has breakfast at a quarter past eight,and starts work at a quarter to ten. She works until half past twelve. 翻译为中文为她每天七点起床,她八点一刻吃早饭,九点三刻开始工作,一直工作到十二点 Hzl O从上述四个例句可以看出,日期、时间、数字往往混杂在一起,现有技术很难识别 译文翻译的是否准确,是否有日期、时间、数字方面的漏译、多译、错译。
技术实现思路
本专利技术所解决的技术问题是提供一种软件翻译系统中的纠错模块,能够准确识别 并检查出译文的漏译、多译和错译,及时显示给用户。技术方案如下一种软件翻译系统中的纠错模块,包括纠错模块,用于接收从外部输入的原文和译文,按照阶梯过滤模式和识别规则对 所述原文和译文进行纠错检查,提取出所述原文和译文的元素并置于记录列表中;比较模块,用于提取出所述记录列表中的所述元素,按照比较规则逐级比较原文 和译文的元素,将比较结果发送给显示模块;显示模块,用于将比较结果汇总并显示。优选的,所述阶梯过滤模式包括至少三级阶梯,每个阶梯分别分配有至少一条识 别规则。优选的,所述比较规则的内容包括当本级原文和译文中的所述元素的数量和内 容相同时,证明本级没有发现翻译错误;当比较发现当前级原文和译文的元素数量不等或 内容不同时,则说明本级存在翻译错误。优选的,所述识别规则包括日期格式区、时间格式区和数字格式区;所述元素包 括日期元素、时间元素和数字元素。优选的,所述纠错模块在所述日期格式区对不同语种中的年、月和日的格式分别 进行过滤识别,提取出所述日期元素;在所述时间格式区对不同语种的时、分和秒的格式分 别进行过滤识别,提取出所述时间元素;在所述数字格式区对不同语种中的小数格式、分数 格式和普通数字格式进行过滤识别,提取出所述数字元素。本专利技术所解决的另一个技术问题是提供一种软件翻译系统中的纠错方法,能够准 确识别并检查出译文的漏译、多译和错译,及时显示给用户。技术方案如下一种软件翻译系统中的纠错方法,包括接收从外部输入的原文和译文,按照阶梯过滤模式和识别规则对所述原文和译文 进行纠错检查,提取出所述原文和译文的元素并置于记录列表中;分级提取出所述列表中的元素,按照比较规则逐级比较原文和译文的元素,并将 比较结果汇总并显示。进一步,还包括设定阶梯过滤模式、识别规则或者比较规则的步骤。进一步,所述阶梯过滤模式包括至少三级阶梯,每个阶梯分别分配有对应的至少 一条识别规则。进一步,所述比较规则的内容包括当本级原文和译文中的元素的数量和内容相 同时,证明本级没有发现错误;当比较发现当前级原文和译文的元素数量不等或内容不同 时,则说明本级存在错误。进一步,所述识别规则包括日期格式区、时间格式区和数字格式区,所述元素包括 日期元素、时间元素和数字元素;在所述日期格式区对不同语种中的年、月和日的格式分别 进行过滤识别,提取出所述日期元素;在所述时间格式区对不同语种的时、分和秒的格式分 别进行过滤识别,提取出所述时间元素;在所述数字格式区对不同语种中的小数格式、分数 格式和普通数字格式进行过滤识别,提取出所述数字元素。本专利技术技术方案的技术效果包括1、本专利技术能够准确识别原文和译文中的日期、时间和数字元素,并检查出译文中 是否存有日期、时间、数字方面的漏译、多译和错译,及时显示给用户。2、使用纠错模块可以迅速比对译员翻译的原译文稿件,找出所存在的错误,并及 时提供给用户,以达到提高翻译稿件质量的目的。附图说明图1是本专利技术的纠错流程图;图2是本专利技术中的阶梯过滤模式原理图。具体实施例方式本专利技术利用逐级过滤的方式准确识别原文和译文中的日期、时间和数字,进而找 到并指出翻译错误。下面参考附图和优选实施例,对本专利技术技术方案做详细描述。如图1所示,是本专利技术的纠错流程图,下面对纠错模块的具体结构和工作过程作 详细描述。步骤101 设定纠错模块。本专利技术的逐级过滤方式是利用纠错模块来实现的,纠错模块中装有阶梯过滤模式 和识别规则,阶梯过滤模式和识别规则需要预先设定,设定好后就可以利用纠错模块来过 滤识别原文和译文中的日期、时间和数字。纠错模块可以植入到翻译工具中,实现自动纠错。如图2所示,是本专利技术中的阶梯过滤模式原理图。本优选实施例中,阶梯过滤模式 分为十级阶梯过滤,相应的,为每级阶梯分别分配了 1 多条识别规则。当然,阶梯的数量 可以根据实际情况酌情选取,识别规则的表现形式和数量也可以自由设置。在每级阶梯上,分别编制该级阶梯的识别规则,识别规则包括原文、译文语种识别 规则。识别规则可选用正则表达式或程序函数方式。图1示例中,阶梯过滤模式的内容是将两个语种(语种A和语种B)从第1级到第 10级进行十级过滤识别,识别规则分为日期格式区、时间格式区、数字格式区,第1级 第 3级属于日期格式区,第4级 第7级属于时间格式区,第8级 第10级属于数字格式区。 在日期格式区对语种A和语种B中的年、月、日的格式分别进行过滤识别,提取出日期元素; 在时间格式区对语种A和语种B中的时、分、秒的格式分别进行过滤识别,提取出时间元素; 在数字格式区对语种A和语种B中的小数格式、分数格式和普通数字格式进行过滤识别,提 取出数字元素。以第1级 第3级的日期格式区为例,第1级阶梯关于年、月、日格式的原文、译文的识别规则如下表本文档来自技高网
...

【技术保护点】
一种软件翻译系统中的纠错模块,其特征在于,包括:纠错模块,用于接收从外部输入的原文和译文,按照阶梯过滤模式和识别规则对所述原文和译文进行纠错检查,提取出所述原文和译文的元素并置于记录列表中;比较模块,用于提取出所述记录列表中的所述元素,按照比较规则逐级比较原文和译文的元素,将比较结果发送给显示模块;显示模块,用于将比较结果汇总并显示。

【技术特征摘要】
一种软件翻译系统中的纠错模块,其特征在于,包括纠错模块,用于接收从外部输入的原文和译文,按照阶梯过滤模式和识别规则对所述原文和译文进行纠错检查,提取出所述原文和译文的元素并置于记录列表中;比较模块,用于提取出所述记录列表中的所述元素,按照比较规则逐级比较原文和译文的元素,将比较结果发送给显示模块;显示模块,用于将比较结果汇总并显示。2.如权利要求1所述的软件翻译系统中的纠错模块,其特征在于所述阶梯过滤模式 包括至少三级阶梯,每个阶梯分别分配有至少一条识别规则。3.如权利要求1所述的软件翻译系统中的纠错模块,其特征在于,所述比较规则的内 容包括当本级原文和译文中的所述元素的数量和内容相同时,证明本级没有发现翻译错 误;当比较发现当前级原文和译文的元素数量不等或内容不同时,则说明本级存在翻译错 误。4.如权利要求1所述的软件翻译系统中的纠错模块,其特征在于,所述识别规则包括 日期格式区、时间格式区和数字格式区;所述元素包括日期元素、时间元素和数字元素。5.如权利要求4所述的软件翻译系统中的纠错模块,其特征在于,所述纠错模块在所 述日期格式区对不同语种中的年、月和日的格式分别进行过滤识别,提取出所述日期元素; 在所述时间格式区对不同语种的时、分和秒的格式分别进行过滤识别,提取出所述时间元 素;在所述数字格式区对不同语种中的小数格式、分数格式和普通数字格式进行过滤识别, 提取出所述...

【专利技术属性】
技术研发人员:车双武
申请(专利权)人:传神联合北京信息技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1