The invention discloses the method and device for the alignment of the original translation, which belongs to the field of translation technology. The method comprises: a two-dimensional table generating original sentence identification and sentence identification; determine between each sentence text sentence and every word sentence the sentence matching rate, and fill in the corresponding position of the two in the table; according to at least one set match rate, successive scanning on the two-dimensional tables in each for the two-dimensional table and each column, and the most determined a set the first sentence matching rate of matching rate; according to the determined by the first sentence matching rate, the corresponding original sentence and sentence alignment. In this way, based on the sentence matching rate between all the sentences involved in the alignment, the original translation is aligned to improve the accuracy of the original translation.
【技术实现步骤摘要】
原译文对齐的方法及装置
本专利技术涉及翻译
,特别涉及原译文对齐的方法及装置。
技术介绍
当前计算机辅助翻译是提高翻译一致性和效率的重要手段,它能够帮助翻译者优质、高效、轻松地完成翻译,使得繁重的手工翻译流程自动化,并大幅度提高了翻译效率和翻译质量。通过计算机辅助翻译对原文文件进行翻译,形成译文文件后,翻译人员可能需要获取译文文件中与原文文件中设定原文句子对应的译文句子,或者,需要获取原文文件中与设定译文句子对应的原文句子,即需要原文句子和译文句子对齐,从而,可进行后续的校对、编辑等。而目前,可通过翻译人员通过将原文文件和译文文件进行对照查看,进行原文和译文的对齐,效率比较低下。
技术实现思路
本专利技术实施例提供了一种原译文对齐的方法及装置。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。根据本专利技术实施例的第一方面,提供了一种原译文对齐的方法,包括:生成原文句子标识和译文句子标识的二维表格;确定每句原文句子和每句译文句子之间的句子匹配率,并填入所述二维表格中的对应位置上;根据至少一个设定匹配率,对所述二维表格进行逐次扫描,在所述二维表格的每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率;根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐。本专利技术一实施例中,所述确定每句原文句子和每句译文句子之间的句子匹配率包括:确定当前原文句子和当前译文句子之间的 ...
【技术保护点】
一种原译文对齐的方法,其特征在于,包括:生成原文句子标识和译文句子标识的二维表格;确定每句原文句子和每句译文句子之间的句子匹配率,并填入所述二维表格中的对应位置上;根据至少一个设定匹配率,对所述二维表格进行逐次扫描,在所述二维表格的每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率;根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐。
【技术特征摘要】
1.一种原译文对齐的方法,其特征在于,包括:生成原文句子标识和译文句子标识的二维表格;确定每句原文句子和每句译文句子之间的句子匹配率,并填入所述二维表格中的对应位置上;根据至少一个设定匹配率,对所述二维表格进行逐次扫描,在所述二维表格的每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率;根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐。2.如权利要求1所述的方法,其特征在于,所述确定每句原文句子和每句译文句子之间的句子匹配率包括:确定当前原文句子和当前译文句子之间的长度匹配率;确定当前原文句子和当前译文句子之间的提取元素匹配率,其中,所述提取元素匹配率包括:标点匹配率、非译元素匹配率、以及单词匹配率中的至少一个;根据所述长度匹配率以及所述匹配率,确定所述当前原文句子和所述当前译文句子之间的句子匹配率。3.如权利要求1所述的方法,其特征在于,所述在所述二维表格中每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率包括:扫描所述二维表格,查找与当前设定匹配率相等的第一句子匹配率;将查找到的每个第一句子匹配率所在行和/或所在列的其他句子匹配率设置为零;将所述当前设定匹配率减去设定值后更新为所述当前设定匹配率;根据所述当前设定匹配率,对所述二维表格继续进行扫描,直至所述二维表格除去所述第一句子匹配率以外的其他句子匹配率都为零。4.如权利要求3所述的方法,其特征在于,所述将查找到的每个第一句子匹配率所在行和/或所在列的其他句子匹配率设置为零包括:当查找到的所述第一句子匹配率不在相同的行和列时,将每个第一句子匹配率所在行以及所在列的其他句子匹配率设置为零;当所述第一句子匹配率在相同的行或列时,将所述相同的行或列中的其他句子匹配率设置为零。5.如权利要求1所述的方法,其特征在于,所述根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐包括:将大于第一设定匹配率的所述第一句子匹配率确定为待对齐句子匹配率;确定所述待对齐句子匹配率所在位置对应的待对齐原文句子标识和待对齐译文句子标识;根据所述待对齐原文...
【专利技术属性】
技术研发人员:房立夫,
申请(专利权)人:语联网武汉信息技术有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。