【技术实现步骤摘要】
一种计算机辅助翻译系统及方法
[0001]本专利技术属于语言处理
,具体涉及一种计算机辅助翻译系统及方法。
技术介绍
[0002]随着科学技术和互联网的快速发展,计算机和网络技术已经深入我们工作、生活的方方面面。近些年机器翻译技术取得了巨大的进步,但是由于自然语言的复杂性,机器翻译的译文难以做到完满的程度。同时传统机器翻译的结果只提供给用户一个最佳译文,并没有提供帮助用户修改翻译结果的辅助信息,这使得对于外语水平较低的用户很难对译文做出修改,阻碍了机器翻译的普及应用。
[0003]现阶段翻译技术主要分为三种:人工翻译、计算机辅助翻译以及机器翻译加译后编辑。人工翻译准确度较高,但是速度较慢,并且准确度依赖译员主观的能力水平;机器翻译速度快,然而大部分机器翻译的结果并不能直接拿来使用,通常会存在明显的错翻以及语法错误,还是需要通过人工翻译进行进一步校正,并且无法更好的处理生词,一词多义等复杂语言情况;计算机辅助翻译则是介于二者之间的一种翻译方法,其基本思路是由计算机基于翻译记忆库和术语库中的数据在人工翻译时给多条出 ...
【技术保护点】
【技术特征摘要】
1.一种计算机辅助翻译系统,其特征在于:包括拆分模块、标注模块、搜索模块和统计模块;所述拆分模块用于对原文和译文进行拆解;所述标注模块用于对拆解后的文件进行标注;所述搜索模块用于对要翻译的句子和数据库中的句子进行对比匹配,对比时根据句子结构、标注属性进行判断,选出最优结果;所述统计模块用于对结果进行统计。2.根据权利要求1所述的计算机辅助翻译系统,其特征在于:所述拆分模块将篇章段落基于语法和标点符号拆解为句子。3.根据权利要求2所述的计算机辅助翻译系统,其特征在于:所述标注模块对拆解出来的句子进行标注,包括为动词标注时态,对句子结构进行归类,将句子中的量词短语进行单独标注,对句子中出现的连续大写字母单词、CamelWord驼峰式单词、数字、文件路径或网址、邮箱进行单独标注。4.根据权利要求3所述的计算机辅助翻译系统,其特征在于:所述量词短语包括时间、质量、体积、长度、面积、容积和速度。5.根据权利要求3所述的计算机辅助翻译系统,其特征在于:所述数字包括整数、分数、小数、正数和负数。6.根据权利要求3所述的计算机辅助翻译系统,其特征在于:所述搜索模块对比时根据句子结构、标注属性进行判断,并且忽略时态带来的差异,对于量词短语,仅数字部分的不同进行忽略,基于多种规则和维度对句子的匹配情况进行评分,选出最优结果...
【专利技术属性】
技术研发人员:田佳成,
申请(专利权)人:甲骨易北京语言科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。