一种中译英的英语译文质量分析方法及系统技术方案

技术编号:26377673 阅读:50 留言:0更新日期:2020-11-19 23:46
本发明专利技术属于译文质量分析技术领域,公开了一种中译英的英语译文质量分析方法及系统,所述中译英的英语译文质量分析系统包括:中文输入模块、中央控制模块、译文预处理模块、翻译模块、译文对比模块、译文错误率计算模块、纠错模块、译文分析模块、显示模块。本发明专利技术通过译文预处理模块对待译中文进行合理的预处理,将待译中文分配给译员翻译之前进行判断选择最合适的拆分方式,以使待译中文能够匹配到最适合的译员,加快翻译待译中文的速度;同时,通过纠错模块将所述源文本和所有所述回译文本进行文本比较确定所述第一译文的翻译准确程度,并根据所述翻译准确程度纠正所述目标术语的原翻译文本。

【技术实现步骤摘要】
一种中译英的英语译文质量分析方法及系统
本专利技术属于译文质量分析
,尤其涉及一种中译英的英语译文质量分析方法方法及系统。
技术介绍
翻译是在准确(信)、通顺(达)、优美(雅)的基础上,把一种语言信息转变成另一种语言信息的行为。翻译是将一种相对陌生的表达方式,转换成相对熟悉的表达方式的过程。其内容有语言、文字、图形、符号和视频翻译。其中,在甲语和乙语中,“翻”是指的这两种语言的转换,即先把一句甲语转换为一句乙语,然后再把一句乙语转换为甲语;“译”是指这两种语言转换的过程,把甲语转换成乙语,在译成当地语言文字的过程中,进而明白乙语的含义。作为一种以英语为主体而进行的语言转换活动,英语翻译是用英语来表达另一种语言或用另一种语言表达英语的语言之间互相表达的活动。英语翻译既包括中译英、英译中,同时也包括英韩互译、日英互译以及英语和其它语种的互译。英语翻译中有直译和意义两种基本翻译方法,另有增译法、省译法、转译法、拆句法、合并法、正译法、反译法、倒置法、包孕法等技巧。然而,现有中译英的英语译文质量分析方法翻译速度慢;同时,翻译错误率高。综上本文档来自技高网...

【技术保护点】
1.一种中译英的英语译文质量分析方法,其特征在于,所述中译英的英语译文质量分析系统包括以下步骤:/n步骤一,通过中文输入模块利用输入键盘输入待翻译中文;中央控制模块通过译文预处理模块利用预处理程序提取待译中文内容;/n步骤二,通过统计程序去除所述待译中文中的停用词和没有具体意义的词语,得到所述待译中文的特征词;/n步骤三,将所述待译中文的各个所述特征词逐个在术语语料库中匹配,记录每个所述特征词或者由多个所述特征词构成的特征词串匹配的术语的行业类别属性;/n步骤四,统计匹配到的行业类别属性的数量;同时利用统计程序统计待译中文的实义词密度;/n步骤五,分别判断所述待译中文包括的行业类别属性的数量相...

【技术特征摘要】
1.一种中译英的英语译文质量分析方法,其特征在于,所述中译英的英语译文质量分析系统包括以下步骤:
步骤一,通过中文输入模块利用输入键盘输入待翻译中文;中央控制模块通过译文预处理模块利用预处理程序提取待译中文内容;
步骤二,通过统计程序去除所述待译中文中的停用词和没有具体意义的词语,得到所述待译中文的特征词;
步骤三,将所述待译中文的各个所述特征词逐个在术语语料库中匹配,记录每个所述特征词或者由多个所述特征词构成的特征词串匹配的术语的行业类别属性;
步骤四,统计匹配到的行业类别属性的数量;同时利用统计程序统计待译中文的实义词密度;
步骤五,分别判断所述待译中文包括的行业类别属性的数量相对于行业类别属性设定阈值的大小、所述待译中文的实义词密度相对于实义词密度设定阈值的大小;
步骤六,根据所述待译中文的实义词密度相对于实义词密度设定阈值的大小匹配所述待译中文的翻译难度系数;
步骤七,当步骤五的判断结果为待译中文包括的行业类别属性的数量相对于行业类别属性设定阈值的大小且如果所述待译中文的行业类别属性不小于行业类别属性设定阈值,则将所述待译中文按照所述行业类别拆分;
步骤八,当步骤五的判断结果为待译中文的行业类别属性小于行业类别属性设定阈值,且所述待译中文的实义词密度不小于实义词密度设定阈值,则将所述待译中文按照所述待译中文的翻译难度系数拆分;
步骤九,当步骤五的判断结果为待译中文的行业类别属性小于行业类别属性设定阈值,且所述待译中文的实义词密度小于实义词密度设定阈值,则将所述待译中文按照所述行业类别拆分;
步骤十,通过翻译模块利用翻译程序对拆分后的待译中文进行翻译成英文;通过译文对比模块利用对比程序将翻译文与原文进行对比分析;
步骤十一,通过译文错误率计算模块利用计算程序根据对比结果进行计算错误率;通过纠错模块利用纠错程序获取待翻译文本;
步骤十二,将所述待翻译文本翻译为目标语言的译文文本;根据所述译文文本中各分词的上下文信息确定所述分词对应的处理标记;
步骤十三,获取第一译文中目标术语的原翻译文本,并从训练集中获取与所述目标术语对应的候选翻译,将所有所述候选翻译设置为伪翻译文本;
步骤十四,将每一个所述伪翻译文本分别替换所述第一译文中所述原翻译文本得到N个第二译文,并对所述第一译文和所有所述第二译文执行回译操作得到N+1个回译文本;
步骤十五,将所述源文本和所有所述回译文本进行文本比较确定所述第一译文的翻译准确程度,并根据所述翻译准确程度纠正所述目标术语的原翻译文本;
步骤十六,通过译文分析模块利用分析程序根据错误率计算结果对翻译质量进行分析;并通过显示模块利用显示器显示输入的中文、译文、对比结果、计算结果、分析结果。


2.如权利要求1所述中译英的英语译文质量分析方法,其特征在于,步骤四中,所述通过统计程序统计待译中文的实义词密度的方法包括:
通过统计程序统计所述待译中文的总词汇数wordD;对所述待译中文的所有所述词汇进行词性标注,得到其中的实义词,所述实义词至少包括以下之一的词性:名词、代名词、动词、形容词、副词和感叹词;
根据同义词本体工具得到所述待译中文的第i个实义词的义项数meaningsi;统计所述待译中文的所述实义词的义项总数;
按照



得到所述待译中文的实义词密度density_notionalD;其中,count_notionalD为所述待译中文的所述实义词的数量,1≤i≤count_notionalD。


3.如权利要求1所述中译英的英语译文质量分析方法,其特征在于,所述将待译中文按照所述行业类别属性拆分的过程包括:
获取所述待译中文的每个段落的所述特征词,建立所述每个段落与其包含的各个所述特征词的对应关系;
将所述待译中文的各个所述特征词逐个在术语语料库中匹配,将每个所述特征词或者由多个所述特征词构成的所述特征词串匹配的术语的行业类别属...

【专利技术属性】
技术研发人员:苏进德
申请(专利权)人:莱芜职业技术学院
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1