一种英语翻译优化方法技术

技术编号:31717181 阅读:16 留言:0更新日期:2022-01-01 11:24
本发明专利技术公开了一种英语翻译优化方法,包括如下步骤:步骤一、从数据库中抽取n个英语语句作为测试样本,得到测试样本集;步骤二、将所述测试样本集中的测试样本分别输入m个的翻译系统进行翻译,得到翻译结果样本集;步骤三、将所述每个测试样本的翻译结果与该样本的标准译文进行对比,得到最佳翻译结果;并将输出所述最佳翻译结果的翻译系统,作为该测试样本的最佳翻译系统;步骤四、将待翻译语句与测试样本进行对比,确定与所述待翻译语句相似度最高的测试样本;将所述待翻译语句输入与其相似度最高的测试样本的最佳翻译系统,得到所述待翻译语句的译文。语句的译文。

【技术实现步骤摘要】
一种英语翻译优化方法


[0001]本专利技术属于英语翻译
,特别涉及一种英语翻译优化方法。

技术介绍

[0002]英语作为一种世界范围的语言,越来越多的人需要学习和使用英语。翻译是语言使用过程中的关键环节,翻译就是把一种语言文字的语义用另一种语言文字表达出来,这就要求翻译的过程不仅要把握翻译的准确性,还要把握两种文字的使用习惯。现在有很多英语翻译软件帮助人们进行翻译,但是使用翻译软件往往存在数翻译不准确,语句不通顺的问题。

技术实现思路

[0003]本专利技术的目的是提供一种英语翻译优化方法,其能够提高翻译结果的准确性,提高翻译质量。
[0004]本专利技术提供的技术方案为:
[0005]一种英语翻译优化方法,包括如下步骤:
[0006]步骤一、从数据库中抽取n个英语语句作为测试样本,得到测试样本集{E1,E2,E3,
……
,E
n
};
[0007]步骤二、将所述测试样本集中的测试样本分别输入m个的翻译系统进行翻译,得到翻译结果样本集
[0008]式中,C
nm
表示第n个测试样本E
n
在第m个翻译系统中的翻译结果;
[0009]步骤三、将所述每个测试样本的翻译结果与该样本的标准译文进行对比,得到最佳翻译结果;并将输出所述最佳翻译结果的翻译系统,作为该测试样本的最佳翻译系统;
[0010]步骤四、将待翻译语句与测试样本进行对比,确定与所述待翻译语句相似度最高的测试样本;将所述待翻译语句输入与其相似度最高的测试样本的最佳翻译系统,得到所述待翻译语句的译文。
[0011]优选的是,所述翻译系统包括:直接翻译法翻译系统、中间语言法翻译系统和转换法翻译系统。
[0012]优选的是,在所述步骤一之前还包括,从不同领域的英语文献中筛选出原始样本语句形成数据库;
[0013]其中,所述原始样本语句中至少含有一个英语基本句型。
[0014]优选的是,在所述步骤一中,得到测试样本的方法为:
[0015]步骤1、对数据库中的原始样本语句按数量等分为n个子区间;
[0016]步骤2、在每个子区间内随机抽取一个英语语句,作为测试样本。
[0017]优选的是,在所述步骤三中,通过如下方法得到最佳翻译结果:
[0018]步骤1、计算每个翻译结果与标准译文的相似距离;
[0019][0020]其中,d
a
表示第a个翻译结果与标准译文的相似距离;k表示标准译文的总词数;x
si
表示在标准译文中词语i占标准译文总词数的比值,y
ai
表示在第a个翻译结果中的词语i或i的近义词占第a个翻译结果总词数的比值;
[0021]步骤2、筛选出数值最小的相似距离,将与数值最小的相似距离相对应的翻译结果作为最佳翻译结果。
[0022]优选的是,在所述步骤四中,通过如下方法确定与所述待翻译语句相似度最高的测试样本;
[0023]步骤A、筛选出多个与待翻译语句含有相同的基本句型的测试样本,作为预选样本;
[0024]步骤B、采用二进制编码方式,对待翻译语句与所述预选样本的形容词占比的差值Δc、名词占比差值Δd、动词占比差值Δe和介词占比差值Δf进行编码;
[0025]步骤C、随机产生第一代种群,所述第一代种群中的每个个体都包含Δc、Δd、Δe和Δf;
[0026]步骤D、计算第一代种群中的每个个体的适应度;其中,所述适应度计算公式为:
[0027][0028]步骤E、将所述个体按适应度排序,选择适应度高的个体,进行交叉和变异,生成第二代种群;
[0029]步骤F、计算第二代种群中每个个体的适应度,循环进行步骤E

F,直到达到设定的迭代次数;选出适应度最大的个体作为最优解;
[0030]步骤G、对所述最优解进行解码,分别得到Δc、Δd、Δe和Δf的最优值Δc
r
、Δd
r
、Δe
r
和Δf
r

[0031]计算最优差异度H
r
=|Δc
r
|+|Δd
r
|+|Δe
r
|+|Δf
r
|;
[0032]并且计算每个所述预选样本与所述待翻译语句的差异度:
[0033]H
p
=|Δc
p
|+|Δd
p
|+|Δe
p
|+|Δf
p
|
[0034]其中,Δc
p
、Δd
p
、Δe
p
和Δf
p
分别表示第p个预选样本与待翻译语句的形容词占比的差值、名词占比差值、动词占比差值和介词占比差值;
[0035]其中,与H
r
最接近的H
p
值对应的预选样本即为与所述待翻译语句相似度最高的测试样本。
[0036]优选的是,在所述步骤A中,所述基本句型包括如下形式:
[0037]主语+谓语;
[0038]主语+系动词+标语;
[0039]主语+谓语+宾语;
[0040]主语+谓语+间接宾语+直接宾语;
[0041]主语+谓语+宾语+宾语补足语;以及
[0042]There be句式。
[0043]本专利技术的有益效果是:
[0044]本专利技术提供的英语翻译优化方法,能够提高翻译结果的准确性,提高翻译质量。
具体实施方式
[0045]下面对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
[0046]本专利技术提供了一种英语翻译优化方法,具体的过程如下:
[0047]一、建立数据库
[0048]从不同领域的英语文献中筛选出多个原始样本语句形成数据库;其中,所述原始样本语句中至少含有一个英语基本句型。
[0049]所述基本句型包括但不限于如下形式的句型:
[0050]第一类:主语+谓语(S+V);第二类:主语+系动词+标语(S+V+P);第三类:主语+谓语+宾语(S+V+O);第四类:主语+谓语+间接宾语+直接宾语(S+V+IV+O);第五类:主语+谓语+宾语+宾语补足语(S+V+O+C);以及第六类:There be句式。
[0051]二、得到测试样本集
[0052]对数据库中的原始样本语句进行随机编号后,按编号顺序从小到达排列;从第一个编号开始按照数量将数据库中的所有样本等分为n个子区间。在每个子区间内随机抽取一个英语语句,作为测试样本;这样就得到了n个测试样本,n个测试样本组成测试样本集{E1,E2,E3,
……
,E
n
}。
[0053]三、得到每个测试样本在不同翻译系统中的翻译结果(中文译文)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种英语翻译优化方法,其特征在于,包括如下步骤:步骤一、从数据库中抽取n个英语语句作为测试样本,得到测试样本集{E1,E2,E3,
……
,E
n
};步骤二、将所述测试样本集中的测试样本分别输入m个的翻译系统进行翻译,得到翻译结果样本集式中,C
nm
表示第n个测试样本E
n
在第m个翻译系统中的翻译结果;步骤三、将每个所述测试样本的翻译结果与该样本的标准译文进行对比,得到最佳翻译结果;并将输出所述最佳翻译结果的翻译系统,作为该测试样本的最佳翻译系统;步骤四、将待翻译语句与测试样本进行对比,确定与所述待翻译语句相似度最高的测试样本;将所述待翻译语句输入与其相似度最高的测试样本的最佳翻译系统,得到所述待翻译语句的译文。2.根据权利要求1所述的英语翻译优化方法,其特征在于,所述翻译系统包括:直接翻译法翻译系统、中间语言法翻译系统和转换法翻译系统。3.根据权利要求2所述的英语翻译优化方法,其特征在于,在所述步骤一之前还包括,从不同领域的英语文献中筛选出原始样本语句形成数据库;其中,所述原始样本语句中至少含有一个英语基本句型。4.根据权利要求3所述的英语翻译优化方法,其特征在于,在所述步骤一中,得到测试样本的方法为:步骤1、对数据库中的原始样本语句按数量等分为n个子区间;步骤2、在每个子区间内随机抽取一个英语语句,作为测试样本。5.根据权利要求3或4所述的英语翻译优化方法,其特征在于,在所述步骤三中,通过如下方法得到最佳翻译结果:步骤1、计算每个翻译结果与标准译文的相似距离;其中,d
a
表示第a个翻译结果与标准译文的相似距离;k表示标准译文的总词数;x
si
表示在标准译文中词语i占标准译文总词数的比值,y
ai
表示在第a个翻译结果中的词语i或i的近义词占第a个翻译结果总词数的比值;步骤2、筛选出数值最小的相似距离,将与数值最小的相似距离相对应的翻译结果作为最佳翻译结果。6.根据权利要求5所述的英语翻译优化方法,其特征在于,在所述步骤四中,通过如下方法确定与所述待翻译语句相似度最高的测试样本;步骤A...

【专利技术属性】
技术研发人员:杨天地刘曲付姗姗
申请(专利权)人:锦州医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1