一种翻译任务准确分配的方法技术

技术编号:9960791 阅读:95 留言:0更新日期:2014-04-23 20:48
本发明专利技术公开了一种翻译任务准确分配的方法,包括:确定多个待译文档中的每个所述待译文档的文本大小和翻译难度数值;根据每个所述待译文档的所述文本大小和翻译难度数值进行计算,得到每个所述待译文档的翻译量;根据每个所述待译文档的翻译量,将多个所述待译文档分割成多个翻译任务;所述分割的翻译任务的数量与待分配任务的译员的数量相等;将每个所述翻译任务分配给一个所述译员。本发明专利技术通过根据翻译难度和文本大小计算得到文档的翻译量,实现了翻译项目精确分割,解决的翻译任务平均分配的问题。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,包括:确定多个待译文档中的每个所述待译文档的文本大小和翻译难度数值;根据每个所述待译文档的所述文本大小和翻译难度数值进行计算,得到每个所述待译文档的翻译量;根据每个所述待译文档的翻译量,将多个所述待译文档分割成多个翻译任务;所述分割的翻译任务的数量与待分配任务的译员的数量相等;将每个所述翻译任务分配给一个所述译员。本专利技术通过根据翻译难度和文本大小计算得到文档的翻译量,实现了翻译项目精确分割,解决的翻译任务平均分配的问题。【专利说明】
本专利技术涉及翻译
,具体而言,涉及。
技术介绍
一个大的翻译项目往往是由一个翻译团队协作来完成,对于团队协作完成的项目,项目进度和时间的管控是一个非常重要的环节,如何将一个翻译项目中的翻译任务合理分配给团队中的每一个成员,使得翻译项目能够在相同的时间内统一、并行完成,是翻译过程中需要解决的问题。要将翻译任务合理分配给译员翻译,需要明确每个翻译任务的翻译量,翻译任务翻译量的确定是由文档的翻译难度和文档的大小决定,文档的大小即文档的字数,这是一项易于统计的比较清楚的指标,所以对于翻译任务进行准确分配最需要解决的问题就是对文档翻译难度的判别。对于文档翻译难度的判别可以分为人工判别和机器判别。人工判别是通过语言专家或翻译专家对待翻译文档进行标注和判断,由于人的阅读和理解限制,这种方法速度较慢同时要耗费非常大的的人力成本,并且由于判别人能力的参差以及每人对文档难度的理解不同而产生很大的判别差别,判别结果无法做到统一标准,客观性很差。机器判别是通过计算机结合一定的方法对文档进行翻译难度判断,目前最常用的方法是通过对文档中生僻字词的统计来进行难度判断,这种单一维度的判断方法其用来作为判别因素的可靠性比较单薄,有较大的片面性,得到的判别结果往往与实际情况差别很大,无法保证判别结果的准确性。目前对文档翻译难度的判别,还缺乏一个既高效又相对准确的判别方法。
技术实现思路
本专利技术旨在提供,解决了如何将翻译任务合理分配给合适的译员的问题。本专利技术公开了一种翻译任务准分配的方法,包括:确定多个待译文档中的每个所述待译文档的文本大小和翻译难度数值;根据每个所述待译文档的所述文本大小和翻译难度数值进行计算,得到每个所述待译文档的翻译量;根据每个所述待译文档的翻译量,将多个所述待译文档按照待分配任务的译员的数量分割成多个翻译任务;将每个所述翻译任务分配给一个所述译员。优选地,所述待译文档的翻译量为该待译文档的文本大小与翻译难度数值的乘积,其中待译文档的文本大小为待译文档的字数。优选地,确定每个所述待译文档的所述翻译难度数值的过程包括:扫描待译文档,确定所述待译文档中的所有词汇和所有语句;根据确定的所述词汇和语句分别进行复杂度计算,得到文档的词汇复杂度和语句复杂度;按照翻译难度计算公式计算得到所述文档的翻译难度数值;所述翻译难度计算公式如下:diff_doc = K1.diff_word+K2.diff_sentence ;其中,KJPK2为通过样本计算得到翻译难度调节系数,diff_doc为翻译难度数值,diff_word为所述词汇复杂度,diff_sentence为所述语句复杂度。优选地,计算所述词汇复杂度的过程包括:计算出文档的词汇等级、类符形符比和实义词词义密度;按照词汇复杂度计算公式计算,得到所述文档的所述词汇复杂度,所述词汇复杂度计算公式如下:diff_word = K11.grade_word+K12.STTR+K13.density_notional ; 其中,gradejord为所述文档的词汇等级,STTR为所述文档的类符形符比,density_notional为所述文档的实义词词义密度,K11 > K12和K13为通过样本计算得到词汇复杂度调节系数。优选地,在计算所述文档的词汇等级之前,还包括:对所述文档进行分词处理,得到所有词汇,并统计得到总词汇数;将得到的每个所述词汇在词汇分级表中进行匹配,得到每个所述词汇的词汇级别;所述词汇级别为一级、二级、三级或四级;分别统计所述词汇级别为二级或二级以上的级别的所述词汇的数量;计算所述文档的词汇等级的过程包括:按照词汇等级计算公式计算出所述文档的词汇等级,所述词汇等级计算公式如下:【权利要求】1.,其特征在于,包括: 确定多个待译文档中的每个所述待译文档的文本大小和翻译难度数值; 根据每个所述待译文档的所述文本大小和翻译难度数值进行计算,得到每个所述待译文档的翻译量; 根据每个所述待译文档的翻译量 ,将多个所述待译文档按照待分配任务的译员的数量分割成多个翻译任务; 将每个所述翻译任务分配给一个所述译员。2.根据权利要求1所述的方法,其特征在于,所述待译文档的翻译量为该待译文档的文本大小与翻译难度数值的乘积,其中待译文档的文本大小为待译文档的字数。3.根据权利要求1所述的方法,其特征在于,确定每个所述待译文档的所述翻译难度数值的过程包括: 扫描待译文档,确定所述待译文档中的所有词汇和所有语句; 根据确定的所述词汇和语句分别进行复杂度计算,得到文档的词汇复杂度和语句复杂度; 按照翻译难度计算公式计算得到所述文档的翻译难度数值;所述翻译难度计算公式如下:diff—doc = K1.diff—word+K2.diff—sentence ; 其中,K1和K2为通过样本计算得到翻译难度调节系数,diff_doc为翻译难度数值,diff_word为所述词汇复杂度,diff_sentence为所述语句复杂度。4.根据权利要求3所述的方法,其特征在于,计算所述词汇复杂度的过程包括: 计算出文档的词汇等级、类符形符比和实义词词义密度; 按照词汇复杂度计算公式计算,得到所述文档的所述词汇复杂度,所述词汇复杂度计算公式如下:diff_word = K11.grade_word+K12.STTR+K13.density_notional ; 其中,grade_word为所述文档的词汇等级,STTR为所述文档的类符形符比,density_notional为所述文档的实义词词义密度,K11, K12和K13为通过样本计算得到词汇复杂度调节系数。5.根据权利要求4所述的方法,其特征在于,在计算所述文档的词汇等级之前,还包括: 对所述文档进行分词处理,得到所有词汇,并统计得到总词汇数; 将得到的每个所述词汇在词汇分级表中进行匹配,得到每个所述词汇的词汇级别;所述词汇级别为一级、二级、三级或四级; 分别统计所述词汇级别为二级或二级以上的级别的所述词汇的数量; 计算所述文档的词汇等级的过程包括: 按照词汇等级计算公式计算出所述文档的词汇等级,所述词汇等级计算公式如下: ,, T.word, , T.word., , Λ7 word4 grade word = K111--f + K112--r + K113-- ° ~111 wordwordword 其中,wordx为词汇级别为X级的词汇的数量,K111, K112和K113为通过样本计算得到词汇等级调节系数,word为总词汇数。6.根据权利要求5所述的方法,其特征在于,计算所述文档的类符形符比的过程包括; 根据得到的所有所述词汇,统本文档来自技高网
...

【技术保护点】
一种翻译任务准确分配的方法,其特征在于,包括:确定多个待译文档中的每个所述待译文档的文本大小和翻译难度数值;根据每个所述待译文档的所述文本大小和翻译难度数值进行计算,得到每个所述待译文档的翻译量;根据每个所述待译文档的翻译量,将多个所述待译文档按照待分配任务的译员的数量分割成多个翻译任务;将每个所述翻译任务分配给一个所述译员。

【技术特征摘要】

【专利技术属性】
技术研发人员:江潮
申请(专利权)人:武汉传神信息技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1