一种译文质量分析方法及系统技术方案

技术编号:35263971 阅读:16 留言:0更新日期:2022-10-19 10:24
本发明专利技术涉及计算机技术领域,具体涉及一种译文质量分析方法及系统,包括:将待翻译原文拆分为若干个段落单元,进行评级并赋予级值,生成若干个参考文档,以参考文档内级值之和评级分数;将待评价译文对应拆分,确定最接近的参考文档和初始分数;将待分析段落单元与翻译参考段落单元进行匹配对应,以级值作为段落单元值,并对比翻译参考段落单元后获取待分析段落单元的正向值和负向值,以段落单元值、正向值和负向值之和作为段落的评定分数。本发明专利技术提供多种方式和风格的翻译参考段落,对应进行不同的评级和评分,并根据权重将段落单元的评分折算到整个翻译参考文档的评价中以确定待评价译文的评价得分,提供了更多的参考性,评价更为客观可靠。更为客观可靠。更为客观可靠。

【技术实现步骤摘要】
一种译文质量分析方法及系统


[0001]本专利技术涉及计算机
,具体涉及一种译文质量分析方法及系统。

技术介绍

[0002]随着社会的发展进步,不同语言、文化和思想的交流日益增多,现在对于差异化的语言和文字进行翻译的需求急速的增加。部分翻译通过人工实现,部分翻译则通过机器人自动话实现。人工翻译依靠翻译者自身经历经验和语言能力,翻译的水平有高低差别;而机器人自动翻译则由于翻译逻辑的不同,翻译的结果参差不齐。
[0003]无论对于人工翻译还是机器人自动翻译获得的译文,都需要通过分析以界定其质量水平。当前有人提出了自动化的译文分析方法,以某一参考译文作为评价标准,对待分析译文进行评分并得出最终的评价结果,根据最终评价结果作为译文的质量水平。这种评价方式存在一定的局限性:首先,需要提前获取参考译文,参考译文如何获取是不得而知的,若通过他人翻译或其他自动化翻译则不能确定参考译文的质量水平;翻译表达的方式有多种,不同的表达方式并没有明显的高下之别,因此以单一参考译文作为评价标准过于片面,得到的评价结果不够客观。
[0004]故需要提出更为合理的技术方案,解决现有技术中存在的技术问题。

技术实现思路

[0005]至少为克服其中一种上述内容提到的缺陷,本专利技术提出一种译文质量分析方法及系统,参考不同风格的译文表达方式,通过多维度的评价方式对译文进行评价分析,将译文的语义、句法等分别进行拆分以进行综合评分,得到更为客观的译文质量评价。
[0006]为了实现上述目的,本专利技术可采用如下提出的技术方案:
[0007]一种译文质量分析方法,包括:
[0008]将待翻译原文拆分为若干个段落单元,对每个段落单元生成多个翻译参考段落,对每个翻译参考段落进行评级并赋予级值;对翻译参考段落进行排列组合生成若干个参考文档,以参考文档内所有翻译参考段落的级值之和作为该参考文档的评级分数;
[0009]将待评价译文对应拆分为相同数量的待分析段落单元,并按照每个段落分别对应核对翻译的近似程度,确定最接近的参考文档,以参考文档的评级分数作为待评价译文的初始分数;
[0010]将待分析段落单元与翻译参考段落单元进行匹配对应,以翻译参考段落单元的级值作为待分析段落单元的段落单元值,并对比翻译参考段落单元后获取待分析段落单元的正向值和负向值,以段落单元值、正向值和负向值之和作为段落的评定分数,并以所有待分析段落单元的评定分数之和作为译文的评定分数。
[0011]上述公开的译文质量分析方法,通过率先生成若干种原文的翻译参考文档,并对每种翻译参考文档进行评级以确定不同翻译方式的质量高低;再对待评估的译文进行级别匹配,得到对应级别的初始分数,在对应级别的翻译中,根据待评价译文与参考译文的差
异,通过正向值和负向值对待分析译文进行评定分数调整,得到最终的译文质量评分。这种质量评估方式,不以单独的参考译文作为标准,而是考虑到不同的翻译风格和翻译方式,多种译文风格均能够得到客观合理的评估认定,可靠性更高。
[0012]进一步的,本专利技术在处理待翻译原文时,按照逐个段落单元进行处理并获得其翻译参考段落,并将待评估的段落单元与翻译参考段落进行对应分析,同时,翻译参考段落的语言与待评价译文的语言相同,通过识别待评价译文的语言后决定翻译参考段落的语言。具体的,本专利技术采用的方式为:在将待翻译原文拆分为多个段落单元并生成翻译参考段落之前,识别待评价译文的语种,当待评价译文包括两种以上的语种时,以每种语种的字数确定其权重并将权重最大的语种作为目标语种,其余的语种作为附加语种。采用如此方案时,以目标语种作为参考译文的语种并对原文进行翻译。
[0013]进一步的,整个文段划分为多个段落单元进行逐个评分,段落单元之间存在一定的差异,因此评分需要划定权重占比,将更为重要的段落占比加大,而将相对重要性较低的的段落权重占比减小;设置权重的方式并不唯一限定,本专利技术中进行优化后举出如下一种具体可行的选择:根据每个段落单元的字数确定权重,以每个段落单元的字数在总字数的占比作为该段落单元的权重值。采用如此方案时,段落单元内容越多的,权重却大,段落单元内容越少的,权重越小。
[0014]进一步的,在本专利技术中,具体评价每个段落单元的级值时,按照具体的段落表达组成进行评分,在此处进行优化并举出如下一种可行的选择:在评价每个翻译参考段落并赋予级值时,对应生成每个翻译参考段落的句法树,根据不同的句法树赋予一评价基值,评价基值与该翻译参考段落的权重值求积后得到级值。采用如此方案时,预设有若干种句法树并对应进行了基值的赋值,因此翻译参考段落的句法树一经确定,则会对该翻译参考段落进行基值的确定,进而可确定该翻译参考段落的级值。同时,参考文档的评级分数满分为100分,即每个翻译参考段落的标准分值之和为100分,但根据不同的翻译方法,一个段落单元所得到的多个翻译参考段落分数有差异,故参考文档的评级分数存在差异,多数参考文档的评级分数低于100分。
[0015]进一步的,为了对比参考文档与待评价译文之间的翻译可懂性,通过问答的形式考察待评价译文的实质翻译内容,通过问答的形式获取到译文中的实质性内容。具体的,在本专利技术中可采用如下一种选择:训练得到自动问答模型,将待分析段落单元与翻译参考段落单元分别输入到自动问答模型中,获取多组问答结果并对比问答结果的一致性;当待分析段落单元的问答结果异于翻译参考段落单元的问答结果,为待分析段落单元记负向值,且当待分析段落单元的问答结果与参考段落单元的问答结果一致,为待分析段落单元记正向值;当待分析段落单元的问答结果组数异于翻译参考段落单元的问答结果组数,为待分析段落单元记负向值,且当待分析段落单元的问答结果组数等于翻译参考段落单元的问答结果组数,为待分析段落单元记正向值。采用如此方案时,表示待分析的译文内容与参考文档内容中实质性内容相似性高低,当相似度越高时,问答结果一致性越高,对待评价译文的评分结果越精确。
[0016]进一步的,为了对比参考文档与待评估文档的表达方式一致性,确定待评价译文的描述丰富性,对此可采用多种可行的方案,本专利技术进行优化并举出其中一种可行的选择:训练得到复述编码模型,将待分析段落单元和翻译参考段落单元分别输入复述编码模型,
分别统计语句表达方式的种类数,当待分析段落单元的语句表达方式种类数与翻译参考段落单元的语句表达方式种类数差值在预设的范围内时,为待分析段落单元记正向值,否则记负向值。采用如此方案时,可对翻译参考段落的每个句子进行分析并确定其采用了何种语言表达方式,并进行种类统计;同时对待评价译文的段落单元按照逐句分析的方式确定其采用的语言表达方式,并进行种类统计,因此可确定待评价译文的段落单元与参考译文的段落单元在表达方式上的近似程度,近似程度越高的评分会越高,否则越低。
[0017]进一步的,段落单元对应的多种翻译方式中,使每个段落单元生成多种翻译参考段落时,参考不同的翻译模式以实现翻译参考单元的生成,在本专利技术中,进行优化改进并举出如下一种可行的选择:对每个段落单元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种译文质量分析方法,其特征在于,包括:将待翻译原文拆分为若干个段落单元,对每个段落单元生成多个翻译参考段落,对每个翻译参考段落进行评级并赋予级值;对翻译参考段落进行排列组合生成若干个参考文档,以参考文档内所有翻译参考段落的级值之和作为该参考文档的评级分数;将待评价译文对应拆分为相同数量的待分析段落单元,并按照每个段落分别对应核对翻译的近似程度,确定最接近的参考文档,以参考文档的评级分数作为待评价译文的初始分数;将待分析段落单元与翻译参考段落单元进行匹配对应,以翻译参考段落单元的级值作为待分析段落单元的段落单元值,并对比翻译参考段落单元后获取待分析段落单元的正向值和负向值,以段落单元值、正向值和负向值之和作为段落的评定分数,并以所有待分析段落单元的评定分数之和作为译文的评定分数。2.根据权利要求1所述的译文质量分析方法,其特征在于:在将待翻译原文拆分为多个段落单元并生成翻译参考段落之前,识别待评价译文的语种,当待评价译文包括两种以上的语种时,以每种语种的字数确定其权重并将权重最大的语种作为目标语种,其余的语种作为附加语种。3.根据权利要求1所述的译文质量分析方法,其特征在于:根据每个段落单元的字数确定权重,以每个段落单元的字数在总字数的占比作为该段落单元的权重值。4.根据权利要求3所述的译文质量分析方法,其特征在于:在评价每个翻译参考段落并赋予级值时,对应生成每个翻译参考段落的句法树,根据不同的句法树赋予一评价基值,评价基值与该翻译参考段落的权重值求积后得到级值。5.根据权利要求1所述的译文质量分析方法,其特征在于:训练得到自动问答模型,将待分析段落单元与翻译参考段落单元分别输入到自动问答模型中,获取多组问答结果并对比问答结果的一致性;当待分析段落单元的问答结果异于翻译参考段落单元的问答结果,为待分析段落单元记负向值,且当待分析段落单元的问答结果与参考段落单元的问答结果一致,为待分析段落单元记正向值;当待分析段落单元的问答结果组数异于翻译参考段落单元的问答结果组数,为待...

【专利技术属性】
技术研发人员:符甜何武平
申请(专利权)人:火星语盟深圳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1