【技术实现步骤摘要】
翻译质量的评估方法、翻译检查方法及装置
本专利技术涉及翻译
,特别涉及一种翻译质量的评估方法、翻译检查方法及装置。
技术介绍
随着与日俱增的海外业务,阿里翻译提供了多语言双向翻译服务,例如支持英语到其他语言,中文到其他多种语言的双向的机器和人工翻译工作。其中,机器翻译是借由计算机程序将文字从一种自然语言翻译成另外一种自然语言。机器翻译中的一个重难点在于术语的翻译,如何主动发现错译的术语,对其快速修正,业务价值巨大。术语是在特定学科领域用来表示概念的称谓的集合,具备一定的专业性。双语术语是指由两种语言组成的互译的两个术语,当然,如果是多语种翻译的场景下,其中每两种语言的对应术语可组成双语术语,传统方案通常基于词汇翻译概率来计算双语术语的翻译概率。常见流程如下:1.构建双语词表。利用大量双语句对,例如:今天天气很好→It'sanicedaytoday,先对句子进行分词,然后基于分词后双语句对做词对齐,计算词汇翻译概率,最终获得词表条目,如:“apple苹果0.8,0.6”(表示英文词“app ...
【技术保护点】
1.一种翻译质量的评估方法,其特征在于,包括:/n分别获取与源文和译文对应的至少一张图片;/n分别确定源文对应的各图片与译文对应的各图片之间的相似度;/n至少根据确定出的源文对应的各图片与译文对应的各图片之间的相似度,确定所述源文和译文的翻译质量分值。/n
【技术特征摘要】
1.一种翻译质量的评估方法,其特征在于,包括:
分别获取与源文和译文对应的至少一张图片;
分别确定源文对应的各图片与译文对应的各图片之间的相似度;
至少根据确定出的源文对应的各图片与译文对应的各图片之间的相似度,确定所述源文和译文的翻译质量分值。
2.如权利要求1所述的方法,其特征在于,分别获取源文和译文对应的至少一张图片,包括:
分别根据所述源文和所述译文,通过搜索引擎搜索所述源文和所述译文对应的图片;
从所述搜索结果中,分别确定源文和译文对应的图片;
分别生成源文和译文与对应图片列表的关联关系数据。
3.如权利要求2所述的方法,其特征在于,分别确定源文对应的各图片与译文对应的各图片之间的相似度,具体包括:
根据源文和译文的对应关系,以及源文和译文与对应图片列表的关联关系数据,确定源文对应的图片列表和译文对应的图片列表的关联关系;
根据确定出所述关联关系,对源文对应的图片列表和译文对应的图片列表进行笛卡尔乘积运算,得到所述源文和译文组成的双语术语的至少一组图片对;
将每个图片对中两个图片进行相似度匹配,确定所述图片对的相似度值。
4.如权利要求3所述的方法,其特征在于,根据确定出的源文对应的各图片与译文对应的各图片之间的相似度,确定所述源文和译文的翻译质量分值,具体包括:
将所述双语术语对应的所有图片对的相似度值进行平滑处理及加权平均,拟合得到所述双语术语的翻译质量分值。
5.如权利要求3或4所述的方法,其特征在于,所述相似度匹配,包括下述一项或多项匹配方式:
利用卷积神经网络,对所述图片对中的两个图片的相似度进行计算,得到所述图片对的相似度值;
利用尺度不变特征变换,对所述图片对中的两个图片的相似度进行计算,得到所述图片对的相似度值;
将所述图片对中的两个图片进行向量化,得到图片对应的特征向量,对两个图片的特征向量进行欧式距离计算,得到所述图片对的相似度值。
6.一种翻译检查方法,其特征在于,包括:
根据源文和译...
【专利技术属性】
技术研发人员:吕晓雨,施杨斌,赵宇,骆卫华,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。