翻译质量确定方法、相关装置及计算机程序产品制造方法及图纸

技术编号:34479563 阅读:16 留言:0更新日期:2022-08-10 08:55
本公开提供了翻译质量确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及自然语言处理、机器翻译、深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取语种不同、语义一致的第一语料和第二语料,将该第二语料中的关键信息替换为疑问词,构建出句式为疑问句的第三语料后,利用翻译模型生成与该第一语料的语义对应、语种与该第二语料相同的第四语料,在该第四语料中确定与该第三语料中疑问点对应的第一结果信息,基于该关键信息与该第一结果信息的相似度生成用于评价该翻译模型的翻译质量的第一评价信息。该实施方式提供了一种翻译质量确定方法,实现了基于语义层面的理解能力对翻译模型的翻译质量进行评价。翻译质量进行评价。翻译质量进行评价。

【技术实现步骤摘要】
翻译质量确定方法、相关装置及计算机程序产品


[0001]本公开涉及计算机
,具体涉及自然语言处理、机器翻译、深度学习等人工智能
,尤其涉及翻译质量确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]同声传译系统、即时翻译系统对翻译质量的要求较高,因此对这类传译、翻译系统的评估一直是一个难题,评估系统需要同时考虑到上下文一致性、连贯性、与原文的翻译忠实度等问题,产出一个对各同传结果的合理评价。
[0003]现有技术中,工作大多采用经典的文本翻译评估方法——双语评估替补法(Bilingual Evaluation Understudy,简称BLEU)进行评价,它计算翻译结果与人工标注的标准翻译结果之间的相似度,返回一个0~1之间的数值后,利用该数值实现评估翻译结果的目的。

技术实现思路

[0004]本公开实施例提出了一种翻译质量确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
[0005]第一方面,本公开实施例提出了一种翻译质量确定方法,包括:获取语种不同、语义一致的第一语料和第二语料;将该第二语料中的关键信息替换为疑问词,构建出句式为疑问句的第三语料;利用翻译模型处理该第一语料,生成与该第一语料对应的第四语料,其中,该翻译模型用于将语料在不同语种之间进行变换,该第四语料与该第二语料的语种相同;在该第四语料中确定与该第三语料中疑问点对应的第一结果信息;基于该关键信息与该第一结果信息的相似度生成用于评价该翻译模型的翻译质量的第一评价信息。
[0006]第二方面,本公开实施例提出了一种翻译质量确定装置,包括:语料获取单元,被配置成获取语种不同、语义一致的第一语料和第二语料;疑问语料构建单元,被配置成将该第二语料中的关键信息替换为疑问词,构建出句式为疑问句的第三语料;语料翻译单元,被配置成利用翻译模型处理该第一语料,生成与该第一语料对应的第四语料,其中,该翻译模型用于将语料在不同语种之间进行变换,该第四语料与该第二语料的语种相同;第一结果信息生成单元,被配置成在该第四语料中确定与该第三语料中疑问点对应的第一结果信息;第一评价信息生成单元,被配置成基于该关键信息与该第一结果信息的相似度生成用于评价该翻译模型的翻译质量的第一评价信息。
[0007]第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的翻译质量确定方法。
[0008]第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的翻译质量确定方法。
[0009]第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的翻译质量确定方法。
[0010]本公开实施例提供的翻译质量确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品,获取语种不同、语义一致的第一语料和第二语料,将该第二语料中的关键信息替换为疑问词,构建出句式为疑问句的第三语料后,利用翻译模型生成与该第一语料的语义对应、语种与该第二语料相同的第四语料,在该第四语料中确定与该第三语料中疑问点对应的第一结果信息,基于该关键信息与该第一结果信息的相似度生成用于评价该翻译模型的翻译质量的第一评价信息。
[0011]本公开基于从与第一语料语义对应的第二语料中替换关键信息为疑问词的方式,构建出句式为疑问句的第三语料,并利用翻译模型对第一语料进行处理、得到与第二语料语种类型相同的第四语料后,基于上述关键信息与在该第四语料中确定与该第三语料中疑问点对应的第一结果信息之间的相似度对翻译模型的翻译质量进行评价,实现了语义层面的翻译模型的翻译质量评价。
[0012]本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
[0014]图1是本公开可以应用于其中的示例性系统架构;
[0015]图2为本公开实施例提供的一种翻译质量确定方法的流程图;
[0016]图3为本公开实施例提供的另一种翻译质量确定方法的流程图;
[0017]图4为本公开实施例提供的在一应用场景下的翻译质量确定方法的流程示意图;
[0018]图5为本公开实施例提供的一种翻译质量确定装置的结构框图;
[0019]图6为本公开实施例提供的一种适用于执行翻译质量确定方法的电子设备的结构示意图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0021]此外,本公开涉及的技术方案中,所涉及的用户个人信息的获取、存储、使用、加工、运输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0022]图1示出了可以应用本公开的翻译质量确定方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
[0023]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0024]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如翻译质量测试类应用、模型远程调试类应用、即时通讯类应用等。
[0025]终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种翻译质量确定方法,包括:获取语种不同、语义一致的第一语料和第二语料;将所述第二语料中的关键信息替换为疑问词,构建出句式为疑问句的第三语料;利用翻译模型处理所述第一语料,生成与所述第一语料对应的第四语料,其中,所述翻译模型用于将语料在不同语种之间进行变换,所述第四语料与所述第二语料的语种相同;在所述第四语料中确定与所述第三语料中疑问点对应的第一结果信息;基于所述关键信息与所述第一结果信息的相似度生成用于评价所述翻译模型的翻译质量的第一评价信息。2.根据权利要求1所述的方法,其中,所述将所述第二语料中的关键信息替换为疑问词,构建出句式为疑问句的第三语料,包括:从所述第一语料中确定至少一个第一关键信息;将所述第二语料中与所述第一关键信息对应的第二关键信息替换为疑问词,构建出句式为疑问句的第三语料。3.根据权利要求2所述的方法,还包括:生成与所述第一结果信息语义相同、语种为所述第一语料的语种的第二结果信息;基于所述第一关键信息与所述第二结果信息的相似度生成用于评价所述翻译模型的翻译质量的第二评价信息。4.根据权利要求3所述的方法,还包括:加权所述第一评价信息和所述第二评价信息,生成第三评价信息。5.根据权利要求1所述的方法,还包括:响应于所述关键信息与所述第一结果信息的相似度低于预设的相似度阈值,获取所述关键信息在所述第二语料中所做语句成分的成分信息;基于所述成分信息生成第四评价信息。6.根据权利要求1

5中任一项所述的方法,还包括:从预先配置的疑问句语句库中提取与所述疑问词对应的疑问句格式模板,其中,所述疑问句格式模板用于指示疑问句中各语句成分的排列顺序;基于所述疑问句格式模板对所述第三语料中各语句成分的排列顺序进行调整,生成优化第三语料。7.一种翻译质量确定装置,包括:语料获取单元,被配置成获取语种不同、语义一致的第一语料和第二语料;疑问语料构建单元,被配置成将所述第二语料中的关键信息替换为疑问词,构建出句式为疑问句的第三语料;语料翻译单元,被配置成利用翻译模型处理所述第一语料,生成与所述第一语料对应的第四语料,其中,所述翻译模型用于将语料在不同语种之间进行变换,所述第四语料与所述第二语料的语种相同;第一结果信息生成单元,被配置成在所述第四语料中确定与所述第三语料中疑问点对应的第一结果信息;第一评价信息生成单...

【专利技术属性】
技术研发人员:张睿卿何中军吴华
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1