基于人工智能的翻译历史检索方法、装置、设备和介质制造方法及图纸

技术编号:21034815 阅读:22 留言:0更新日期:2019-05-04 05:36
本发明专利技术实施例公开了一种基于人工智能的翻译历史检索方法、装置、设备和介质。该方法包括:接收待翻译原文的翻译历史检索请求;在历史原文与历史译文组成的历史翻译对中,根据待翻译原文与历史原文的字符串相似度,得到第一候选历史翻译对;根据待翻译原文与历史原文的语义相似度,得到第二候选历史翻译对;根据待翻译原文的译文与历史译文的字符串相似度,得到第三候选历史翻译对;从第二候选历史翻译对和/或第三候选历史翻译对,以及第一候选历史翻译对中选择与待翻译原文匹配的目标历史翻译对。利用上述技术方案能够将与原文含义相同,但表达不同的历史翻译结果展现给译员,避免将字面相似但含义相差很远的历史翻译结果展现给译员。

Artificial Intelligence-based Translation History Retrieval Method, Device, Equipment and Media

【技术实现步骤摘要】
基于人工智能的翻译历史检索方法、装置、设备和介质
本专利技术实施例涉及计算机辅助翻译领域,尤其涉及一种基于人工智能的翻译历史检索方法、装置、设备和介质。
技术介绍
计算机辅助翻译是一种利用机器翻译技术帮助专业译员进行文献翻译的系统,同时提供对译员历史翻译数据进行存储和管理的功能。对译员来说,最核心的数据是历史翻译数据,高质量译文是译员通过长期的积累得到的,当遇到相似的句子时,历史翻译信息可以带给译员很多参考信息。同时,因为找到两句完全一样的原文句子的情况很少,所以一般在检索的时候会采用模糊搜索的形式,即会找到一些相似的句子提供给译员用来参考。这里的模糊搜索一般采用字面匹配的形式,即会找到若干个“长得”比较像的句子。但是原文字面相似和译文相似并不完全等价,比如“今天天气是很好的”和“明天天气会很好吗”两句话从字面上相似度很高,但是英文的译文却很不一样。同时,一些原文完全不同的句子,译文却可能很相似,比如“你好”和“嗨”的英文译文都可以用“hello”。而这两种情况,通过字面匹配都无法很好的解决。
技术实现思路
鉴于上述问题,在本专利技术实施例中提供了一种克服上述问题或者至少部分地解决上述问题的基于人工智能的翻译历史检索方法、装置、设备和介质,以通过查找含义相似的句子而不是字面相似的句子来进行检索,可以将和原文含义相同,但是表达不同的历史翻译结果展现给译员用于参考。第一方面,本专利技术实施例中提供了一种基于人工智能的翻译历史检索方法,所述方法包括:接收待翻译原文的翻译历史检索请求;在历史原文与历史译文组成的历史翻译对中,根据所述待翻译原文与历史原文的字符串相似度,得到第一候选历史翻译对;根据所述待翻译原文与历史原文的语义相似度,得到第二候选历史翻译对;根据所述待翻译原文的译文与历史译文的字符串相似度,得到第三候选历史翻译对;从所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对中选择与所述待翻译原文匹配的目标历史翻译对。第二方面,本专利技术实施例中还提供了一种基于人工智能的翻译历史检索装置,所述装置包括:检索请求接收模块,用于接收待翻译原文的翻译历史检索请求;第一候选翻译模块,用于在历史原文与历史译文组成的历史翻译对中,根据所述待翻译原文与历史原文的字符串相似度,得到第一候选历史翻译对;第二候选翻译模块,用于根据所述待翻译原文与历史原文的语义相似度,得到第二候选历史翻译对;第三候选翻译模块,用于根据所述待翻译原文的译文与历史译文的字符串相似度,得到第三候选历史翻译对;目标翻译确定模块,用于从所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对中选择与所述待翻译原文匹配的目标历史翻译对。第三方面,本专利技术实施例中还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例中任一所述的基于人工智能的翻译历史检索方法。第四方面,本专利技术实施例中还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术实施例中任一所述的基于人工智能的翻译历史检索方法。本专利技术实施例中提供了一种基于人工智能的翻译历史检索方法,包括:接收待翻译原文的翻译历史检索请求;在历史原文与历史译文组成的历史翻译对中,根据所述待翻译原文与历史原文的字符串相似度,得到第一候选历史翻译对;根据待翻译原文与历史原文的语义相似度,得到第二候选历史翻译对;根据所述待翻译原文的译文与历史译文的字符串相似度,得到第三候选历史翻译对;从所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对中选择与所述待翻译原文匹配的目标历史翻译对。采用本专利技术实施例中提供的上述技术方案,能够理解语句的含义,通过查找含义相似的句子而不是字面相似的句子来进行检索,可以将和原文含义相同,但是表达不同的历史翻译结果展现给译员用于参考,可以避免将字面相似但是含义相差很远的历史翻译结果展现给译员。并且,还通过译文相似的句子来进行检索,可以将原文不同但是译文相同的历史翻译结果展现给译员参考。上述
技术实现思路
仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例中提供的一种基于人工智能的翻译历史检索方法的流程图;图2是本专利技术实施例中提供的一种基于人工智能的翻译历史检索装置的结构示意图;图3是本专利技术实施例中提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。图1是本专利技术实施例中提供的一种基于人工智能的翻译历史检索方法的流程图,本实施例可适用于采用计算机辅助翻译方式辅助译员检索翻译历史的情况,例如,辅助译员检索与待翻译原文含义相同的翻译历史,并根据检索的翻译历史辅助译员对待翻译原文进行原文翻译的场景。该方法可以由基于人工智能的翻译历史检索装置来执行,该装置可以采用软件和/或硬件的方式实现,并集成在任何具有网络通信功能的设备上。该设备可以为终端设备或服务器,其中终端设备可以包括但不限于手机、平板电脑或者翻译器等。如图1所示,本专利技术实施例中的基于人工智能的翻译历史检索方法可以包括:S101、接收待翻译原文的翻译历史检索请求。在本实施例中,待翻译原文可以是指需要译员进行翻译的原文,译员需要将待翻译原文从当前语言类型翻译成其他的语言类型,比如将待翻译原文从英文翻译成中文。在对待翻译原文进行翻译处理过程中,历史翻译数据对于译员来说是非常重要的。当译员遇到与历史翻译数据相似的待翻译原文时,译员可以通过参考历史翻译数据对待翻译原文进行快速翻译。在本实施例中,基于上述情形,本实施例中提供了一种基于人工智能的翻译历史检索方案,当译员需要对待翻译原文进行翻译处理时,可以向基于人工智能的翻译历史检索装置发送待翻译原文的翻译历史检索请求。基于人工智能的翻译历史检索装置可以接收译员发送的待翻译原文的翻译历史检索请求。S102、在历史原文与历史译文组成的历史翻译对中,根据待翻译原文与历史原文的字符串相似度,得到第一候选历史翻译对。在本实施例中,当基于人工智能的翻译历史检索装置接收到待翻译原文的翻译历史检索请求时,可本文档来自技高网
...

【技术保护点】
1.一种基于人工智能的翻译历史检索方法,其特征在于,包括:接收待翻译原文的翻译历史检索请求;在历史原文与历史译文组成的历史翻译对中,根据所述待翻译原文与历史原文的字符串相似度,得到第一候选历史翻译对;根据所述待翻译原文与历史原文的语义相似度,得到第二候选历史翻译对;根据所述待翻译原文的译文与历史译文的字符串相似度,得到第三候选历史翻译对;从所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对中选择与所述待翻译原文匹配的目标历史翻译对。

【技术特征摘要】
1.一种基于人工智能的翻译历史检索方法,其特征在于,包括:接收待翻译原文的翻译历史检索请求;在历史原文与历史译文组成的历史翻译对中,根据所述待翻译原文与历史原文的字符串相似度,得到第一候选历史翻译对;根据所述待翻译原文与历史原文的语义相似度,得到第二候选历史翻译对;根据所述待翻译原文的译文与历史译文的字符串相似度,得到第三候选历史翻译对;从所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对中选择与所述待翻译原文匹配的目标历史翻译对。2.根据权利要求1所述的方法,其特征在于,根据所述待翻译原文与历史原文的语义相似度,得到第二候选历史翻译对,包括:确定所述待翻译原文的语义向量,以及历史原文的语义向量;根据所述待翻译原文的语义向量,与所述历史原文的语义向量之间的语义相似度,得到第二候选历史翻译对。3.根据权利要求1所述的方法,其特征在于,从所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对中选择与所述待翻译原文匹配的目标历史翻译对,包括:对所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对进行排序;根据排序结果,确定与所述待翻译原文匹配的目标历史翻译对。4.根据权利要求3所述的方法,其特征在于,对所述第二候选历史翻译对和/或所述第三候选历史翻译对,以及所述第一候选历史翻译对进行排序,包括:根据所述待翻译原文和各候选历史翻译对中各候选历史原文的主成分,片段匹配关系和相似度中的至少一种特征,对各候选历史翻译对进行排序。5.一种基于人工智能的翻译历史检索装置,其特征在于,包括:检索请求接收模块,用于接收待翻译原文的翻译历史检索请求;第一候选翻译模块,用于在历史原文与历史译文组成的历史翻译对中,根据所述待...

【专利技术属性】
技术研发人员:王一鸣张睿卿何中军吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1