一种辅助翻译中处理术语的方法技术

技术编号:25440325 阅读:21 留言:0更新日期:2020-08-28 22:28
本说明书实施例提供一种辅助翻译中处理术语的方法。该方法包括:获取第一文本中的一个第一术语;获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;获取所述第一术语与每一个所述候选词组的相似度,确定作为第二术语的候选词组;对所述第二术语进行以下操作的一种或多种:显示所述第二术语,标识所述第二术语,用第三术语替换第二术语。

【技术实现步骤摘要】
一种辅助翻译中处理术语的方法
本说明书涉及翻译
,特别涉及一种辅助翻译中处理术语的方法。
技术介绍
在翻译项目中,技术资料的翻译经常会涉及到大量的专业术语。使用机器翻译技术虽然速度快、效率高,但是当源语言文件存在某一领域专业术语时,机器翻译的结果可能存在不准确的情况,还是需要通过人工进行进一步检查并替换为准确的译文。同时,在源语言文件中,同一个专业术语对应同一个特定的技术概念或者专有名词,然而,由于上下文语境等原因,同一个专业术语在译文中可能存在不同的翻译,需要人工检查并替换为统一的术语对应的翻译。因此,期望提供一种辅助翻译中处理术语的方法,以保证专业术语译文的一致性,从而提高翻译效率。
技术实现思路
本说明书实施例之一提供一种辅助翻译中处理术语的方法。所述辅助翻译中处理对应术语的方法包括:获取第一文本中的一个第一术语;获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;获取所述第一术语与每一个所述候选词组的相似度,确定作为第二术语的候选词组;对所述第二术语进行以下操作的一种或多种:显示所述第二术语,标识所述第二术语,用第三术语替换第二术语。在一些实施例中,所述方法还包括:在多个源文本单元中查找所述第一术语,其中,所述源文本单元使用与第一文本对应的语言,且包含不同于所述第一文本的内容;对包含所述第一术语的每一个所述源文本单元,将其对应的目标文本单元作为所述第二文本,获取所述目标文本单元中的第二术语,所述目标文本单元使用与所述第二文本对应的语言;如果对多个所述目标文本单元中的所述第二术语进行替换,所使用的所述第三术语相同。在一些实施例中,所述相似度的获取方法包括:基于所述第一术语通过自动翻译模型获取第四术语,所述第四术语所用语言为所述第二文本所对应的语言;基于所述第四术语和所述候选词组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量;基于所述源术语向量与每一个所述候选词组向量的向量距离确定相似度。在一些实施例中,所述相似度的获取方法包括:基于所述第一术语和所述候选词组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量确定相似度;基于所述源术语向量与每一个所述候选词组向量,通过相似度模型确定相似度;其中,所述相似度模型为机器学习模型。在一些实施例中,所述确定作为第二术语的候选词组包括:将所述相似度符合预设条件的一个或多个所述候选词组作为候选术语,获取用户输入确定所述第二术语。本说明书实施例之一提供一种辅助翻译中处理术语的系统,该系统包括:用于存储计算机指令的至少一个存储器;与所述存储器通讯的至少一个处理器,其中当所述至少一个处理器执行所述计算机指令时,所述至少一个处理器使所述系统执行:获取第一文本中的一个第一术语;获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;获取所述第一术语与每一个所述候选词组的相似度,确定作为第二术语的候选词组;对所述第二术语进行以下操作的一种或多种:显示所述第二术语,标识所述第二术语,用第三术语替换第二术语。在一些实施例中,所述至少一个处理器使所述系统进一步执行:在多个源文本单元中查找所述第一术语,其中,所述源文本单元使用与第一文本对应的语言,且包含不同于所述第一文本的内容;对包含所述第一术语的每一个所述源文本单元,将其对应的目标文本单元作为所述第二文本,获取所述目标文本单元中的第二术语,所述目标文本单元使用与所述第二文本对应的语言;如果对多个所述目标文本单元中的所述第二术语进行替换,所使用的所述第三术语相同。在一些实施例中,为获取所述第一术语与每一个所述候选词组的相似度,所述处理器使所述系统进一步执行:基于所述第一术语通过自动翻译模型获取第四术语,所述第四术语所用语言为所述第二文本所对应的语言;基于所述第四术语和所述候选词组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量;基于所述源术语向量与每一个所述候选词组向量的向量距离确定相似度。在一些实施例中,为获取所述第一术语与每一个所述候选词组的相似度,所述处理器使所述系统进一步执行:基于所述第一术语和所述候选词组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量;基于所述源术语向量与每一个所述候选词组向量,通过相似度模型确定相似度;其中,所述相似度模型为机器学习模型。在一些实施例中,为确定作为第二术语的候选词组,所述处理器使所述系统进一步执行:将所述相似度符合预设条件的一个或多个所述候选词组作为候选术语,获取用户输入确定所述第二术语。本说明书实施例之一提供一种辅助翻译中处理术语的系统,包括:第一获取模块,用于获取第一文本中的一个第一术语;第二获取模块,用于获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;计算模块,用于获取所述第一术语与每一个所述候选词组的相似度;确定模块,用于确定作为第二术语的候选词组;处理模块,用于对所述第二术语进行以下操作的一种或多种:显示所述第二术语,标识所述第二术语,用第三术语替换第二术语。本说明书实施例之一提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行本申请中任一实施例所述的辅助翻译中处理术语的方法。附图说明本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:图1是根据本说明书一些实施例所示的文本辅助处理系统的应用场景图;图2是根据本说明书一些实施例所示的一种辅助翻译中处理术语的方法的示例性流程图;图3是根据本说明书一些实施例所示的确定源文本文件中第二术语的方法的示例性流程图;图4是根据本说明书一些实施例所示的相似度获取方法的示例性流程图;图5是根据本说明书又一实施例所示的相似度获取方法的示例性流程图;图6是根据本说明书一些实施例所示的一种辅助翻译中处理术语的系统的模块图。具体实施方式为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它本文档来自技高网...

【技术保护点】
1.一种辅助翻译中处理术语的方法,其中,包括:/n获取第一文本中的一个第一术语;/n获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;/n获取所述第一术语与每一个所述候选词组的相似度,确定作为第二术语的候选词组;/n对所述第二术语进行以下操作的一种或多种:/n显示所述第二术语,/n标识所述第二术语,/n用第三术语替换第二术语。/n

【技术特征摘要】
1.一种辅助翻译中处理术语的方法,其中,包括:
获取第一文本中的一个第一术语;
获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;
获取所述第一术语与每一个所述候选词组的相似度,确定作为第二术语的候选词组;
对所述第二术语进行以下操作的一种或多种:
显示所述第二术语,
标识所述第二术语,
用第三术语替换第二术语。


2.如权利要求1所述的方法,其中,还包括:
在多个源文本单元中查找所述第一术语,其中,所述源文本单元使用与第一文本对应的语言,且包含不同于所述第一文本的内容;
对包含所述第一术语的每一个所述源文本单元,将其对应的目标文本单元作为所述第二文本,获取所述目标文本单元中的第二术语,所述目标文本单元使用与所述第二文本对应的语言;
如果对多个所述目标文本单元中的所述第二术语进行替换,所使用的所述第三术语相同。


3.如权利要求1所述的方法,其中,所述相似度的获取方法包括:
基于所述第一术语通过自动翻译模型获取第四术语,所述第四术语所用语言为所述第二文本所对应的语言;
基于所述第四术语和所述候选词组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量;
基于所述源术语向量与每一个所述候选词组向量的向量距离确定相似度。


4.如权利要求1所述的方法,其中,所述相似度的获取方法包括:
基于所述第一术语和所述候选词组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量;
基于所述源术语向量与每一个所述候选词组向量,通过相似度模型确定相似度;其中,所述相似度模型为机器学习模型。


5.如权利要求1所述的方法,其中,所述确定作为第二术语的候选词组包括:
将所述相似度符合预设条件的一个或多个所述候选词组作为候选术语,获取用户输入确定所述第二术语。


6.一种辅助翻译中处理术语的系统,其中,包括:
用于存储计算机指令的至少一个存储器;
与所述存储器通讯的至少一个处理器,其中当所述至少一个处理器执行所述计算机指令时,所述至少一个处理器使所述系统执行:
获取第一文本中的一个第一术语;
获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;
获取所述第一术语与每一个所述候选词组的相似度,确定作为第二术语的候选词组;
对所述第二术语进行以下操作的一种或多种:
显示所述第二术语,
标...

【专利技术属性】
技术研发人员:李延叶庆
申请(专利权)人:苏州七星天专利运营管理有限责任公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1