一种翻译方法及装置制造方法及图纸

技术编号:16216422 阅读:24 留言:0更新日期:2017-09-15 22:36
本发明专利技术实施例提供一种翻译方法和装置,所述方法包括:获取源语言文本,识别所述源语言文本是否包含固定语义单元;当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过解释所述固定语义单元的含义得到;对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。本发明专利技术实施例可以识别出源语言文本中的固定语义单元,并获取其释义,利用所述释义得到目标语言的翻译结果,准确率高、覆盖范围广。

Translation method and apparatus

The embodiment of the invention provides a translation method and device, the method comprises: acquiring the source language text, whether the identification of the source language text contains fixed semantic unit; when containing a fixed semantic unit identified the source language text, source language interpretation for the fixed semantic unit; the source language the interpretation obtained by interpreting the fixed unit semantic meaning; translation of the source language interpretation, obtained in a target language translation; the target language and the source language belong to different languages. The embodiment of the invention can recognize the fixed semantic unit in the source language text and obtain the interpretation thereof, and the translation result of the target language is obtained by using the interpretation, and the accuracy rate is high and the coverage is wide.

【技术实现步骤摘要】
一种翻译方法及装置
本专利技术实施例涉及计算机
,具体涉及一种翻译方法及装置。
技术介绍
现有技术存在的翻译方法,可以将用户输入的文本从源语言翻译到目标语言,例如从中文翻译到英文。在进行翻译时,用户输入的文本中若存在成语、古诗词、网络热词等较难翻译的部分时,现有技术不能提供准确的翻译结果,例如,当用户输入“空山不见人,但闻人语响”时,现有技术提供的翻译结果为“Nomountains,buthearavoice”。由此可见,现有技术的翻译方法,对于成语、古诗词、网络热词等较难翻译的语句不能够提供准确、理想的翻译结果。
技术实现思路
本专利技术实施例旨在提供一种翻译方法及装置,可以识别出源语言文本中的固定语义单元,并获取所述固定语义单元的源语言释义,利用所述源语言释义得到目标语言的翻译结果,准确率高、覆盖范围广。为此,本专利技术实施例提供如下技术方案:第一方面,本专利技术实施例提供了一种翻译方法,包括:获取源语言文本,识别所述源语言文本是否包含固定语义单元;当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。第二方面,本专利技术实施例提供了一种翻译装置,包括:识别单元,用于获取源语言文本,识别所述源语言文本是否包含固定语义单元;释义单元,用于当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;翻译单元,用于对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。第三方面,本专利技术实施例提供了一种用于翻译的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取源语言文本,识别所述源语言文本是否包含固定语义单元;当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。第四方面,本专利技术实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如第一方面所示的翻译方法。本专利技术实施例提供的翻译方法及装置,可以识别出源语言文本中包含的固定语义单元,并获取所述固定语义单元的源语言释义,利用所述源语言释义得到目标语言的翻译结果,准确率高、覆盖范围广。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的翻译方法流程图;图2为本专利技术一实施例提供的翻译装置示意图;图3是根据另一示例性实施例示出的一种翻译的装置的框图;图4是根据一示例性实施例示出的服务器的框图。具体实施方式现有技术中,当用户输入的源语言文本包含固定语义单元时,例如源语言文本包含古诗词、成语或者网络用语时,往往不能够得到准确的翻译结果。举例说明,用户输入的源语言文本为“我好蓝瘦香菇啊”,现有技术提供的译文为“I'msoblueandthinletinousedodes”,与源语言文本的含义相去甚远。再例如,用户输入的源语言文本为“一叶障目很可怕”,现有技术提供的译文为“Haveaterrible”。由此可见,当在一个句子或段落中出现成语、古文或者网络用语时,现有技术不能提供准确的翻译。申请人经过研究发现,当源语言文本存在生涩难懂的内容时,例如存在成语、古文或者网络用语时,理解源语言文本本身就很难,直接对其翻译则更难。这是因为与此相关的双语训练语料稀少,机器翻译模型较难学会如何翻译。此外,由于成语、古文或者网络用语相对于普通词汇较为精炼,存在许多隐含含义,因此较难翻译。而本专利技术旨在提供一种翻译方法及装置,可以识别出源语言文本中包含的固定语义单元,并获取所述固定语义单元的源语言释义,所述源语言释义是相对简单易懂的表述,再利用所述释义得到目标语言的翻译结果,由此获得的翻译结果准确率高、覆盖范围广。其中,语义单元可以但不限于包括字符、字符串、短语或短句等,例如古诗词、成语或者网络用语等。为了使本
的人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。下面将结合附图1对本专利技术示例性实施例示出的翻译方法进行介绍。参见图1,为本专利技术一实施例提供的翻译方法流程图。如图1所示,可以包括:S101,获取源语言文本,识别所述源语言文本是否包含固定语义单元。具体实现时,源语言文本具体可以为用户输入的待翻译文本。用户还可以通过用户界面选择需要翻译为的目标语言,翻译结果使用目标语言表示。一般地,源语言与目标语言属于不同语种。本专利技术可以识别源语言文本中包含的固定语义单元。本专利技术可以预先建立语义单元库,用于存储预设的语义单元。在识别源语言文本是否包含固定语义单元时,可以将所述源语言文本与语义单元库中包括的预设语义单元进行匹配;若存在匹配结果,确定所述源语言文本中包含固定语义单元。其中,所述固定语义单元包括成语、网络用语、古诗词或者歇后语。举例说明,用户输入的源语言文本为中文句子“我好蓝瘦香菇”时,可以将源语言文本与预设的固定语义单元库中的语义单元进行匹配,当源语言文本中存在或者包括与预设的固定语义单元匹配的语义单元时,例如“蓝瘦香菇”,可以对识别出的语义单元“蓝瘦香菇”进行标记,进而在S102中获取进行标记的语义单元的释义。又如,用户输入的源语言文本为中文句子“无为在歧路,儿女共沾巾”时,将源语言文本与语义单元库中的语义单元进行匹配,存在匹配结果“无为在歧路,儿女共沾巾”,这时可以标记匹配结果,将其作为S102的输入,获取相应释义。又如,用户输入的源语言文本为中文句子“一叶障目很可怕”时,可以识别出所述源语言文本存在成语“一叶障目”。需要说明的是,只要源语言文本中的部分语义单元与语义单元库中的语义单元匹配,即可以确定存在匹配结果。S102,当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到。其中,所述源语言释义与所述固定语义单元属于同一语种且所述释义由基本词汇构成。需要说明的是,本专利技术实施例可以将复杂的源语言文本转换为较简单的源语言释义,再将源语言释义翻译为目标语言,大大降低了翻译的复杂度,提高了翻译的准确性。其中,释义与源语言文本属于同一语种。释义通过解释所述固定语义单元的含义得到。所述释义与所述固定语义单元属于同一本文档来自技高网
...
一种翻译方法及装置

【技术保护点】
一种翻译方法,其特征在于,包括:获取源语言文本,识别所述源语言文本是否包含固定语义单元;当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。

【技术特征摘要】
1.一种翻译方法,其特征在于,包括:获取源语言文本,识别所述源语言文本是否包含固定语义单元;当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。2.根据权利要求1所述的方法,其特征在于,所述识别所述源语言文本是否包含固定语义单元包括:将所述源语言文本与预设语义单元库中包括的语义单元进行匹配;若存在匹配结果,确定所述源语言文本中包含固定语义单元。3.根据权利要求1所述的方法,其特征在于,所述获取所述固定语义单元的源语言释义包括:利用预先建立的释义翻译模型对所述固定语义单元进行解释,得到与所述固定语义单元对应的源语言释义;和/或,利用预先建立的释义挖掘模型从网络上获取与所述固定语义单元匹配的源语言释义。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用固定语义单元及与其匹配的源语言释义的同语语料,训练得到释义翻译模型。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:建立释义挖掘模型,所述释义挖掘模型用于从网络上获取语义单元的同语言释义。6.根据权利要求1所述的方法,其特征在于,所述固定语义单元包括成语、网络用语、古诗词或者歇后语。7.根据权利要求1、3或6所述的方法,其特征在于,所述获取所述固定语义单元的源语言释义包括:当所述固定语...

【专利技术属性】
技术研发人员:王小川许静芳翟飞飞方菲戴磊薛征山张骏
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1