一种机器翻译的方法和装置制造方法及图纸

技术编号:7577402 阅读:226 留言:0更新日期:2012-07-18 23:47
本发明专利技术公开了一种机器翻译的方法及装置,其中,该方法包括:输入第一语言的文本;选择第一语言和第二语言对应的解码信息文件;根据选择的解码信息文件对所述第一语言的文本进行解码,得到第二语言的文本。本发明专利技术的机器翻译的方法和装置,能够根据输入的第一语言文本,在无需了解任何语言的语法规则的情况下,将任意两种语言进行互译,而且可以在没有网络的情况下使用。

【技术实现步骤摘要】

本专利技术涉及机器翻译
,具体地,涉及一种机器翻译的方法和装置
技术介绍
现在手持式消费类电子产品,如电子词典,数码学习机上由于受存储容量,CPU速度等硬件条件限制,所使用的全句翻译技术是基于规则的方法。目前市场上电子词典中的全句翻译技术以英中互译为主,可以在没有网络的情况下使用。智能手机如苹果公司的产品也有多语言全句翻译技术,但是必须在有网络的情况下使用,先把要翻译的文本发送到服务器,由服务器进行翻译,然后再把结果返回。以英中翻译为例,要把英文句子“They built too many buildings lastyear. ” 翻译为中文,我们先要从英文语法的角度分析该句子,可得出结果=They是主语,built是谓语,too many是作形容词修饰可数的buildings, buildings是宾语,last year是状语, 是一个典型的主语+谓语+宾语+状语的结构!这个结构对应于中文的主语+状语+谓语 +宾语的结构,生成对应的中文句子为“他们去年建起了好多建筑。”基于规则的方法可以在硬件受限的条件下使用,它可以占用较少的内存,在较慢的CPU上运行。对于符合语法规则的句子,可以取得比较好的翻译结果,但是也有很多缺点。一方面,基于规则的方法能互译的语言数目有限,假设要开发语言X与语言y的互译程序,我们必须归纳出各自的规则,对于广泛使用的语言,如中文与英文,做到这一点尚有可能,对于规则复杂的语言如法文,小语种如阿拉伯文,要归纳出相应的规则,若无巨大的人力财力投入,基本上是不可能的,而这些语言恰恰需要翻译。另一方面,许多语言的口语,就是不符合语言的规则的,但是在日常生活中又广泛使用,如中文就有人把“你先走”讲为“你走先”,还有一些网络用语如把“什么”讲为“神马”, 碰到这种情况,基于规则的方法就无能为力了。随着微电子技术的飞速发展,存储空间越来越大,CPU速度越来越快,甚至小容量的存储器,低速率的CPU已经退出市场,以现在的硬件来运行基于规则的翻译简直是大材小用。
技术实现思路
本专利技术的目的是针对现有技术中基于规则的翻译方法以及需要网络进行翻译的缺陷,提出一种机器翻译的方法及装置,能够在无需了解任何语言的语法规则的情况下,将任意两种语言进行互译,而且可以在没有网络的情况下使用。为实现上述目的,根据本专利技术的一个方面,提供了一种机器翻译的方法。根据本专利技术实施例的一种机器翻译的方法,包括输入第一语言的文本;选择第一语言和第二语言对应的解码信息文件;根据选择的解码信息文件对所述第一语言的文本进行解码,得到第二语言的文本。在上述技术方案中,优选地,对输入第一语言的文本进行规格化处理。在上述技术方案中,优选地,所述第一语言和第二语言都不是英语时,选择第一语言和英语对应的解码信息文件对第一语言的文本进行解码,得到英语语言的文本;再选择英语和第二语言对应的解码信息文件,对得到的英语语言的文本进行解码,得到第二语言的文本。为实现上述目的,根据本专利技术的另一个方面,提供了一种机器翻译的装置。根据本专利技术实施例的一种机器翻译的装置,包括输入模块,用于输入第一语言的文本,并发送给选择模块和解码模块;选择模块,根据接收到的第一语言的文本和需要翻译的第二语言的名称,选择第一语言和第二语言对应的解码信息文件,并将所述第一语言的文本和所述解码信息文件发送给解码模块;解码模块,用于根据接收到的第一语言文本和解码信息文件对所述第一语言的文本进行解码,得到第二语言的文本。在上述技术方案中,所述输入模块还用于,将输入第一语言的文本发送给规格化处理模块;规格化处理模块用于,对接收到的所述第一语言的文本进行规格化处理,并将第一语言的规格化处理文本发送给解码模块;所述解码模块还用于,对接收到的第一语言的规格化处理文本进行解码,得到第二语言的文本。在上述技术方案中,所述选择模块还用于,当所述第一语言和第二语言都不是英语时,选择第一语言和英语对应的解码信息文件以及英语和第二语言对应的解码信息文件。在上述技术方案中,所述解码模块还用于,当所述第一语言和第二语言都不是英语时,根据第一语言和英语对应的解码信息文件对输入的第一语言文本进行解码,得到英语语目的文本;再根据英语和第二语言对应的解码信息文件对得到的英语语言的文本进行解码, 得到第二语言的文本。本实施例的机器翻译的方法和装置,能够在无需了解任何语言的语法规则的情况下,将任意两种语言进行互译,而且可以在没有网络的情况下使用,使得使用者能够方便快捷地将第一语言翻译为第二语言。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中图I为本专利技术的一种机器翻译的方法的实施例流程图。图2为本专利技术的一种机器翻译的装置的实施例一的结构图。图3为本专利技术的一种机器翻译的装置的实施例二的结构图。具体实施例方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。本专利技术的一种机器翻译的方法和装置,通过对输入的第一语言文本的规格化处理,选择与第一语言和第二语言相对应的解码信息文件,通过选择的解码信息文件对规格化处理后的文本进行解码,得到第二语言文本。通过在电子词典、手机等手持式电子设备的 NandFlash中事先存储解码程序以及包括多个任意两种语言的解码信息文件的解码信息库,使用者能够在没有Internet网或者其他网络的情况下,将两种语言的文本实时进行翻译。方法实施例如图I所示,根据本专利技术实施例,提供了一种机器翻译的方法,包括步骤101 :输入第一语言的文本;步骤102 :把解码程序TextTranslateProgram. bin从文件系统中调入SDRAM,并运行;步骤103 :选择第一语言和第二语言对应的解码信息文件,例如如果选择英中互译,则打开EngChiTT. bin解码信息文件;步骤104 :接受输入的第一语言的文本,根据第一语言的种类进行规格化处理,例如输入为英文“What,s your father ”规格化处理后为“Whatis your father ”不同的语言有不同的规格化程序;步骤105 :解码程序TextTranslateProgram. bin开始分析规格化的文本,尝试任意单词的不同顺序的所有组合,根据所选择的EngChiTT. bin解码信息文件,生成第二语言文本,其中概率最大者即为翻译结果,如上例就要尝试以下组合,“What is your father 什么是你的父亲? ”“Whatyour is father 什么你的是父亲? ”“What father is your 什么父亲是你的? ”最后根据所选择的解码信息文件确定“什么是你的父亲? ”为概率最大者,即为翻译结果。在该方法实施例中,任何语言都共用一个解码程序,命名为 TextTranslatePr本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:忻尚明
申请(专利权)人:东莞康明电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术