当前位置: 首页 > 专利查询>林勋准专利>正文

一种机器翻译方法及系统技术方案

技术编号:3869211 阅读:217 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种机器翻译方法及系统,包括:获取待翻译的第一语种的语句;识别所述第一语种的语句的主语词组、谓语词组和宾语词组;翻译所述第一语种的语句的主语词组、谓语词组和宾语词组为第二语种的主语词组、谓语词组和宾语词组;按照所述第二语种的语言表达方式排布所述第二语种的主语词组、谓语词组和宾语词组,形成为第二语种的语句。本发明专利技术的方法和系统,通过识别第一语种格式语句中的主语词组、谓语词组和宾语词组,再相应的将其翻译成第二语种的主语词组、谓语词组和宾语词组并按第二语种的语言表达方式进行排布,使得翻译能够符合语义逻辑,从而得到高质量的译文,真正使机器翻译方法和系统成为一种可信的实用翻译工具。

【技术实现步骤摘要】

本专利技术涉及一种机器翻译方法及系统
技术介绍
语言是人类相互交流中使用最广泛的工具,然而,不同民族、不同国家之间常常 使用着不同的语言,这阻碍了人们直接进行意思交换,而需要借助于翻译来达成不同 语言之间的相互意思传递。随着世界各国人民之间的交流的日益频繁,单纯依靠人力 翻译显然无法满足人们相互交流的需要,机器翻译应运而生。机器翻译一直被认为是突破语言障碍的主要途径,然而,现今的机器翻译尚无法 成为一种可信的信息交流工具。在相当多的情况下,机器翻译系统的译文不知所云, 令人无法得知对方真实表达的意思。机器翻译的质量亟待提高。
技术实现思路
有鉴于上述背景,本专利技术的目的是提供一种机器翻译方法和系统,能够得到高质 量的译文,从而使机器翻译真正成为一种可信的语言交流工具。 为了解决上述技术问题,本专利技术采用了如下技术方案 一种机器翻译方法,包括 获取待翻译的第一语种的语句;识别所述第一语种的语句的主语词组、谓语词组和宾语词组;翻译所述第一语种的语句的主语词组、谓语词组和宾语词组为第二语种的主语词 组、谓语词组和宾语词组;按照所述第二语种的语言表达方式排布所述第二语种的主语词组、谓语词组和宾 语词组,形成为第二语种的语句。所述的方法,还包括识别所述第一语种的语句中是否包含连接词,以及翻译该 连接词为第二语种的连接词。所述的方法,识别所述第一语种的语句的主语词组、谓语词组和宾语词组的方式 是识别所述语句的主语词组、谓语词组和宾语词组是否标记有词组标记符。所述的方法,还包括识别所述第一语种的语句的主语词组是否包括主语修饰语, 识别所述第一语种的语句的谓语词组是否包括谓语修饰语,识别所述第一语种的语句 的宾语词组是否包括宾语修饰语。所述的方法,识别所述主语修饰语、谓语修饰语或宾语修饰语的方式是识别主语词组、谓语词组或宾语词组中是否标记有修饰语标记符。所述的方法,还包括识别所述第一语种的语句是否包含问句。所述的方法,识别所述第一语种的语句是否包含问句的方式是识别主语词组、谓语词组或宾语词组后面是否有提问标记符。所述的方法,识别后的所述第一语种的语句按如下格式顺序排列主语、主语的提问标识符、主语修饰语、谓语、谓语的提问标记符、谓语修饰语、宾语、宾语的提问标识符、宾语修饰语;当所述主语、主语的提问标识符、主语修饰语、谓语、谓语的提问标记符、谓语修饰语、宾语、宾语的提问标识符、宾语修饰语中的一种或多种缺失时,在排列时相应置空。所述的方法,所述主语修饰语、谓语修饰语、宾语修饰语在排列时,分别位于一括号内。所述的方法,在获取待翻译的第一语种的语句之前,还可以包括 接收从输入接口输入的第一语种的自然语句;识别第一语种的每一个自然语句是否包含主语词组、谓语词组和宾语词组,如果 不是,则将该语句补充成包括主语词组、谓语词组和宾语词组的完整结构,形成为待 翻译的第一语种的语句。也可以包括下述标记过程的一种或多种为第一语种的主语词组、谓语词组和宾语词组标记上词组标记符; 为第一语种的主语词组中的主语修饰语、谓语词组中的谓语修饰语之间、宾语词组中的宾语修饰语标记上修饰语标记符;对包含问句的第一语种的语句,为被提问的主语词组、谓语词组或宾语词组标记上提问标记符。本专利技术还公开了一种机器翻译系统,包括 获取单元,用于获取待翻译的第一语种的语句;识别单元,用于识别所述第一语种的语句的主语词组、谓语词组和宾语词组; 翻译单元,用于翻译所述第一语种的语句的主语词组、谓语词组和宾语词组为第 二语种的主语词组、谓语词组和宾语词组;成形单元,用于按照所述第二语种的语言表达方式排布所述第二语种的主语词组、谓语词组和宾语词组,形成为第二语种的语句。所述的系统,所述识别单元还用于识别所述第一语种的语句中的连接词,所述翻 译单元还用于翻译所述第一语种的语句中的连接词。所述的系统,识别单元识别所述第一语种的语句的主语词组、谓语词组和宾语词组的方式是识别所述语句的主语词组、谓语词组和宾语词组是否标记有词组标记符。 所述的系统,识别单元还用于识别所述第一语种的语句的主语词组是否包括主语修饰语,识别所述第一语种的语句的谓语词组是否包括谓语修饰语,识别所述第一语种的语句的宾语词组是否包括宾语修饰语。所述的系统,识别单元识别所述主语修饰语、谓语修饰语或宾语修饰语的方式是识别主语词组中是否标记有修饰语标记符、识别谓语词组中是否标记有修饰语标记符、识别宾语词组中是否标记有修饰语标记符。所述的系统,识别单元还用于识别所述第一语种的语句是否包含问句。所述的系统,识别单元识别所述第一语种的语句是否包含问句的方式是识别主 语词组、谓语词组或宾语词组后面是否有提问标记符。所述的系统,还包括排列单元,用于将识别后的所述第一语种的语句按如下格式 顺序排列主语、主语的提问标识符、主语修饰语、谓语、谓语的提问标记符、谓语 修饰语、宾语、宾语的提问标识符、宾语修饰语;当所述主语、主语的提问标识符、 主语修饰语、谓语、谓语的提问标记符、谓语修饰语、宾语、宾语的提问标识符、宾 语修饰语中的一种或多种缺失时,在排列时相应置空。所述的系统,所述排列单元还用于将所述主语修饰语、谓语修饰语、宾语修饰语 分别放置于一括号内。所述的系统,还包括预处理单元,用于接收从输入接口输入的第一语种的自然语 句;以及识别第一语种的每一个自然语句是否包含主语词组、谓语词组和宾语词组,如果 不是,则将该语句补充成包括主语词组、谓语词组和宾语词组的完整结构,形成为待 翻译的第一语种的语句。排列单元还可以用来进行如下标记操作的一种或多种为第一语种的主语词组、谓语词组和宾语词组分别标记上词组标记符;为第一语种的主语词组中的主语修饰语、谓语词组中的谓语修饰语之间、宾语词组中的宾语修饰语标记上修饰语标记符;对包含问句的第一语种的语句,为被提问的主语词组、谓语词组或宾语词组标记 上提问标记符。本专利技术的方法和系统,通过识别第一语种格式语句中的主语词组、谓语词组和宾 语词组,再相应的将其翻译成第二语种的主语词组、谓语词组和宾语词组并按第二语 种的语言表达方式进行排布,使得翻译能够符合语义逻辑,从而得到高质量的译文, 真正使机器翻译方法和系统成为一种可信的实用翻译工具。附图说明图1描述了自然语言的差异性和共通性;图2描述了本专利技术的基本专利技术原理; _图3描述了本专利技术示例中的语义逻辑表达式分别如何对应于符号学观点和语言学观点;图4描述了本专利技术示例中的由自然语言到符号语言句型的转换过程; 图5描述了本专利技术示例中从一个语种到另一语种的转换流程; 图6描述了本专利技术示例中一个语种到另一语种的转换实例; 图7描述了本专利技术具体实施方式的机器翻译方法的流程。 具体实施例方式下面对照附图并结合具体实施方式对本专利技术进行进一步详细说明。 1.专利技术原理21世纪的人类已经进入到信息社会,信息社会的基本特征是网络互联、语言互 通、资源共享和协同工作。语言互通(人与人互通、人与机互通)是资源共享、协同 工作的基础,对信息社会的发展和完善起着关键的作用。审视机器翻译的目标,应当看到,由于语言之间的差别涉及到语言文化、社会背 景上的差异,这使得自然语言具有极大的不规则性,在这种现实的情况下,建立穷尽 一切自然语言不规则性的逻辑模型从而达到机器的全自动翻译是不现实的。因此,本文档来自技高网...

【技术保护点】
一种机器翻译方法,其特征在于,包括: 获取待翻译的第一语种的语句; 识别所述第一语种的语句的主语词组、谓语词组和宾语词组; 翻译所述第一语种的语句的主语词组、谓语词组和宾语词组为第二语种的主语词组、谓语词组和宾语词组;   按照所述第二语种的语言表达方式排布所述第二语种的主语词组、谓语词组和宾语词组,形成为第二语种的语句。

【技术特征摘要】

【专利技术属性】
技术研发人员:林勋准
申请(专利权)人:林勋准
类型:发明
国别省市:94[中国|深圳]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1