机器翻译用中文生成装置制造方法及图纸

技术编号:2890446 阅读:179 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种机器翻译用中文生成装置。它的前处理部,在语句结构中添加主语属性的空节点;基本句型部存储有动词细分类码和对应的基本句型结构;基本要素展开部生成基本语句结构;语句要素信息部存储有修饰语的格标识等以及与之对应的句首表层符号等;自由要素展开部,生成自由要素;特殊句型生成部生成特殊句型;要素位置调整部检查和调整要素排列顺序;后处理部生成辅助要素和标点符号。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术与机器翻译有关,特别是与利用文意与构文信息进行机器翻译的中文生成装置有关。(下面就日翻中、(中翻日)的机器翻译技术用语的定义和汉语的文法等进行说明)本专利技术申请与机器翻译用的中文生成装置有关,但现在在日本,对中文并不十分熟悉,而且机器翻译这项技术是一个特殊的
因此,在说明本专利技术申请有关的现有技术和实施例等之前,有必要在最小限度下,包括间接有关的领域,说明涉及关连文献和本专利技术的主旨的日翻中、(中翻日)的机器翻译,并对用语的意义或定义等加以描述。(因而,严格来说,还有关于本专利技术的主旨的描述,不是纯粹的“先有技术”的描述。)(关连文献)1.关于汉语相浦呆著“汉语入门”日本广播协会会刊等。2.关于机器翻译牧野 武则著“机器翻译导论” 欧姆公司出版长尾 真主编“机器翻译” 欧姆公司出版3.关于日翻中(中翻日)的机器翻译(1)特开平3-102568号“从日语到汉语的机器翻译”(2)特开平3-20295号“机器翻译装置”,此外,还有特开昭61-077639号等。4.术语的意义或定义等文法分析、语音结构等中的树形结构、各种节点在树形结构中,每个单位,亦即一个单位就是一个节点。此外,当一个节点之下还连接着其它的节点时,那么上层的节点叫作父节点,下层节点叫作子节点。下面,说明本专利技术使用的各种“节点”动词节点,指具有动词属性的节点。形容词节点,指具有形容词属性的节点。叶节点,指不具有子节点的节点。主语属性零节点,指具有主语属性的零节点。所谓零节点,是为了便于处理而添加的节点。此外,若所处理的节点的格的属性为主语属性,则叫做主语属性节点。其次,对树形结构,按它的性质“从下到上”、“从左到右”进行处理。例如,附图说明图16中所示的树形结构,按d,e,b,f,c,a的顺序进行处理。此外,在本专利技术中,着眼于动词和形容词在汉语的语法及文法分析中起着重要的作用。并且,这时,将树形结构用于分析。依存结构指在构成语句的各要素(形态要素)之间的主要素(argument)和修饰语(modifier)之间的关系。在依存结构的图中,通常在主要素之下配置修饰语,根据修饰语的主格、宾格、场所格等格标识表示二者间的关系。例如,“他患感冒”的语句结构如图17(a)所示,它的依存结构示于17(b)中。由本图可知,由于只将必要的节点表示在依存结构中,因而结构简单,当进行中间变换处理时,只要输入依存结构,该处理所需的必要规则数目便很少,并且编辑等也很容易。为此,在转换式的机器翻译系统中,它的输入、输出结构一般就是“依存结构”。(参见后述的“先有的技术”以及图11)表层符号,特别是本专利技术中的母语表层符号,句首表层符号,句尾表层符号的处理日语的助词是一种功能词。换言之,虽然看起来是相同的助词,但是,根据语句不同,其功能也不同。例如,对于“ご”,既有“手ごつかむ”等的工具格,也有“大阪ご会う”等的地点格。因此,“ご”被叫作表层符号,而语句中的“ご”的意义则称为深层符号。换言之,一个表层符号可具有不同的含意。因此,在进行日语等自然语言的处理时,必须决定“ご”等表层符号的真实含义。“句首表层符号”在本专利技术中指中文的前置词。通常,放在前置词句的句首,因此,称为句首表层符号。“句尾表层符号”在汉语中,若某个名词具有地点格时,其地点格可按照诸如“里”、“上”、“下”、“左”、“右”等来表示各种地点格。并且,这些字通常被放在前置词句的句尾。因此,本专利技术中称它们为文尾表层符号。中文生成的自由元素的位置、空隙和空隙位所谓空隙,就是孔洞的意思。对中文的语句(句型)加以分析,可分为基本要素和自由要素。当决定了主语、动词等基本要素的位置之后,在基本要素和基本要素之间,就可设置叫作空隙的空间,并且,这些空隙就是放置自由要素的位置。若以主语、动词和宾语构成的SVO句型为例,可有如下所示的(1)~(4)的四个空隙的位置。(1)S(2)V(3)O(4)在本专利技术中,也着眼于这些空隙的形成规则。连词修饰词及连词它们相当于日语的助词。与多个单词构成另一个单词的例如“日本晴れ”、“藤の间”等的日语的文法用言的连词不同。可参见前面提到的“特开平3-102568号”或“特开昭61-077639号”形态因素它是有意义的最小单位。例如汉语中的“他”等字或“老师”等单词。时间副词它是具有时间性的副词或名词。例如“今天”“昨天”等。汉语的助动词例如“能”、“可以”、“要”等词。它的语法作用和英语的助动词相同。本专利技术中,把日语的句子(句型)中的助动词和它的意义作为检索关键字,参照“日汉助动词对照表”来检索出对应的汉语助动词。例如,日语的助动词“たい”的意义是“希望”。因而,对应于“たい”的汉语助动词就是“想”。此外,“想”在句型中的位置是空隙2。接续词在汉语中它们是“和”、“或”、“及”等,分别与“と、and”,“しかし、but”,“と、and”相当。动词和形容词活用等细节是不同的,但日语和汉语的意义大致相同。指示代名词和助数词等也一样。标题(TOPIC)在汉语中,进行特别强调时,将某个字或某个单词放在句子的开头。这个字或词被叫作“标题”。汉语中的特殊句型的属性值汉语有许多特殊句型。这些特殊句型,由构成句子的要素来决定。例如“把”句、“被”句、“使”句等。如对“把”句加以说明,在汉语中,若及物动词有两个宾语(直接宾语,间接宾语)时,自然会形成“把”句。例如“把书放在车子里”就比“放书在车子里”更加自然。(在后述实施例中,根据动词的属性SENATTR存储产生的上述哪种句型。)汉语中的“被”句、“把”句在汉语中,“被”句通常是指被动句。这就是日语中的“被动句”或“利害被动句”。汉语中,“把”句中通常使用双重及物动词,并且具有直接宾语和间接宾语。一般在直接宾语之前放置“把”字,并将它移动到动词之前。本专利技术着眼于上述特殊句型的规则。双重及物动词汉语中的双宾动词,就是英语中的双重及物动词(能够具有二个宾语的及物动词), 和He gave me a car(SVOO)中的与“gave”相当的类似的动词。使役句使他人进行某个动作的内容的语句。此外,在汉语中,可以用“给”字来生成使役句。例如老师“给”他吃饭。(先生让他吃饭)被动句即日本的“被动文”。通常汉语中用“被”字来表示。汉语的表语相当于日语的目的语。(本来的先有技术)以下把本来这个词换一个说法,说明纯粹的先有的技术。在技术急剧进步的今天,为了不落后于时代,必须不断地吸收知识和信息。但是,在交通和通信很发达的基础上,应当吸收的知识绝不仅仅局限于国内,也从国外大量输入。在这样的情况下,多数人对外语并不那么娴熟,加之作为信息来源的外国语种类很多,翻译就变得很重要。并且,为了提高翻译的效率,使其质量和速度得以提高,就要把手工作业改由机器来进行,也就是说,已经进入了必须考虑机器翻译系统的时代。但是,就机器翻译的方式而言,按照语言翻译的特性,可分为直接方式、中间转换方式、核心语言方式(PIVOT)等。其中,正如已经说明过的,为了能用较少的转换规则便可达到目的,通常多采用“中间转换方式”。采用上述中间转换方式的机器翻译装置,如图13所示,大致由下述四个部分构成(1)源语言(已被输入并被翻译为外国语的语言)分析部(2)中间结构转换部(3)目的语言本文档来自技高网...

【技术保护点】
一种通过对源语言的语句进行语言分析、中间转换后获得其中文的依存结构,并将之转换为中文语句的机器翻译用的中文生成装置,其特征在于具有基本句型部、语句要素信息部、构句要素顺序部、语句结构生成部、自由要素生成部和语句生成部,基本句型部预先登录有中文各动词的细分类码以及与之对应的基本句型结构;语句要素信息部预先登录有修饰语的格标识、源语言的表层符号、意义支配码、意义码以及与之对应的中文句首表层符号、句尾表层符号、空隙位置等要素信息;构句要素顺序部预先登录有空隙位置以及与之对应的构文要素的顺序限制;语句结构生成部对输入的中文依存结构,检出省略了主语的动词、形容词,对该语句结构添加了主语属性的空节点之后,对依存结构中的由动词、形容词形成的主要素,根据动词的动词细分类码或形容词的模拟动词分类码,参照前述句型部,取出对应的基本句型,生成中文语句结构;自由要素生成部对于上述的依存结构,对基本要素之外的其它要素,也参照上述的语句要素信息部,对每一个要素,根据其格标识、源语言表层符号、意义支配码、意义码等取出对应的中文句首表层符号、句尾表层符号、空隙位置,并进而参照此取出的空隙位置,在语句结构的对应位置生成自由要素之后,参照各动词、形容词的特殊句型的属性值,对每一语句结构生成特殊句型;语句生成部从前述的构文要素顺序部,顺序取出各空隙中的构句要素顺序限制,检查并调整对应于上述语句结构的空隙要素配置顺序,然后使语句结构线性化,最后生成中文的语句。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:郭俊桔
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1