自然语言处理装置及方法制造方法及图纸

技术编号:2885890 阅读:232 留言:0更新日期:2012-04-11 18:40
一种自然语言处理装置,包含:输入自然语言的输入部;变换自然语言表现的表现变换部;为确认表现变换部变换的句而进行显示的显示部;对经确认的句进行机器翻译的机器翻译部;对上述各部进行控制的控制部。该装置能提供减少用户确认操作的自然语言处理。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及处理自然语言的,具体而言,涉及在处理过程中简化用户所作选择和确认的。
技术介绍
已往,利用诸如自动翻译、语音识别、文件检索、文件处理等自然语言处理的系统已得到实用化。作为已往这种系统的例子,图1示出了已有技术语音翻译装置的处理过程的主要流程。在该语音翻译装置的处理过程中,步骤S101输入语音,步骤S102识别语音,在步骤S103由用户确认该语音识别的结果。若用户认可语音识别的结果,则在步骤S104机器翻译识别结果,如果不认可,则回到步骤S101再执行语音识别。在步骤S105,用户对在步骤S104机器翻译的结果进行确认,需要时在步骤S106实施编辑,最后在步骤S107产生合成语音,并结束该处理过程。这样,在步骤S101,用户首先自己发话向语音翻译装置输入语音。在步骤S102语音翻译装置对输入的语音进行识别,显示其结果。在语音识别处理中可能引起误识别,故经常进行所谓用户确认识别结果的处理。作为步骤S103中确认识别结果的方法,常用在识别处理中显示多个得分高的上层候选句再请用户从它们中加以选择的方法。然而,若显示的句中未包含自身讲的语句时,则再次输入语音。如果经用户确认确定了用户输入语音的句,则在步骤S104将该句翻译成目的语言。通常,翻译处理也会出现输出中包含其它错误结果的可能性,为了保证翻译准确度,在步骤S105要进行用户确认翻译结果的作业。因而,如果翻译结果不正确,则在步骤S106编辑成恰当的目的语言表述。然后,在步骤S107根据翻译结果产生合成语音加以输出,并结束该语音识别处理过程。但是,在使用已有技术自然语言处理的系统中,不能说已备有适合用户的界面(接口)。例如,在上述结构的语音翻译装置中,存在下面2个问题。第一个问题是处理的自然语言的多样性和处理准确度的问题。用现有的机器翻译要想对多样的输入句作高准确度翻译是非常困难的。一般的机器翻译存在作为原语言的输入句要处理的体裁越多,翻译的准确度就越低的问题。另外,对输入句的句型或词汇加以限制虽能提高翻译准确度,但是,强制输入带有这种限制会增加用户负担。而且,在输入句上存在意思或修饰关系等的多义性或状况依存性等情况下,其翻译结果一般有多个。为了唯一地指定翻译结果,可在翻译装置侧自动选择或请用户选择恰当的候选句,但前者可能选择不同的候选句,而后者若用户不详细了解目的语言将难作选择。作为后者的应用,采用的方法是,将翻译结果再次翻译成原语言,向用户提示再翻译结果,让用户选择、确认,这种方法在再翻译过程中会产生错误。另外,采用展现句结构树等内部表现或翻译处理过程记录等来代替提示翻译结果的方法,用户必须知道查找方式。因此,用户进行选择和确认是困难的。上述问题不仅表现在机器翻译处理上,而且可以说表现在借助自然语言应用诸如数据库检索、表现支持等自然语言处理的所有装置上。第二个问题是用户确认作业的问题。如果从用户确认作业出发观察一下上述处理过程,则用户需要对语音识别结果、机器翻译结果进行2次确认作业,故确认次数多,麻烦。这可以说是对利用自然语言处理的多个模块进行组合的系统的一般情形。例如,考虑采用假名汉字变换输入日语并用机器翻译将其译为英语的情况下,用户用假名输入日语,确认变换后的汉字,首先生成正确假名汉字混合的日语。然后将其作为输入进行日英翻译,其结果再由用户确认。而且,在机器翻译情况下,当用户不习惯于目的语言时,存在的问题是确认该翻译结果是极困难的。本专利技术的揭示本专利技术是鉴于上述情况进行的,其目的在于提供一种能保持处理准确度同时能减少确认作业的。本专利技术的自然语言处理装置,包含输入自然语言的输入手段、对上述输入手段输入的自然语言进行变换的变换手段、对上述变换手段变换后的自然语言进行确认的确认手段,以及对上述确认手段确认后的自然语言进行处理的处理手段;输出上述处理手段处理过的自然语言的输出手段。本专利技术的自然语言处理装置包含输入自然语言的输入手段、对自然语言进行处理的一个或两个以上的处理手段、对自然语言处理结果进行确认的一个或两个以上的确认手段,以及输出处理后自然语言的输出手段,其中,采用的结果是按照第1处理手段及确认其结果的第1确认手段的顺序处理后的结果,在上述第1处理手段之前设置第2处理手段和第2确认手段,所述第2处理手段将输入上述输入手段的自然语言变换为可高准确度处理的形式,所述第2确认手段确认所述第2处理手段的结果,从而进行省略对第1处理手段结果进行确认的提前确认。本专利技术的自然语言处理装置具有输入自然语言的输入手段;用第2语言的表现及第3语言的表现将输入所述输入手段的第1语言变换为一对一对应于所述第2语言表现的变换手段;对所述变换手段变换的所述第3语言的表现进行确认的确认手段;根据所述确认手段确认的结果对输入所述输入手段的自然语言实施处理的处理手段;输出经所述处理手段处理的自然语言的输出手段。本专利技术的自然语言处理方法包含输入自然语言的输入过程、对所述输入过程输入的自然语言进行变换的变换过程/对所述变换过程变换的自然语言进行确认的确认过程,以及对所述确认过程确认的自然语言实施处理的处理过程;输出经所述自然语言处理过程处理的自然语言的输出过程。本专利技术的自然语言处理方法包含输入自然语言的输入过程;对自然语言进行处理的一个或两个以上的处理过程;对自然语言处理结果进行确认的一个或两个以上的确认过程;输出处理后自然语言的输出过程,其中,采用的结果是按照第1处理过程及确认其结果的第1确认过程的顺序处理后的结果,在上述第1处理过程之前设置第2处理过程和第2确认过程,所述第2处理过程将输入上述输入过程的自然语言变换为可高准确度处理的形式,所述第2确认过程确认所述第2处理过程的结果,从而进行省略对第1处理过程结果进行确认的提前确认。本专利技术的自然语言处理装置具有输入自然语言的输入过程;用第2语言的表现及第3语言的表现将在所述输入过程输入的第1语言变换为一对一对应于所述第2语言表现的变换过程;对所述变换过程变换的所述第3语言的表现进行确认的确认过程;根据所述确认过程确认的结果对在所述输入过程输入的自然语言实施处理的处理过程;输出经所述处理过程处理的自然语言的输出过程。这样,在本专利技术中,不是将用户输入的句(除句外还包括短语和子句,以下也一样)直接用于自然语言处理,而在其间加有“表现变换处理”和“确认/选择等待”。另外,上述自然语言处理与表现变换处理同时进行,并对这样生成的“自然语言处理结果和表现变换处理结果对”进行确认/选择。也即,进行表现变换处理,将输入的句变换为能对后续的自然语言进行高准确度处理的句,使得接近用户的意图。表现变换处理可不在机器翻译处理前进行,而与机器翻译处理同时进行。在“确认等待”和“机器翻译”之间,也可插入“再变换处理”。该处理在“表现变换”内不改变文句的意思和微细差别,只是作部分语序等的改变。这样,供给用户的文句能够比较接近输入的文句,供给翻译处理的文句可为适合于处理的句。表现翻译变换处理可不在机器翻译处理前进行,而与机器翻译处理同时进行。此时,每一翻译处理预先备有对应的表现变换处理,从而某句中用某个翻译处理时也用相应的表现变换处理。于是,生成翻译结果与表现变换处理的对。然后,进行“确认/选择”,提示该对或只提示表现变换结果。本专利技术分成准本文档来自技高网...

【技术保护点】
一种自然语言处理装置,其特征在于,包含: 输入自然语言的输入手段; 对所述输入手段输入的自然语言进行变换的变换手段; 对所述变换手段变换后的自然语言进行确认的确认手段; 对所述确认手段确认后的自然语言实施处理的处理手段; 将所述处理手段处理过的自然语言加以输出的输出手段。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:浅野康治广江厚夫岛川真人加贺美彻也小林惠理香
申请(专利权)人:索尼株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1