当前位置: 首页 > 专利查询>王立山专利>正文

基于似谓词演算形式的机器思维语言翻译的方法及系统技术方案

技术编号:18940537 阅读:39 留言:0更新日期:2018-09-15 11:04
本发明专利技术公开了基于似谓词演算形式的机器思维语言翻译的方法及系统,包括以下步骤:S1、输入翻译前的自然语言信息语句;S2、将自然语言信息语句基于似谓词演算形式,利用不同层面集切分得到最简思维模式集合;S3、将最简思维模式集合转换成自然语言产生式系统规则表示;S4、根据自然语言产生式系统规则表示生成翻译后的语句;S5、将翻译后的语句作为结果输出或作为学习结果存储。优点在于,语句分解后对应翻译再回溯成句的翻译模式,是人的翻译工作模式。对两种不同的语言通过切分后进行机器自动翻译。语义表达对应吻合准确且无遗漏;使对应翻译后再生成的语句原义依旧;在整体上照应不同语言表达方式差异即可,细节上是相同的或相似的。

Method and system of machine thinking language translation based on quasi predicate calculus

The invention discloses a method and a system for machine thinking language translation based on predicate-like calculus form, including the following steps: S1, input natural language information statements before translation; S2, segment natural language information statements based on predicate-like calculus form to obtain the simplest set of thinking modes; S3, and most. Simple thinking mode set is transformed into natural language production system rule representation; S4, according to natural language production system rule representation, translated sentences are generated; S5, translated sentences are output as results or stored as learning results. The advantage is that the translation mode of sentence decomposition and retrospective translation is human translation mode. Automatic translation is done on two different languages after segmentation. The semantic expression corresponds accurately and without omission; the original meaning of the corresponding translated sentences remains unchanged; the differences in different language expressions can be taken into account as a whole, and the details are the same or similar.

【技术实现步骤摘要】
基于似谓词演算形式的机器思维语言翻译的方法及系统
本专利技术涉及自然语言文字语言翻译研究领域,特别涉及机器思维载体及系统与人类思维的一致性,使机器能够和人一样用一种语言文字对话、自动翻译的系统及其方法。
技术介绍
随着人工智能的快速发展,各种人工智能翻译产品在社会各方面获得了愈加广泛的应用。但是,机器直接使用人类自然语言思维并进行翻译,是实现人工智能的终极目标。目前,由于方法论和技术路线的欠缺,人工智能尚远远做不到这一点。在机器翻译业界,有的传统的方法是通过中间语言进行两种语言的翻译。本专利技术提供的机器翻译的方法及系统则是直接翻译,这也是人类的翻译方法。本专利技术的成功基础是人类思维的同一性,而语言是思维的载体。人类思维的基本特征是四种基本模式及其组合表现的28种句型。任何语言的语句经过切分而转换为似谓词演算形式后,就是对应的关系了——除非原来就不存在对应的概念。这样的翻译准确度最高,关键的问题就只有翻译词的选择了。而为了达到“雅”的文学性特征,则要在切分过程的中间层次匹配片语或子句的实例翻译语料。本专利技术将要引用到的“自然语句似谓词演算形式”及其应用的“自然语言产生式系统”在专利技术申请号为:201610349629.6的《一种自然语言智能体识别方法及系统》及专利技术申请号为:2018100733617的《一种智能体的自然语言产生式系统及方法》中有详细表述。
技术实现思路
为了解决上述现有技术存在的问题,本专利技术目的在于提供由人类思维通过自然语言文字完全转为机器思维语言翻译的方法及系统,从而实现人机思维的一致性,实现机器像人一样思维和进行不同语种间的翻译。基于似谓词演算形式的机器思维语言翻译是整个自然语言机器思维翻译领域的一部分功能,或者说子系统。本专利技术所述的基于似谓词演算形式的机器思维语言翻译的方法,包括以下步骤:S1、输入翻译前的自然语言信息语句;S2、将自然语言信息语句基于似谓词演算形式,利用不同层面集切分得到最简思维模式集合;S3、将最简思维模式集合转换成自然语言产生式系统规则表示;S4、根据自然语言产生式系统规则表示生成翻译后的语句;S5、将翻译后的语句作为结果输出或作为学习结果存储。优选地,构建知识库,存储谓词演算的形式;所述步骤S4以知识库内的谓词演算形式回溯切分得到翻译后的语句。优选地,所述的知识库包含自然语句经切分后转变成最简思维模式的子句集,用于提高机器思维搜索、推理和语言翻译的效率。优选地,通过机器阅读和翻译实践建立机器翻译译句储存,构建双向的翻译语料库;所述的翻译语料库由自然语句似谓词演算形式子句集并以自然语言产生式系统形成。优选地,将初始切分的语句与翻译语料库匹配,匹配成功则换词输出;如果无匹配成功,则进行次第切分,重复匹配的过程;将此层次的各部分递次输入翻译语料库搜索匹配;如果在此层次搜索翻译语料库己有对应译句,则立即终结这部分片语或子句的切分,未匹配成功的部分继续切分,并重复匹配的过程;完成全句換词。优选地,所述的步骤S4中把自然语言产生式系统规则内的最简模式子句三元组整体地作为译词匹配处理,用于解决歧义性问题。优选地,在处理重复词语时,依据前后语种思维各自的表达特点,相互替换、省略或简化重复词语。优选地,所述的知识库存储语种间的等价词及文风规则,换词时选择最优的词。本专利技术所述的基于似谓词演算形式的机器思维语言翻译的系统,包括:输入单元:用于输入翻译前的自然语言信息语句;切分单元:用于将自然语言信息语句基于似谓词演算形式,利用不同层面集切分得到最简思维模式集合;转换单元:用于将最简思维模式集合转换成自然语言产生式系统规则表示;输出单元:用于根据自然语言产生式系统规则表示生成翻译后的语句,将翻译后的语句作为结果输出或作为学习结果存储;知识库,用于存储谓词演算的形式;所述输出单元以知识库内的谓词演算形式回溯切分得到翻译后的语句;翻译语料库,由自然语句似谓词演算形式子句集并以自然语言产生式系统形成。优选地,所述的知识库包含自然语句经切分后转变成最简思维模式的子句集,用于提高机器思维搜索、推理和语言翻译的效率;将初始切分的语句与翻译语料库匹配,匹配成功则换词输出;如果无匹配成功,则进行次第切分,重复匹配的过程;将此层次的各部分递次输入翻译语料库搜索匹配;如果在此层次搜索翻译语料库己有对应译句,则立即终结这部分片语或子句的切分,未匹配成功的部分继续切分,并重复匹配的过程;完成全句換词;把自然语言产生式系统规则内的最简模式子句三元组整体地作为译词匹配处理,用于解决歧义性问题;在处理重复词语时,依据前后语种思维各自的表达特点,相互替换、省略或简化重复词语;所述的知识库存储语种间的等价词及文风规则,换词时选择最优的词。本专利技术所述的基于似谓词演算形式的机器思维语言翻译的方法及系统,其优点在于,本专利技术不是传统的基于统计的翻译或人工神经网络翻译。这是语句分解后对应翻译再回溯成句的翻译模式,是人的翻译工作模式。采用本专利技术方法,对两种不同的语言通过切分后进行机器自动翻译。本专利技术方法依据人类思维的本质模式,而不同语言体系只有表达方式的细节差异,所以思维基本结构是相同的。切分后的最简思维模式之集合会有另一种语言与之相对应,翻译即是将最简思维模式中的词汇相应转换为匹配的另一种语言的词汇。本专利技术的方法以人类思维的构成及其机制为基础,将不同语言还原到这个同一的基础相互代換,所以:1)语义表达对应吻合准确且无遗漏;2)因为人类思维结构一致,按本方法将语句切分后沒有任何信息丢失;所以,必然使对应翻译后再生成的语句原义依旧;3)在整体上照应不同语言表达方式差异即可,细节上是相同的或相似的;4)翻译的算法与本系统学习、推理、归纳、演绎、记忆等多重人类思维相似功能相结合,将会具有类似人的翻译能力;5)对于语句切分的不同层面都可以对应翻译。双语翻译语料库中存有学习得来的翻译句。在双语翻译语料库中,某个层面已有对应译句,则在此切分层次转換译句。自然语言语句的基础是基本思维表达模式,与谓词演算形式相似。本专利技术在实现自然语言与谓词演算形式的完全及自动转换,从而实现机器直接使用人类自然语言的基础上,实现两种语言的翻译。这是与人类思维一致的机器思维语言翻译。由于该转换保留着全部完整句义信息,因而翻译实现了全部信息的语言表述的转換。按照传统说法,高质量的翻译要兼顾三个方面:传意性、可接受性及相似性。传意性(meaningtransference)是指将原文的意思用语言重新表达出来,使读者通过译文获得正确的原文信息。为了能做到准确传意,译者就不能仅仅了解词、句、结构这些表面上的东西,而是要深入理解挖掘原文的深层含义,吃透字而上没有完全表达出来的弦外之音、作者的写作意图和喻义,这即是要理解原文的隐喻。可接受性(acceptability)是指译文读者对译文的接受程度,能否完全理解译者发出的信息。可接受性的高低很大程度上取决于译者对原文语言文化知识的理解与把握,它往往是翻译成败的重要因素。相似性(similarity)是指译文应力求在内容、形态、文体风格方面与原文尽量保持一致。按照本专利技术的翻译方法,上述三个方面都会兼顾。因为本翻译方法的本质是对原句全部信息的对应翻译并最后形成翻译语言的语句。本方法也可兼容其他人工智能方法如深度学习,以使机器思维的本文档来自技高网...

【技术保护点】
1.基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,包括以下步骤:S1、输入翻译前的自然语言信息语句;S2、将自然语言信息语句基于似谓词演算形式,利用不同层面集切分得到最简思维模式集合;S3、将最简思维模式集合转换成自然语言产生式系统规则表示;S4、根据自然语言产生式系统规则表示生成翻译后的语句;S5、将翻译后的语句作为结果输出或作为学习结果存储。

【技术特征摘要】
1.基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,包括以下步骤:S1、输入翻译前的自然语言信息语句;S2、将自然语言信息语句基于似谓词演算形式,利用不同层面集切分得到最简思维模式集合;S3、将最简思维模式集合转换成自然语言产生式系统规则表示;S4、根据自然语言产生式系统规则表示生成翻译后的语句;S5、将翻译后的语句作为结果输出或作为学习结果存储。2.根据权利要求1所述基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,构建知识库,存储谓词演算的形式;所述步骤S4以知识库内的谓词演算形式回溯切分得到翻译后的语句。3.根据权利要求2所述基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,所述的知识库包含自然语句经切分后转变成最简思维模式的子句集,用于提高机器思维搜索、推理和语言翻译的效率。4.根据权利要求1所述基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,通过机器阅读和翻译实践建立机器翻译译句储存,构建双向的翻译语料库;所述的翻译语料库由自然语句似谓词演算形式子句集并以自然语言产生式系统形成。5.根据权利要求4所述基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,将初始切分的语句与翻译语料库匹配,匹配成功则换词输出;如果无匹配成功,则进行次第切分,重复匹配的过程;将此层次的各部分递次输入翻译语料库搜索匹配;如果在此层次搜索翻译语料库己有对应译句,则立即终结这部分片语或子句的切分,未匹配成功的部分继续切分,并重复匹配的过程;完成全句換词。6.根据权利要求5所述基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,所述的知识库存储语种间的等价词及文风规则,换词时选择最优的词。7.根据权利要求5所述基于似谓词演算形式的机器思维语言翻译的方法,其特征在于,所述的步骤S...

【专利技术属性】
技术研发人员:王立山
申请(专利权)人:王立山
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1