当前位置: 首页 > 专利查询>万继华专利>正文

将自然语言翻译成计算机语言的方法、语义分析器及人机对话系统技术方案

技术编号:9738671 阅读:284 留言:0更新日期:2014-03-06 16:22
本发明专利技术涉及计算机领域,具体说是将自然语言翻译成计算机语言的方法、语义分析器及人机对话系统,其包括将自然语言输入计算机,计算机提取语法成分、逻辑联接词和逻辑语义,并将其分别翻译成字符串代码、指令代码和二进制代码,然后将代码拼接成计算机可识别的程序语言。本发明专利技术按照计算机程序的映射、拼接方法对各语法成分进行技术处理,从而将任何自然语言翻译成计算机可识别的程序语言,解决了计算机对自然语言理解的技术难题,为开发深层智能化电子产品奠定了技术基础,可以实现人与计算机的对话和交谈。

【技术实现步骤摘要】
将自然语言翻译成计算机语言的方法、语义分析器及人机对话系统
本专利技术涉及计算机领域,具体说是将一种将自然语言翻译成计算机语言的方法、利用该方法制成的语义分析器及人机对话系统。
技术介绍
人类日常生活中用于传递信息和进行交流的语言,是自然语言,包括口头语言即语音,和书面语言即文字两种基本形式。自然语言是人类在改造客观世界的过程中产生的,并随着人类社会和客观世界的变化而不断发展。人类自然语言中所涉及的每一概念总是与客观世界中的某一具体事物或事件相对应,由于客观世界中的任一具体事物或事件的存在形式总是一个特定的唯一对象,所以人类自然语言中的概念或词语所及的任一特定事物或事件也必然是唯一的对象。当今社会已进入到了一个科技日新月异的时代。其中,一个最明显的标志是高科技信息产品大量涌入消费市场。它们为人们的工作,生活,交流,学习和通信带来了很大的便利和享受。另一方面,高科技信息产品的普及也为高科技信息产品自身的提升带来很大挑战。其中一大挑战是基于自然语言的人机对话。要实现基于自然语言的人机对话,有两大问题需要解决。一是把语音信号转换成文字符号;二是把文字符号转换成计算机可识别的程序语言。目前,第一个问题已得到较好解决,它就是人们通常所说的语音识别技术。但是,当今的语音识别技术没有解决计算机对自然语言文字的理解这个问题。比如,现有的人机对话系统和信息搜索产品都使用查表算法。从根本上说,它们都没有解决机器对自然语言文字的识别和理解。这一缺陷导致很多高科技产品,无法实现一些非常有用的功能。目前,世界上没有一台电脑能懂得人们日常用的自然语言,也就是说,人们还无法通过自然语言去告诉电脑要去做什么,或回答人们的提问。展望未来,在日本等国家的推动下,家用机器人将成为普及率很高的消费品之一。为了实现这个商业目标,目前急待要解决的一大技术难题是怎么将自然语言翻译成计算机语言。由于将自然语言翻译成计算机语言是一个技术难题,目前市场上出现的人机对话装置均不能实现深层智能化应用需求的自然语言识别和理解功能,如根据人的自然语言作出响应、通过语音信号所表达的语义直接完成具体操作等。
技术实现思路
针对计算机无法对自然语言识别的技术问题,本专利技术的目的在于提供一种将自然语言翻译成计算机语言的方法。本专利技术解决上述技术问题采用的技术方案为:一种将自然语言翻译成计算机语言的方法,其包括以下步骤:( I)将自然语言输入计算机;(2)计算机利用词库和自然语言分词规则识别提取自然语言文字中的语法成分、逻辑联结词和逻辑语义,并基于信息管理库将语法成分翻译成表示计算机面向对象语言中的基本元素名称的字符串代码、将逻辑联结词翻译成表示程序控制的程序转移指令代码、将逻辑语义翻译成表示肯定和否定的二进制代码;(3)将所述字符串代码、程序转移指令代码和二进制代码拼接成计算机可识别的程序语言。进一步地,步骤(2)中计算机识别和提取自然语言文字中的主语、谓语、定语、宾语、状语和补语六种语法成分,并将其对应为计算机面向对象语言中的对象、函数、属性和参数四种基本元素,其中主语翻译为表示对象名称的字符串代码,谓语翻译为表示函数名称的字符串代码,定语翻译为表示属性或参数名称的字符串代码,宾语、状语和补语翻译为表示参数名称的字符串代码。进一步地,步骤(2)中所述逻辑联结词包括与、或、条件三种,分别对应与、或、条件三种逻辑关系,并将其分别翻译成顺序转移指令代码、选择转移指令代码和条件转移指令代码。进一步地,步骤(2)中所述逻辑语义是指主语和谓语中表示肯定和否定的两种语义,当主语和谓语中出现如没、不、非和无等否定词时,为否定逻辑语义,否则为肯定逻辑语义,并将其编码为二进制代码,否定为0,肯定为I。进一步地,所述词库存储单词、词组及与单词和词组对应的词性。上述技术方案根据语法规则对自然语言进行语法成分的划分,按照计算机程序的映射、拼接方法对各语法成分进行技术处理,从而将任何自然语言翻译成计算机可识别的程序语言,实现了计算机对自然语言的识别和理解,为开发深层智能化电子产品奠定了技术基础。本专利技术还提供一种语义分析器,该语义分析器按照上述方法制成,其可通过软件或硬件形式表现,以达到将自然语言翻译为计算机语言可识别的程序语言的目的。针对现有电子产品不能实现深层智能化的技术问题,本专利技术提供一种包含上述语义分析器的人机对话系统,还包括:语音转换器,将自然语言的语音实时转换成文字;编译执行器:调用类库,动态编译所述语义分析器的程序语言,并执行,完成功能操作。进一步地,还包括控制显示器或播放器,所述功能操作为根据语义要求动态生成对应的资源调用信息;控制显示器或播放器接收资源调用信息,根据调用信息显示或播放资源库内对应的资源。进一步地,所述信息管理库存储词库、类库和资源库之间的对应关系;所述资源库存储与文字对应的信息资源;所述类库存储功能类的类文件。进一步地,信息资源包括文本、图片、视频和动漫资源。上述方案通过人机对话系统实现人与计算机之间的对话和交谈,计算机可对人的自然语言作出响应,并可通过语音信号所表达的语义直接完成具体操作。因而,该系统可广泛应用于未来语义互联网、物联网、机器人控制以及人工智能和简化计算机硬件系统的各种前沿领域中。【附图说明】图1是本专利技术的方法的流程图;图2是本专利技术人机对话系统的结构框图。【具体实施方式】下面结合图1对本专利技术的方法作进一步的详细说明:本专利技术的方法包括以下步骤:(I)将自然语言输入计算机;自然语言包括语音和文字,如果输入的是语音,则须转换成文字。(2)计算机利用词库和自然语言分词规则识别提取自然语言文字中的语法成分、逻辑联结词和逻辑语义,并基于信息管理库分别将语法成分翻译成表示计算机面向对象语言中的基本元素名称的字符串代码、将逻辑联结词翻译成表示程序控制的程序转移指令代码、将逻辑语义翻译成表示肯定和否定的二进制代码;其中语法成分包括主语、谓语、宾语、定语、状语和补语六种。本方案基于词语词性与语法成分之间的对应关系和语法成分的结构规律所采用的识别方法为:语句中的第一个名词或代词是主语,主语前有名词或者代词作定语修饰的以结构助词“的”作为识别标记;语句中的最后一个动词是谓语,谓语中没有动词的形容词是谓语,谓语后有补语修饰的以结构助词“得”作为识别标记,;主语之前的成分是定语,定语的个数可以是零,也可以是一个或者多个;`谓语之前的成分是状语,状语的个数可以是零,也可以是一个或者多个;谓语之后的成分是宾语或补语,宾语的词性是名词或者代词,宾语之前可有定语修饰,修饰宾语的定语以“的”字作为识别标记,补语以“得”字标记;本申请并不限于上述识别规则,还可通过其他的规则提取语法成分。六种语法成分与表示计算机面向对象语言的对象、函数、属性和参数四种基本元素名称对应,具体为主语翻译为对象名称的符串代码,谓语翻译为函数名称的字符串代码,定语翻译为属性或参数名称的字符串代码;当定语修饰主语时,翻译为属性名称的字符串代码;当定语修饰宾语时,翻译为类库参数名称的字符串代码;宾语、状语和补语翻译为参数名称的字符串代码。本方案基于自然语句之间的逻辑联结规律,识别逻辑联结词,其中逻辑联结词包括与(合取)、或(析取)、条件(蕴涵)三种,分别对应与、或、条件三种逻辑关系,并将其分别翻译成顺本文档来自技高网
...

【技术保护点】
将自然语言翻译成计算机语言的方法,其包括以下步骤:(1)将自然语言输入计算机;(2)计算机利用词库和分词规则识别提取自然语言文字中的语法成分、逻辑联结词和逻辑语义,并基于信息管理库将语法成分翻译成表示计算机面向对象语言中的基本元素名称的字符串代码、将逻辑联结词翻译成表示程序控制的程序转移指令代码、将逻辑语义翻译成表示肯定和否定的二进制代码;(3)将所述字符串代码、程序转移指令代码和二进制代码拼接成计算机可识别的程序语言。

【技术特征摘要】
2012.12.07 CN 201210522527.11.将自然语言翻译成计算机语言的方法,其包括以下步骤: (1)将自然语言输入计算机; (2)计算机利用词库和分词规则识别提取自然语言文字中的语法成分、逻辑联结词和逻辑语义,并基于信息管理库将语法成分翻译成表示计算机面向对象语言中的基本元素名称的字符串代码、将逻辑联结词翻译成表示程序控制的程序转移指令代码、将逻辑语义翻译成表示肯定和否定的二进制代码; (3)将所述字符串代码、程序转移指令代码和二进制代码拼接成计算机可识别的程序;五古P口口 ο2.根据权利要求1所述的方法,其特征在于:步骤(2)中计算机识别和提取文字中的主语、谓语、定语、宾语、状语和补语六种语法成分,并将其对应为计算机面向对象语言中的对象、函数、属性和参数四种基本元素名称,其中主语翻译为表示对象名称的字符串代码,谓语翻译为表示函数名称的字符串代码,定语翻译为表示属性或参数名称的字符串代码,宾语、状语和补语翻译为表示参数名称的字符串代码。3.根据权利要求1所述的方法,其特征在于:步骤(2)中所述逻辑联结词包括与、或、条件三种,分别对应与、或、条件三种...

【专利技术属性】
技术研发人员:万继华
申请(专利权)人:万继华
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1