【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及在使用自然语言的机器中输入知识。其可以用作自然语言的机器翻译器。
技术介绍
最常用的机制是用机器解释自然语言定义的词语集合_所有的人工语言都是该 类型。已经有定义词语的语法含意的尝试。开发了对于给定的文本给出主题领域,以此方 式还可以定义词语的优选含意,因此例如可以在机器翻译中实现更好的结果。还尝试了根 据文本中其他词语以及该词语在其他词语中的使用统计来定义一个词语的含意。也尝试了 对给定自然语言和其他自然语言中的词语设定来自同一集合的数值,因此来自两种语言的 具有同一适当值的词语具有相似的含意。
技术实现思路
技术问题通过机器来明确的解释自然语言的问题还没有解决,这对于向使用自然语言的机 器输入知识和数据来说是个障碍。机器不能用于文件的正式翻译,因为这不是翻译的可靠 方式。其不能生成对于不同的人具有明确的解释的自然语言文本,但是这在书写教科书或 专利申请时又非常重要。计算机不能被编程来使用自然语言,因为自然语言的一个句子从 形式上来看具有很多可能的含意,因此语法上正确的句子可以以不同方式解释。现有的人 类知识不能最优地使用,因为没有形式化的方式来使得 ...
【技术保护点】
自然语言的形式化方法,通过生成文本的机器模型使得能够进行机器解释并产生自然语言文本,其特征在于,生成自然语言文本的明确模型,其只能由包括如下步骤的唯一方法解释:利用先前确定的人类所使用的基本概念,基本概念包括所有实体或动作的唯一表示的所有基本概念,并且所述基本概念为唯一的标签一数字或词语,并且所述基本概念具有自然语言的描述,并且对于要被使用该方法处理的每一种自然语言来说,所述基本概念具有附加的词语列表,其名称是给定的自然语言;用计算机分析自然语言文本,利用基本概念,特别是以给定的自然语言命名确定的基本概念的词语列表,找到所使用的基本概念,并且利用语法分析和语义分析,产生自然 ...
【技术特征摘要】
【国外来华专利技术】BG 2007-11-14 109996自然语言的形式化方法,通过生成文本的机器模型使得能够进行机器解释并产生自然语言文本,其特征在于,生成自然语言文本的明确模型,其只能由包括如下步骤的唯一方法解释利用先前确定的人类所使用的基本概念,基本概念包括所有实体或动作的唯一表示的所有基本概念,并且所述基本概念为唯一的标签一数字或词语,并且所述基本概念具有自然语言的描述,并且对于要被使用该方法处理的每一种自然语言来说,所述基本概念具有附加的词语列表,其名称是给定的自然语言;用计算机分析自然语言文本,利用基本概念,特别是以给定的自然语言命名确定的基本概念的词语列表,找到所使用的基本概念,并且利用语法分析和语义分析,产生自然语言文本的第一明确模型;用计算机使用第一明确模型来再次产生相同的自然语言的文本;用计算机比较从第一明确模型产生的自然语言文本和原始文本,并标记差别;操作者利用他/她能够查看基本概念的计算机程序,由计算机选择基本概念并加以改变,他/她还确定计算机难以发现的文本的关系和特征,例如言语部分,复合句子中的动作的确定时态,或者两个连续句子中的动作的时间,名词的正确替代物,所关联的言语部分,以及如何关联的;计算机利用操作者的备注和第一明确模型,并产生第二明确模型;计算机利用第二明确模型来再次产生相同自然语言的文本;计算机比较从第二明确模型产生的自然语言文本和原始文本,并标记差别;操作者进行修正,并且重复解释-产生-修正步骤,直到操作者承认从计算机明确模型新近产生的能足够好地表示自然语言文本的含意。2.根据权利要求1所述的自然语言的形式化方法,其特征在于,还包括步骤将形成的 自然语言文本的明确模型,通过链接或通过将自然语言文本的文件连同包含其明确模型的 文件一起放入一个存档封包,来附加到相同的文本上。3.根据权利要求1所述的自然语言的形式化方法,其特征在于,还包括步骤将自然语 言文本的明确模型用于机器处理中,例如检索、提取实情和关系,确定文本的法定含意。4.根据权利要求1所述的自然语言的形式化方法,其特征在于,还包括步骤比较一种 或多种语言的原始文本的人工翻译,以准确地和自动地确定所使用的基本概念,言语部分 以及它们之间的关系、性、数、动作的时态以及与其他动作的时态关系。5.根据权利要求1所述的自然语言的形式化方法,其特征在于,还包括步骤从自然语 言文本的明确模型产生人工语言文本。6.一种用于确定人类所使用的基本概念的方法,用于执行权利要求1所述的方法,其 特征在于,包括步骤对于自然语言的每一个词语,计算机找出并提取其在计算机同义词词典中的同义词; 对于每一对词语-同义词,计算机比较词典给出的对于该词语和该同义词的描述; 对于包含了给定百分比的给定文本的相同词语或词语-同义词的每两个相似文本,认 定它们描述了一个基本概念;计算机输出认定的基本概念列表,以及做出该决定的描述;对每一个认定的基本概念检查数据中心,将在先前步骤中发现的相似文本与中心中的基本概念的描述相比较,确定该基本概念是否已经登记,如果有给定百分比的词语或词 语-同义词,则认为该基本概念已登记,找到...
【专利技术属性】
技术研发人员:I波波夫,KN波波夫,
申请(专利权)人:I波波夫,KN波波夫,
类型:发明
国别省市:BG[保加利亚]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。