一种基于双基融合机制的KDK*系统技术方案

技术编号:2854045 阅读:162 留言:0更新日期:2012-04-11 18:40
一种基于双基融合机制的KDK*系统,包括中央处理器、存储器组成的数字计算机,所述数字计算机的存储器存储有基础数据库和合成知识库,其特征在于:所述的合成知识库在相应的论域内,以属性为基础将规则库类化为若干规则子库,每一规则子库表征了一类属性;所述的数字计算机执行下述步骤:    a、知识库建构:以属性为基础,形成由规则库和事实库组成的合成知识库,并建立与所述基础数据库间的对应关系;    b、知识库中知识发现过程:根据一般知识库中知识发现算法发现的新的初始假设;    c、假设的数据库验证:R型协调器验证被发现的新的初始假设在数据库中的合理性;    d、假设的数据库中知识发现过程验证:S型协调器将发现的新的初始假设送入KDD*过程中进行定向挖掘,用KDD*的挖掘结果先行评估,若此条规则在KDD*过程中也可被发现,则认为该规则有效的几率较大;反之,则认为此知识缺乏数据支持;    e、假设的知识库验证:T型协调器对已被KDD*过程确认的假设,产生一个定向搜索进程,搜索知识库中对应位置是否有此生成规则的重复、冗余和矛盾;若有重复,则取消该生成规则而返回KDD的“始端”;若无,则继续KDD进程;对于矛盾的处理,采用约束规则的条件与根据其可信度或关联强度来裁决等方法;    f、规则产生:根据通过T型协调器评估结果,产生假设规则;    g、专家评价与存储:对步骤f产生的规则进行专家评价,通过的规则存入扩展知识库。

【技术实现步骤摘要】

本专利技术属于知识库中的知识发现
,特别是提供了一种基于双基融合机制的KDK*系统,具体的讲是一类新型知识发现系统的构造方法。
技术介绍
基于知识库的知识发现(Knowledge Discovery in Knowledge-base,KDK)是指从知识库中发现新的知识,或者对已有知识进行提炼、修正使之更精确、更完备、更简洁。KDK是知识发现领域一个新的具有挑战性的研究方向。知识发现作为知识工程和机器学习领域的重要分枝,从其产生至今的十余年间,研究的主流是基于数据库的知识发现(KDD)。而基于知识库的知识发现,即如何从已有的海量知识库中进一步产生新的深层次的知识并扩充到知识库中(KDK),在国内外基本上无人涉足。KDK是一项综合技术,涉及数据库技术、数据挖掘、计算机语言学、逻辑学、信息学等多个领域。给定一个大型知识库,利用归纳、解释、演绎、类比等方法从中产生新的假设,这些假设在经过事实检验与评价后,形成新的知识并添加到知识库中。它的成功将直接作用于知识获取和大型知识库的建设,并且对于发现大型和通常意义下的知识库可以产生怎样的机器学习程序是很有用的。以下给出KDK界定性的描述(1)KDK的目的是为了在真实的大型知识库中发现新的知识,这种发现过程是非平凡的,意即这种发现过程的核心将是归纳,而演绎将作为辅助手段,它有可能是不保真的;(2)KDK能够发现深层次的知识。具体而言就是在已有属性与关系的基础上进一步发现其上的关系,从逻辑角度上说就是发现谓词间的关系或函词间的关系;(3)由于知识本身所可能具有的一些属性,如不确定性、非单调性、不完全性等,KDK过程的进行也将是一个复杂的多方法多途径的过程。它与知识库的组织、用户对最终寻求的知识类型都紧密相关,采用的推理手段可能涉及很多不同的逻辑领域;(4)KDK发现的知识应该是新颖的、有效的、潜在有用的、用户可理解的。从以上界定性的描述可以看出KDK究其本质应是一种机器学习过程,其目的是获取知识,学习源是知识库中的事实、规则、模式等,学习手段是用归纳结合演绎的方法,其最终结果将既能够发现事实上的知识,也能发现规则上的知识。因此,在具体的实现中,应该采用两条发掘线路,其一是利用归纳方法发掘事实或规则之上的规则;另一条线路是通过高阶推理的方法,从规则库中发现规则,即属性与关系之上的关系。从知识库中发现知识不象从数据库中发现知识那样简单。知识库中的知识发现(KDK)与数据库中的知识发现(KDD)的不同之处主要表现在(1)发现的基础不同KDK针对的对象是知识库,一个真实的知识库一般包含事实库和规则库,它们的结构与数据库有着明显的区别;(2)采用的手段不同知识库中不仅包含着数据,而且包含着显性的关系,如何针对关系得出更高层次的知识,须采用与数据挖掘不同的方法。总括而论,演绎逻辑系统(包括经典的和非标准的)已在计算机科学技术中占有重要的地位。机器学习、归纳学习与不确定性推理至今仍主要是以演绎逻辑系统作为工具的。由于计算机本身是演绎化的产物,而发现的核心是归纳;因此,唯一要做的是归纳的演绎化或演绎的归纳化。当前国内外对知识库的研究仅停留在消除知识库的矛盾、冗余、推理链循环以及完备性检测等方面,而基于知识库中事实和规则之上的知识发现(KDK)尚没有系统的研究成果。
技术实现思路
本专利技术的目的在于提供一种基于双基融合机制的KDK*系统,克服了知识发现主流发展中的问题;本专利技术提出了一类基于双基融合机制的完备型KDK*新系统的构造方法。一种基于双基融合机制的KDK*系统,包括中央处理器、存储器组成的数字计算机,所述数字计算机的存储器存储有基础数据库和合成知识库,其特征在于所述的合成知识库在相应的论域内,以属性为基础将规则库类化为若干规则子库,每一规则子库表征了一类属性。所述的数字计算机执行下述步骤1)知识库建构以属性为基础,形成由规则库和事实库组成的合成知识库,并建立与所述基础数据库间的对应关系;2)知识库中知识发现过程根据一般知识库中知识发现算法发现的新的初始假设;3)假设的数据库验证R型协调器验证被发现的新的初始假设在数据库中的合理性;4)假设的数据库中知识发现过程验证S型协调器将发现的新的初始假设送入KDD*过程中进行定向挖掘,用KDD*的挖掘结果先行评估,若此条规则在KDD*过程中也可被发现,则认为该规则有效的几率较大;反之,则认为此知识缺乏数据支持;5)假设的知识库验证T型协调器对已被KDD*过程确认的假设,产生一个定向搜索进程,搜索知识库中对应位置是否有此生成规则的重复、冗余和矛盾;若有重复,则取消该生成规则而返回KDD的“始端”;若无,则继续KDD进程。对于矛盾的处理,采用约束规则的条件与根据其可信度或关联强度来裁决等方法;6)规则产生根据通过T型协调器评估结果,产生假设规则;7)专家评价与存储对步骤6)产生的规则进行专家评价,通过的规则存入扩展知识库。本专利技术所述的存储器为大容量存储器,也可为2~10个大容量存储器组成的超大容量存储系统。本专利技术所述的数字计算机为2~10台计算机组成的数字计算机系统。本专利技术之步骤1)所述的对应关系为合成知识库的规则子库与基础数据库的数据子类间的对应关系。本专利技术之步骤3)所述的R型协调器包括以下步骤1)根据知识库中的所有知识素结点到数据库中找到其对应的数据子类结构,形成素结点的数据子类表;2)对上述的数据子类表进行处理,使得表中仅包含属性的域的定义;3)根据需要验证的知识合结点对上述的数据子类表进行交、并运算,得出结果表;4)读出结果表中对各属性的域的定义,进行匹配运算,相符者通过验证,反之删去。本专利技术之步骤4)所述的S型协调器包括以下步骤1)由KDK过程发现的新规则已通过R型协调器的验证,规则形式为始知识结点→终知识结点。将始知识结点与终知识结点分别化为析取范式的结构;2)将此析取范式继续转化,将析取范式中的每一个合取式转化为知识库中的基本单元,即状态描述的形式;3)算出始结点与终结点的正则测度函数值;4)算出本条规则的正则确证度函数值;5)若本规则的正则确证度函数值低于给定阈值,则抛弃本条新知识,给出提示;6)若本条知识的正则确证度函数高于给定阈值,定向搜索数据库,计算数据库中对本规则的支持度和可信度。若支持度和可信度低于给定阈值,抛弃本条规则,给出提示;7)规则通过验证,送入评价函数中进行评价。本专利技术之步骤5)所述的T型协调器包括以下步骤1)对于通过了S型协调器评价的假设,检验是否可信度大于阈值若结果为假,退出;2)检验假设是否重复若结果为真,退出;3)检验假设是否冗余若结果为真,退出;4)检验假设是否矛盾若结果为真,退出;5)存储假设入合成知识库中。本专利技术首次提出了一类基于双基融合机制的完备型KDK*新系统;对基于知识库的知识发现内在机理中双基融合机制的研究,不仅对知识发现算法具有重要的意义,而且对知识发现的主流发展也起到了重要的推动作用,表现如下(1)双基融合机制是对知识发现系统内在机理的一种研究,其本质在于数据库与知识库的一种协调,这种协调不是简单的叠加,而是挖掘出两者的内在联系,从本质上寻求切入点。这符合世界的自然规律和人对事物的认识规律,我们可将数据库理解为人类认识的源泉,而知识库相应的应该体现人类的认识结果。将数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双基融合机制的KDK*系统,包括中央处理器、存储器组成的数字计算机,所述数字计算机的存储器存储有基础数据库和合成知识库,其特征在于所述的合成知识库在相应的论域内,以属性为基础将规则库类化为若干规则子库,每一规则子库表征了一类属性;所述的数字计算机执行下述步骤a、知识库建构以属性为基础,形成由规则库和事实库组成的合成知识库,并建立与所述基础数据库间的对应关系;b、知识库中知识发现过程根据一般知识库中知识发现算法发现的新的初始假设;c、假设的数据库验证R型协调器验证被发现的新的初始假设在数据库中的合理性;d、假设的数据库中知识发现过程验证S型协调器将发现的新的初始假设送入KDD*过程中进行定向挖掘,用KDD*的挖掘结果先行评估,若此条规则在KDD*过程中也可被发现,则认为该规则有效的几率较大;反之,则认为此知识缺乏数据支持;e、假设的知识库验证T型协调器对已被KDD*过程确认的假设,产生一个定向搜索进程,搜索知识库中对应位置是否有此生成规则的重复、冗余和矛盾;若有重复,则取消该生成规则而返回KDD的“始端”;若无,则继续KDD进程;对于矛盾的处理,采用约束规则的条件与根据其可信度或关联强度来裁决等方法;f、规则产生根据通过T型协调器评估结果,产生假设规则;g、专家评价与存储对步骤f产生的规则进行专家评价,通过的规则存入扩展知识库。2.根据权利要求1所述的KDK*系统,其特征在于所述的存储器为2~10台大容量存储器组成的超大容量存储系统。3.根据权利要求1所述的KDK*系统,其特征在于所述的数字计算机为2~10台计算机组成的数字计算机系统。4.根据权利要求1所述的基于双基融合机制的完备型KDK*系统,其特征在于所述的对应...

【专利技术属性】
技术研发人员:杨炳儒
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利