使用表格来学习树制造技术

技术编号：2859467 阅读：213 留言：0更新日期：2012-04-11 18:40

揭示了便于通过采用一种学习具有完整表格的贝叶斯网络的学习算法来学习具有决策树的贝叶斯网络的系统和方法。该学习算法可包括一搜索算法，它可反转具有完整表格的贝叶斯网络中的边，以细化与其相关联的有向非循环图。细化的完整表格ＤＡＧ然后可用于导出用于在决策树贝叶斯网络中生长决策树的学习算法的一组约束。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般涉及数据建模和分析，尤其涉及使用完整的数据表格来创建模型(或模式)。
技术介绍
随着因特网，尤其是因特网上的电子商务(“e商务”)的出现，数据分析工具的使用也随之显著地增加。在e商务和其它因特网和非因特网应用中，生成并维护具有非常大量信息的数据库。这类信息通常被分析或“挖掘(mine)”来了解关于顾客、用户、产品等的额外信息。这一信息允许商家和其它用户更好地实现其产品和/或思想。数据挖掘(也称为数据库中的知识发现-KDD)被定义为“从数据中对隐含的、先前未知的和可能有用的信息的非平凡提取”。数据挖掘可采用机器学习、统计和/或可视化技术来发现并呈现容易被人类理解的形式的知识。一般而言，人类能够比文本项更容易地识别或转换图形项。因此，使用这一手段可比其它方法传播更大量的信息。由此，图形统计模型被证明在数据挖掘中是无价的。计算机科学中人工智能的出现带来了丰富的决策支持系统。决策支持系统是其中建议并有时候作出通常由人类托付的决策的计算机系统。在创建决策支持系统时，计算机科学家试图提供具有最大可能准确性的决策。由此，计算机科学家努力创建等效于人类专家或比其更准确的决策支持系统。决策支持系统的应用包括医学诊断、计算机网络故障诊断、或其中决策是基于可标识准则的其它系统。决策支持系统中用于研究的最有希望的新领域之一是贝叶斯网络。贝叶斯网络是关于世界的区别中概率关系的表示。每一区别(也称为变量)可采用一手动排他且穷尽的可能的状态集合之一。贝叶斯网络被表达为非循环有向图，其中，变量对应于节点，而节点之间的关系对应于弧。贝叶斯网络是对感兴趣的变量之间的概率关系...

【技术保护点】
一种便于学习具有局部分布的贝叶斯网络的系统，其中，至少一个分布不是完整表格，所述系统包括：一完整数据集；一贝叶斯网络构造器组件，它构造完整表格贝叶斯网络以表示所述完整数据集中的数据的局部分布，并采用一可反转完整表格贝叶斯网络中的边的学习算法来便于学习决策树贝叶斯网络。

【技术特征摘要】
US 2004-3-25 10/809,0541.一种便于学习具有局部分布的贝叶斯网络的系统，其中，至少一个分布不是完整表格，所述系统包括一完整数据集；一贝叶斯网络构造器组件，它构造完整表格贝叶斯网络以表示所述完整数据集中的数据的局部分布，并采用一可反转完整表格贝叶斯网络中的边的学习算法来便于学习决策树贝叶斯网络。2.如权利要求1所述的系统，其特征在于，所述贝叶斯网络构造器组件还分析一从所述完整表格贝叶斯网络中得出的有向非循环图，以确定所述完整表格贝叶斯网络的偏序。3.如权利要求2所述的系统，其特征在于，所述学习算法准许对所述完整表格贝叶斯网络的有向非循环图的偏序的所述局部分布的构造。4.如权利要求1所述的系统，其特征在于，所述贝叶斯网络构造器组件对所述完整表格贝叶斯网络中的每一边确定一得分。5.如权利要求4所述的系统，其特征在于，所述贝叶斯网络构造器组件为所述完整表格贝叶斯网络中的至少一个其它潜在的边配置确定一得分，以评估是否可以改进边的得分。6.如权利要求5所述的系统，其特征在于，如果边的操纵将改进所述边的得分，则所述贝叶斯网络构造器组件操作所述完整表格贝叶斯网络中的至少一条边。7.如权利要求6所述的系统，其特征在于，所述局部分布包括至少一个决策树。8.如权利要求6所述的系统，其特征在于，所述局部分布包括至少一个支持矢量机。9.如权利要求6所述的系统，其特征在于，所述局部分布包括至少一个逻辑回归。10.一种用于学习具有至少一个是非完整表格的分布的贝叶斯网络的方法，其特征在于，包括输入一完整数据集；学习包括完整表格的第一贝叶斯网络；分析完整表格贝叶斯网络的有向非循环图；以及学习包括至少一个非完整表格分布的第二贝叶斯网络。11.如权利要求10所述的方法，其特征在于，学习所述第一贝叶斯网络包括采用一可反转所述完整表格贝叶斯网络中的边的搜索算法。12.如权利要求11所述的方法，其特征在于，还包括为所述完整表格贝叶斯网络中的至少一条边确定一得分。13.如权利要求12所述的方法，其特征在于，还包括为所述完整表格贝叶斯网络中的其它潜在的边配置确定得分。14.如权利要求13所述的方法，其特征在于，还包括将所述至少一条边的得分与另一潜在边配置的得分进行比较，以确定是否可改进所述至少一条边的得分。15.如权利要求14所述的方法，其特征在于，还包括如果确定可以改进所述至少一条边的得分，则通过操作所述至少一条边以改进所述至少一条边的得分，来细化所述完整表格贝叶斯网络。16.如权利要求15所述的方法，其特征...

【专利技术属性】
技术研发人员：DM奇克林，
申请(专利权)人：微软公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人