一种无先验知识条件下基于小数据集的贝叶斯网络参数学习方法技术

技术编号：19512230 阅读：154 留言：0更新日期：2018-11-21 08:20

本发明专利技术公开了一种无先验知识条件下基于小数据集的贝叶斯网络参数学习方法，属于计算机技术领域。该方法首先获取数据统计量，而后根据小数据集的数据量和待求参数的状态个数确定虚拟样本量，利用最大似然估计方法计算待求的参数，对同一分布条件下的参数进行排序，找出较小的参数；最后计算贝叶斯网络参数。本发明专利技术针对无先验知识时小数据集条件下的贝叶斯网络参数问题，通过在引入虚拟统计量来提高小数据集条件下的参数学习精度，克服了现有方法对先验知识的依赖问题，不仅为小数据集条件下的参数学习问题提供了一条可行的解决途径，而且也为其它领域中的小数据集建模问题提供了可参考的方法，具有较为广泛的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种无先验知识条件下基于小数据集的贝叶斯网络参数学习方法
本专利技术属于计算机
，涉及一种无先验知识条件下基于小数据集的贝叶斯网络参数学习方法，可用于无先验认知条件下的针对实际问题的贝叶斯网络参数建模和数据分析。
技术介绍
贝叶斯网络是图论和概率论相结合的产物，有着强大的理论基础，已经成为处理不确定问题的主流方法。在工业界，作为贝叶斯网络的积极倡导者之一，微软已在其office软件的帮助系统中成功采用贝叶斯网络，以期为用户提供更好的服务。而在学术界，《Science》和《Nature》多次刊登相关的研究论文对贝叶斯网络予以介绍，人工智能领域的一系列顶级期刊(ArtificialIntelligence、JournalofMachineLearningReasearch等)和顶级会议(IJCAI、ICML、UAI和AISTATS等)中有关贝叶斯网络的论文也常年维持着较高的水平。在实际的问题中，数据是决定贝叶斯网络模型优劣的关键。一般来说，数据越充足，构建的贝叶斯网络越精确。遗憾的是，它与所要构建模型的精度密切相关，要获得完全准确的模型所需的“充分”数据量一般难以得到。一方面，某些领域可获得的数据比较少或者数据的代价比较昂贵，例如，地质灾害预测、罕见疾病诊断、装备故障诊断以及作战指挥决策等。另一方面，数据量的增加是一个逐渐积累的过程，数据量的积累是一个由小变大、由少变多的过程，所以数据量必然会经历不充分的阶段。再者，在某些特定场合不得不在数据不充分的条件下完成决策。例如，在一些作战过程中，为了达到“先敌决策、先敌打击”的战术目的，不得不在数据尚不充分的条...

【技术保护点】
1.一种无先验知识条件下基于小数据集的贝叶斯网络参数学习方法，其特征在于，包括入戏步骤：步骤1：获取数据统计量：在小数据集条件下，通过统计获取参数学习所需的对应的状态统计量Nijk和Nij，其中，Nijk表示数据集中节点i取值为k，且其父节点取值为j的样本个数，Nij为数据集中节点i的父节点取值为j的样本个数；步骤2：根据小数据集的数据量和待求参数的状态个数确定虚拟样本量：设待求参数为θijk，其中k有r种取值状态，设数据量为N，则Nneed＝n2logn2lognm+1 (1)α1＝α2＝L＝αr＝Nneed‑N (2)其中，n为网络节点个数，m为网络种的最大父节点数，Nneed为学习网络参数所需的样本量可由公式(1)计算得到，α1,α2Kαr分别表示同一分布条件下，即父节点取值相同时的一组参数对应的虚拟样本量；步骤3：利用最大似然估计方法计算待求的参数，具体通过利用公式(3)求解：

【技术特征摘要】
1.一种无先验知识条件下基于小数据集的贝叶斯网络参数学习方法，其特征在于，包括入戏步骤：步骤1：获取数据统计量：在小数据集条件下，通过统计获取参数学习所需的对应的状态统计量Nijk和Nij，其中，Nijk表示数据集中节点i取值为k，且其父节点取值为j的样本个数，Nij为数据集中节点i的父节点取值为j的样本个数；步骤2：根据小数据集的数据量和待求参数的状态个数确定虚拟样本量：设待求参数为θijk，其中k有r种取值状态，设数据量为N，则Nneed＝n2logn2lognm+1(1)α1＝α2＝L＝αr...

【专利技术属性】
技术研发人员：邸若海，高晓光，万开方，郭志高，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人