基于自适应变权重的BN参数学习算法及其应用制造技术

技术编号：28747239 阅读：22 留言：0更新日期：2021-06-06 19:05

本发明专利技术提供了一种基于自适应变权重的BN参数学习算法，首先根据小样本数据量的变化，设计了调整样本数据和定性约束扩展参数的权重系数，然后进行自适应加权融合计算得出BN参数学习结果，解决在小数据集情况下贝叶斯网络参数学习的问题。本发明专利技术提出的基于自适应变权重的BN参数学习算法在小数据集下进行BN参数学习时，能够随着数据量的变化自适应调整样本量和定性约束参数的权重，进而优化参数学习的结果，提高了学习精度，该算法应用在轴承故障诊断中也展现出其优异的可行性和实用性。诊断中也展现出其优异的可行性和实用性。诊断中也展现出其优异的可行性和实用性。

全部详细技术资料下载

【技术实现步骤摘要】
基于自适应变权重的BN参数学习算法及其应用

[0001]本专利技术属于人工智能算法
，具体涉及一种基于自适应变权重的BN参数学习算法及其应用。

技术介绍

[0002]随着贝叶斯网络(Bayesian network,BN)理论的不断深入研究，其应用范围越来越广泛，如故障的诊断、经济领域的预测以及医学诊断等都可以通过BN来进行参数学习，但很多时候数据不足导致无法学到更精确的结果。
[0003]当样本数据集充足时，最大似然估计法(Maximal LikelihoodEstimate,MLE)能很好实现BN参数估计，但是当样本数据较少时，该方法就不能更精确地去估计参数；定性最大后验概率(QualitativeMaximumAPosterior,QMAP)方法对满足定性约束的参数集合通过拒绝
‑
接受算法进行虚拟采样，再将真实数据和虚拟数据结合估计BN 参数，但拒绝
‑
接受算法以概率分布函数估计为基础，实际问题中BN 参数的概率分布函数较难估计，限制了该方法的应用。丁建华、张忠占提出一种单调约束估计算法(monotonic constraint estimationalgorithm,MCE)，利用单调约束模型学习参数，当训练数据不足时，将领域知识引入参数学习过程中，虽然该方法也提高了参数学习的精度，但实际应用中单调约束的假设不易给定(详见：丁建华，张忠占. 单调约束条件下部分线性模型的Bernstein多项式估计(英文)[J].应用概率统计，201，30(04)：381/>‑
397.)。另有学者提出一种基于定性知识和进化策略的约束参数进化学习算法(CPEL)，首先在BN参数学习过程中引入定性知识，以减小参数搜索空间，然后引入进化策略，避免结果陷入局部最优，但该算法在解决参数优化问题中存在收敛结果不稳定的缺陷。定性约束扩展BN参数的方法可以把定性的专家经验转化为不等式约束，并利用Bootstrap算法生成满足约束的一组BN 参数候选集(详见：郭文强,李然,侯勇严,高文强.约束条件下BN参数最大熵模型扩展学习算法[J].计算机应用研究,2019,36(2):132
‑
137.)，但该方法得到的BN参数过分依赖专家经验，不能根据数据集大小的变化情况，自动调整参数估计中各学习数据集的权重系数，影响了最终参数估计的准确性。

技术实现思路

[0004]为了克服以上方法的缺陷，并且更好地解决样本数据较少时进行参数学习的问题，同时能够在实际应用中更方便地去估计参数，并得到稳定的参数学习结果，本专利技术通过引入变权重思想将样本数据和领域定性知识结合起来去进行参数估计，使得在样本数据较少的情况下，也可以有效地提高BN参数学习的精度。
[0005]基于上述目的，本专利技术提出一种基于自适应变权重的BN参数学习算法，是根据小样本数据量的变化，自适应调整样本数据和定性约束扩展参数的权重系数，进行变加权融合计算得出BN参数学习结果，解决在小数据集情况下贝叶斯网络参数学习的问题。
[0006]具体地，本专利技术所述的基于自适应变权重的BN参数学习算法包括，
[0007]建立参数学习模型结构；
[0008]获取计算参数学习模型所需的最小样本数据集阈值；
[0009]确定参数学习模型的不等式约束条件；
[0010]计算初始参数集；
[0011]进行参数扩展得到满足约束条件的候选参数集；
[0012]根据设计的变权重因子函数，自适应地确定合适的变权重因子；
[0013]将样本数据初始参数集、定性约束扩展候选参数集、变权重因子以及参数学习总备选数据集个数代入计算得到最终的参数学习结果。
[0014]本领域技术普通技术人员知晓，贝叶斯网络(BN)参数学习是在已知贝叶斯网络拓扑结构的前提下，通过利用专家先验知识以及训练样本数据，来确定模型中相关变量间的条件概率分布的过程。结合两种或两种以上数据集来进行BN参数学习，既能够避免仅使用单一数据集导致数据信息利用不充分的缺点，又能提高参数学习的精度。但结合多种数据集进行参数加权估计时，考虑每种数据集所占的权重对结果也会产生影响，而权重可分为固定权重和变化权重两种类型。在参数估计过程中，每种数据集的权重系数因某种规则变化则称之为变权重方法(本文称之为自适应变权重，Adaptive Weight ParameterLearning,AWPL)，反之则为不变权重即定权重方法(本文称之为 FixedWeight Parameter Learning,FWPL)。
[0015]本专利技术选择自适应变权重框架作为目标融合领域(BN约束知识和样本数据)和目标评估领域(BN参数学习)的估计模型，主要基于以下考虑：信息融合具有一定的容错性，对所采用的样本数据和约束信息进行加权组合，调节权重，而不会破坏整个估计模型的正确性；同时，它自然地解决了统计模型中参数适应性问题，即根据样本数据量的大小调节权重，满足约束知识和样本数据的融合性。基于自适应变权重进行参数学习的基本思想是根据数据量的变化情况，不断调整参数估计中各学习数据集的权重系数，然后加权融合确定出最终参数估计结果。
[0016]本专利技术中，所述计算参数学习模型所需的最小样本数据集阈值M 通过式(1)计算获得，
[0017][0018]其中，M表示所需最小数据集数量；λ表示度量网络结构中变量的概率分布的偏度系数；d表示最大父节点数；ε表示KL误差；N 表示网络节点数；K表示网络节点最大状态数；δ表示网络置信度。
[0019]本专利技术中，所述初始参数集根据式(2)计算得到，
[0020][0021]其中，η为一个接近于零的很小常数，c＝q
i
·
r
i
，q
i
表示父节点变量的取值数，r
i
表示子节点变量的取值数。
[0022]本专利技术中，所述BN变权重参数根据式(3)计算评估得到，
[0023][0024]其中，θ
data
表示样本数据参数集，θ
constraintextension
表示定性约束扩展参数集，θ
estimate
为最终参数学习结果。
[0025]本专利技术中，所述设计的变权重因子ω根据式(4)计算得到，
[0026][0027]其中，D为样本量，其含义是通过样本量与最小样本数据集阈值的比值来反映样本数据量的规模。
[0028]本专利技术中，所述BN变权重参数计算模型与式(3)相同，通过分析可知：在公式(4)中，若数据量D趋向于+∞，则ω近似等于1，此时利用式(3)进行参数估计的结果依赖于样本数据本身数据量，其结果趋向于MLE方法估计的结果。若数据量接近于0，则ω近似等于0，此时参数估计结果倾向于由定性约束扩展参数集获得，即依赖于先验知识。随着学习参数集总数的逐渐变化，可调整定性约束扩展参数集和样本数据集各自所占的权重因子比重。综上所述，由基于自适应变权重本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于自适应变权重的BN参数学习算法，其特征在于，根据小样本数据量的变化，设计调整样本数据和定性约束扩展参数的权重系数，进行变加权融合计算得出BN参数学习结果。2.根据权利要求1所述的基于自适应变权重的BN参数学习算法，其特征在于，所述的基于自适应变权重的BN参数学习算法，具体包括，建立参数学习模型结构；获取计算参数学习模型所需的最小样本数据集阈值；确定参数学习模型的不等式约束条件；计算初始参数集；进行参数扩展得到满足约束条件的候选参数集；根据设计的变权重因子函数确定合适的变权重因子；将样本数据初始参数集、约束扩展候选参数集、变权重因子以及参数学习总备选数据集个数计算得到最终的参数学习结果。3.根据权利要求2所述的基于自适应变权重的BN参数学习算法，其特征在于，所述获取计算参数学习模型所需的最小样本数据集阈值，具体通过式(1)计算获得，式(1)：其中，M表示所需最小数据集数量；λ表示度量网络结构中变量的概率分布的偏度系数；d表示最大父节点数；ε表示KL误差；N表示网络节点数；K表示网络节点最大状态数；δ表示网络置信度。4.根据权利要求2所述的基于自适应变权重的BN参数学习算法，其特征在于，所述计算初始参数集，具体是根据式(2)计算得到，式(2)：其中，η为一个接近于零的很小常数，c＝q
i
·
r
i
，q
i
...

【专利技术属性】
技术研发人员：侯勇严，郑恩让，郭文强，黄梓轩，李梦然，徐成，
申请(专利权)人：陕西科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人