基于频繁项挖掘的贝叶斯网络结构优化方法和装置制造方法及图纸

技术编号:34619663 阅读:35 留言:0更新日期:2022-08-20 09:26
本申请涉及一种基于频繁项挖掘的贝叶斯网络结构优化方法。所述方法包括:获取数据集;根据反映随机变量之间关联度的关联规则,构建关联规则集;从数据集提取频繁项集后对预先设置的贝叶斯网络进行学习,得到最大频繁项集对应的最大贝叶斯网络结构集;根据关联规则集和最大贝叶斯网络结构集,从数据集中提取白名单和黑名单后构建罚项;根据罚项和BDeu评分函数,得到融合先验的评分函数,然后进行爬山搜索算法进行循环搜索,得到最优贝叶斯网络结构。采用本方法能够明显提升贝叶斯网络结构学习的效率和准确率。习的效率和准确率。习的效率和准确率。

【技术实现步骤摘要】
基于频繁项挖掘的贝叶斯网络结构优化方法和装置


[0001]本申请涉及数据处理领域,特别是涉及一种基于频繁项挖掘的贝叶斯网络结构优化方法和装置。

技术介绍

[0002]在现有的医疗诊断系统和推荐系统中,在进行病症诊断和喜好推荐时缺乏大数据支撑,诊断和推荐准确率低,随着机器学习领域技术的发展,出现了贝叶斯网络,贝叶斯网络是一种通用的概率图模型,它可以表示随机变量之间的相关性,是随机变量联合概率分布的一种图形化表示,因此具有很强的可解释性,在医疗诊断系统中,随机变量可以是病症和患者个人信息等数据,在喜好推荐系统中,随机变量可以是用户的访问类型和喜好等数据,贝叶斯网络由于能够表示不确定知识并进行推理计算表达,可以应用在医疗诊断系统和推荐系统中,可以辅助进行病症诊断和喜好推荐。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够明显提升病情诊断准确率的基于频繁项挖掘的贝叶斯网络结构优化方法和装置。
[0004]一种基于频繁项挖掘的贝叶斯网络结构优化方法,其特征在于,方法包括:
[0005]获取数据集;数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于频繁项挖掘的贝叶斯网络结构优化方法,其特征在于,所述方法包括:获取数据集;所述数据集中包括随机变量和所述随机变量对应的样本数据;根据反映所述随机变量之间关联度的关联规则,构建关联规则集;从所述数据集提取频繁项集,根据所述频繁项集对预先设置的贝叶斯网络进行学习,得到贝叶斯网络结构集,根据所述贝叶斯网络结构集,得到最大频繁项集对应的最大贝叶斯网络结构集;根据所述关联规则集和所述最大贝叶斯网络结构集,从所述数据集中提取白名单和黑名单;根据所述白名单和黑名单中的样本数据,构建罚项;根据所述罚项和BDeu评分函数,得到融合先验的评分函数;根据融合先验的评分函数以及爬山搜索算法进行循环搜索,得到最优贝叶斯网络结构。2.根据权利要求1所述的方法,其特征在于,所述随机变量指的是贝叶斯网络中的节点,包括病症和患者信息;所述病症和患者信息从医疗系统中提取;根据反映所述随机变量之间关联度的关联规则,构建关联规则集,包括:根据反映所述随机变量之间重要性的支持度规则,以及根据反映所述随机变量之间可信程度的置信度规则,得到关联规则集;所述关联规则集包括随机变量之间的关联性。3.根据权利要求2所述的方法,其特征在于,根据反映所述随机变量之间重要性的支持度规则,以及根据反映所述随机变量之间可信程度的置信度规则,得到关联规则集,包括:获取支持度阈值和置信度阈值,当根据所述支持度规则计算所述随机变量之间的支持度大于或等于所述支持度阈值,并且根据所述置信度规则计算所述随机变量之间的置信度大于或等于所述置信度阈值时,将两个随机变量对应的节点对加入关联规则集。4.根据权利要求1所述的方法,其特征在于,所述贝叶斯网络结构集反映了随机变量之间的依赖关系;根据所述贝叶斯网络结构集,得到最大频繁项集对应的最大贝叶斯网络结构集,包括:根据所述贝叶斯网络结构集,得到最大频繁项集对应的最大贝叶斯网络结构集:其中,BN
max_f
表示最大贝叶斯网络结构集,表示第i个频繁项集freq_item
i
对应的贝叶斯网络结构集,表示所有贝叶斯网络结构集的并集。5.根据权利要求4所述的方法,其特征在于,根据所述关联规则集和所述最大贝叶斯网络结构集,从所述数据集中提取白名单和黑名单,包括:当所述数据集中的随机变量对属于所述关联规则集,并且所述随机变量对属于所述最大贝叶斯网络结构集,则将所述随机变量对加入白名单;当所述数据集中的随机变量对属于所述关联规则集,并且所述随机变量对属于所述最大...

【专利技术属性】
技术研发人员:周鋆李昡熠孙宝丹张维明朱先强
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1