一种基于信息熵等值的扩容样本容量优化方法技术

技术编号：13165556 阅读：75 留言：0更新日期：2016-05-10 11:06

本发明专利技术提供一种基于信息熵等值的扩容样本容量优化方法，在准确度量扩容样本可信度的基础上，分别计算真实样本和异可信度的扩容样本的融合概率密度分布，通过采用信息熵来度量高维不相关故障样本包含信息量的大小，根据扩容样本所包含的信息量与真实样本等值的原则，建立扩容样本容量的信息熵优化模型，从而控制扩容样本容量，最终达到提高故障识别率的目的。本发明专利技术通过对高维不相关样本的容量优化控制，指导扩容样本的正确选择，可避免发生“信息对冲”，提高小样本条件下故障源识别率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及样本容量优化控制方法领域，具体涉及一种基于信息熵等值的扩容样本容量优化方法。
技术介绍
在工程应用中经常会遇到样本容量优化控制问题。张湘平等推导了样本容量、验前信息以及Bayes决策风险三者关系式，以此确定导弹落点样本量。刘军等针对小样本情况下辨识分类问题提出了基于相对熵最小的补充试验样本容量优化方法，通过样本容量优化设计以提高辨识分类识别率，此外，Nyamundanda等为解决代谢组学研究中的实验次数优化问题，提出了 Me t S i z eR方法。这些样本容量控制方法基本是针对一维样本或高维不相关样本展开优化设计，而工程实际中大量样本是高维相关的时间序列，例如船舶声学故障源扩容样本，对于这类扩容样本若没有合适的容量控制方法，将导致扩容样本信息过多从而与真实样本发生对冲，造成分类器识别性能下降。
技术实现思路
本专利技术的目的是提供，通过对高维不相关样本的容量优化控制，指导扩容样本的正确选择，避免发生"信息对冲"，提高小样本条件下故障源识别率。为了实现上述目的，本专利技术采用的技术方案如下： -种基于信息熵等值的扩容样本容量优化方法，在准确度量扩容样本可信度的基础上，分别计算真实样本和异可信度的扩容样本的融合概率密度分布，通过采用信息熵来度量高维不相关故障样本包含信息量的大小，根据扩容样本所包含的信息量与真实样本等值的原则，建立扩容样本容量的信息熵优化模型，从而控制扩容样本容量。根据以上方案，所述扩容样本可信度的大小采用基于核函数的样本可信度度量方法(KBCM方法)来度量，并且进行从大到小的...

【技术保护点】
一种基于信息熵等值的扩容样本容量优化方法，其特征在于，在准确度量扩容样本可信度的基础上，分别计算真实样本和异可信度的扩容样本的融合概率密度分布，通过采用信息熵来度量高维不相关故障样本包含信息量的大小，根据扩容样本所包含的信息量与真实样本等值的原则，建立扩容样本容量的信息熵优化模型，从而控制扩容样本容量。

【技术特征摘要】

【专利技术属性】
技术研发人员：章林柯，李和君，魏娜，胡恒宾，李大坤，
申请(专利权)人：武汉理工大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人