【技术实现步骤摘要】
一种基于样本贡献率的二分类硬分类器的单次检测可信度评价方法
本专利技术属于二分类检测可信度评价
技术介绍
在高风险领域,如航空航天领域对密封继电器信号进行检测时,除了关心预测模型能否识别出被检测样本所属类别、以及整体识别准确率之外,更关心针对单一样本的识别结果是否可信,即:单次识别结果的可靠程度。以一些精密仪器检测为例,若检测结果发生错误,会带来不可估量的损失,更严重的会引起人员伤亡。所以,对于这类高风险领域背景下的检测系统,不能只是要求给出检测结果,更应该给出输出结果的可靠性估值,让使用人员可以通过结果的可靠性估值去决定处理方式。可信程度即统计学上的置信度的定义,也叫置信水平,是指总体参数值落在样本统计值某一区域内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值之间的误差范围。通常置信区间越大,置信水平越高。近年来,随着机器学习的热门,置信度在机器学习领域得到了广泛的应用,即置信度机制。机器学习领域的置信度机制是以统计学上的置信度为理论基础进行研究,并在此基础上结合新的思想形成一种新 ...
【技术保护点】
1.一种基于样本贡献率的二分类硬分类器的单次检测可信度评价方法,其特征在于,包括以下步骤:/n步骤一:将样本集X输入到二分类硬分类器模型中,分别获得每个样本到超平面的距离d(X
【技术特征摘要】
1.一种基于样本贡献率的二分类硬分类器的单次检测可信度评价方法,其特征在于,包括以下步骤:
步骤一:将样本集X输入到二分类硬分类器模型中,分别获得每个样本到超平面的距离d(Xk),k=1,2,...,Z,Z为样本集X中的样本总数;
步骤二:将所有d(Xk)从小到大进行排序并构成集合D(X),将集合D(X)中最小值到最大值之间的跨度作为集合D(X)的总区间长度,以j为子区间长度将D(X)的总区间长度划分为N个子区间,其中0<j<1;
步骤三:对所有d(Xk)进行插值处理、使得d(Xk)对应的样本Xk分配到相应的子区间中;
步骤四:根据下式计算第i个子区间内样本的正确率f(i):
其中,Ti为第i个子区间内分配正确的样本个数,Ki为第i个子区间内所有的样本个数,i=1,2,...,N;
步骤五:根据下式计算第i个子区间内样本的贡献率Ui:
步骤六:根据下式计算第i个子区间内样本的可信度confidence:
confidence=t×Ui+(1-t)*f(i),
其中,t为权重。
2.根据权...
【专利技术属性】
技术研发人员:王国涛,赵广龙,吕冰泽,李响,吴耀阳,藤玉茹,
申请(专利权)人:黑龙江大学,
类型:发明
国别省市:黑龙江;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。