【技术实现步骤摘要】
本专利技术为一种评价汽油性质建模预测结果可信程度的方法,具体是涉及汽油性质检测领域。
技术介绍
目前,近红外光谱分析结合多元校正方法已广泛应用于汽油性质检测领域,对汽油性质的快速检测起到重要作用。在汽油性质建模预测过程中,预处理后的光谱数据经过主成分分析(PCA)后,一般取第一、第二主成分就可以提取到85%的有用信息,足以进行后续的建模分析。在由第一、第二主成分得分构成的坐标图中,我们希望校正样本点分布在待测样本点的附近,类似图1所示。然而,在实际工程应用中,存在类似图2所示的异常情况,即待测样本点与校正样本点分布相去甚远,且校正样本点集中在校正范围的边缘,这反映了待测样本的光谱信息与校正样本的光谱信息实际上差别较大,在此情况下模型给出的预测结果往往是欠准确的。此外,有时还会出现类似图3所示的异常情况,即待测样本点与校正样本点的分布较为分散,且待测样本点附近的校正样本点极少,这反映了与待测样本光谱信息相似的校正样本数很少,在此情况下模型的给出预测结果往往精度偏低,结果可信度不高。为了让使用人员能及时发现模型可能存在的问题,需要给出一种对当前模型预测结果可信程度的量化指标,以便人员及时修正模型,提高模型预测精度。
技术实现思路
针对上述问题,本专利技术提出了一种对模型预测结果可信程度进行量化评价的方法,该方法建立了如下可信度公式:C=(a1×AI+a2×(1-SD)+a3×(1-MN)+a4×R2+a5×(1-RMSECV))×100%(1)式中,AI、SD和MN分别为极值距离系数、距离离散系数和平均距离系数,由样本的主成分得分坐标图计算得到,描述样本的分布集 ...
【技术保护点】
一种评价汽油性质建模预测结果可信程度的方法,其特征在于该方法基于待测样本点和选取的校正样本,通过建立可信度公式,量化汽油性质建模预测结果的可信程度,所述可信度公式:C=(a1×AI+a2×(1‑SD)+a3×(1‑MN)+a4×R2+a5×(1‑RMSECV))×100%式中,AI、SD和MN分别为极值距离系数、距离离散系数和平均距离系数,由样本的主成分得分坐标图计算得到;R2和RMSECV分别为决定系数和交叉验证均方根误差;a1、a2、a3、a4和a5为因子系数。
【技术特征摘要】
1.一种评价汽油性质建模预测结果可信程度的方法,其特征在于该方法基于待测样本点和选取的校正样本,通过建立可信度公式,量化汽油性质建模预测结果的可信程度,所述可信度公式:C=(a1×AI+a2×(1-SD)+a3×(1-MN)+a4×R2+a5×(1-RMSECV))×100%式中,AI、SD和MN分别为极值距离系数、距离离散系数和平均距离系数,由样本的主成分得分坐标图计算得到;R2和RMSECV分别为决定系数和交叉验证均方根误差;a1、a2、a3、a4和a5为因子系数。2.根据权利要求1所述的一种评价汽油性质建模预测结果可信程度的方法,其特征在于极值距离系数AI采用下式定义, A I = d m a x - d min d m a x = 1 - d min d max ]]>其中,dmax为待测样本点与校正样本点之间的最大距离;dmin为待测样本点与校正样本点之间的最小距离。3.根据权利要求1所述的一种评价汽油性质建模预测结果可信程度的方法,其特征在于距离离散系数SD采用下式定义, S D = Σ j = 1 m ( d j - d ‾ ) 2 m - 1 ]]>其中,dj为待测样本点与所有校正样本点两两之间的距离;为待测样本点与所有校正样本点两两之间的距离平均值;m为样本点两两之间的距离个数,即n为待测样本点与所有校正样本点的总数。4.根据权利要求1所述的一种评价汽油性质建模预测结果可信程度的方法,其特征在于平均距离系数MN采用下式定义, M N = d 1 ‾ d 2 ‾ ; d 1 ‾ = Σ i = 1 T d i T ; d 2 ‾ = Σ i = T + 1 S d i ...
【专利技术属性】
技术研发人员:陈夕松,姜胜男,费树岷,方鑫,胡云云,吴沪宁,
申请(专利权)人:南京富岛信息工程有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。