一种对对象基于区间数的基本概率分配生成方法技术

技术编号：22817675 阅读：23 留言：0更新日期：2019-12-14 13:21

本发明专利技术涉及一种对对象基于区间数的基本概率分配生成方法，其包括：获取已知分类情况的训练样本形成训练集，每类训练样本包括至少一个属性特征；对所有属性特征进行归一化处理；提取各类训练样本中各个属性特征的最大值和最小值构建各个属性特征的区间数模型；将待测对象属性特征归一化处理；计算待测对象各个属性特征和区间数模型中各个区间数的相似度；根据训练集中不同属性特征数据的不确定程度确定每个属性特征权重；利用计算的相似度和属性特征权重确定待测对象的BPA；利用组合规则将待测对象的BPA进行融合得到待测对象最终的BPA。本发明专利技术克服现有的区间数相似度计算公式的缺陷，同时考虑到特征数据的不同权重，构造出更加合理的BPA生成方法。

A method of generating basic probability assignment for objects based on interval number

全部详细技术资料下载

【技术实现步骤摘要】
一种对对象基于区间数的基本概率分配生成方法
本专利技术涉及分类算法领域，更具体地，涉及一种对对象基于区间数的基本概率分配生成方法。
技术介绍
在模式识别、认知决策和信息融合等领域，Dempster提出的Dempster-Shafer证据理论(简称D-S证据理论)由于其具有较强的不确定信息表达及处理能力，因而有着广泛的应用。在使用D-S证据理论组合规则对数据进行融合时，第一步就是要求出基本概率分配BPA。而如何生成基本概率分配BPA至今仍未得出一致的结论。目前常见的是一些基于传统模糊集理论的方法，分别是基于区间数模型、基于正态分布模型来生成基本概率分配BPA的方法。如图1所示，基于模糊集理论的基本概率分配BPA的生成方法首先将原始数据集分成训练集和测试集，再分别提取数据的n个特征，得到特征数据之后将训练集的特征数据分别构建区间数或者正态分布模型，再从测试集中随机抽取样本，通过某种方法得到测试样本和构建好的模糊数模型之间的相似度，再经过标准化得到基本概率分配BPA。最后再利用Dempster组合规则进行融合得到最终的结果，具体计算方式如下：定义1：识别框架Θ：令Θ＝{H1,H2,…,HN}，如果H1,H2,…,HN相互独立且对应于我们关心的命题，则Θ为识别框架。它的幂集定义为：显然2Θ包含了Θ所有的子集，即所有命题可能出现的组合情况。■定义2：基本概率分配BPA(BasicProbabilityAssignment)若函数m(·)：2Θ→,0,1-满足下列条件：r>那么m(·)即为2Θ上的基本概率分配函数或mass函数，m(A)表示对命题A的基本概率分配即对命题A的支持程度。■定义3：焦元(FocalElement)：对于辨识框架的任一子集A，如果m(A)＞0，则称A为焦元。■定义4：Dempster组合规则：假设识别框架上，性质不同的两个证据，其焦元分别为Ai和Bj(i＝1，…，n；j＝1，…，m)，其基本概率分配函数分别为m1和m2，则Dempster组合规则表示为：其中，是矛盾因子，用来反应融合过程中各证据间的冲突程度。基于区间数的基本概率分配BPA生成方法是利用两个区间数的相似度来表征样本属性之间的不同。由于区间数可视为正态分布函数的退化，因此构造区间数模型所需的信息量会比正态分布函数少。所以基于区间数模型的方法比正态分布函数更简单、更容易实现。在现有的基于区间数生成基本概率分配BPA的方法中，其衡量两个区间数的相似度的计算公式存在一些缺点，使得获得的相似度不够合理，进而造成生成的基本概率分配不够准确，最终导致对对象的分类不够准确。而且现有的方法在利用相似度生成基本概率分配的过程时并没有考虑各个特征数据是否会有不一样的特征权重，使得生成的基本概率分配不够客观合理，这些都会影响最终使用D-S证据理论进行融合的效果。
技术实现思路
本专利技术旨在克服上述现有技术中未考虑各个特征数据是否会有不一样的特征权重的缺点，提供一种对对象基于区间数的基本概率分配生成方法，该方法根据特征数据的不确定性，引入特征权重，使得不同特征的数据在数据融合过程中所占的重要程度更加合理，生成的基本概率分配BPA更加准确。本专利技术采取的技术方案是：一种对对象进行基于区间数的基本概率分配生成方法，所述方法包括步骤：S1、获取已知分类情况的原始训练样本形成训练集，每一类训练样本包括至少一个属性特征；S2、对所有训练样本的属性特征进行归一化处理；S3、提取各类训练样本中各个属性特征的最大值和最小值构建各个属性特征的区间数模型；S4、将待测对象的各个属性特征进行归一化处理；S5、计算待测对象归一化后的各个属性特征和区间数模型中各个区间数的相似度；S6、根据训练集中不同属性特征数据的不确定程度确定每个属性特征权重；S7、利用所计算的相似度和属性特征权重确定待测对象的基本概率分配BPA；S8、利用组合规则将待测对象的基本概率分配BPA进行融合得到待测对象最终的基本概率分配BPA。上述方案中，S5的具体步骤为：S51、计算区间数A和B中点之间的距离其中A表示待测对象对应的区间数，B表示训练样本对应的区间数，a1、a2分别表示区间数A的上、下界，b1、b2分别表示区间数B的上、下界；S52、根据区间数A和B中点之间的距离计算区间数A和B的相似度：S(A，B)＝1-d(A，B)。上述方案中，所述的属性特征权重具体定义为：设Iij为训练集中第i个类训练样本中第j种属性特征的所有样本构成的区间数，其中，i＝1，…，k；j＝1，…，n；所有类别训练样本的第j种特征的区间长度和为：其中ι(Iij)是区间数Iij的宽度；则确定所有类别训练样本的第j种特征的特征权重为：上述方案中，所述S7的具体过程为：设为空集，则空集的基本概率分配BPA为单个属性特征的基本概率分配BPA为m(A)＝Wj×Sj(A)，其中，Wj表示第j种特征的特征权重，Sj(A)表示第j种特征的待测对象和区间数之间的相似度。上述方案中，第j种属性特征下待测对象的基本概率分配BPA还包括为Θ表示第j种属性特征下所有类训练样本的区间数的重合区间数。上述方案中，在计算m(A)＝Wj×Sj(A)，(A≠Θ且)前，需要作如下判断处理：若∑Sj(A)＞1，则需要先对Sj(A)进行标准化处理，再计算m(A)＝Wj×Sj(A)，(A≠Θ且)；若∑Sj(A)＜1，则不需对Sj(A)进行标准化处理，直接计算m(A)＝Wj×Sj(A)，(A≠Θ且)；其中，∑Sj(A)表示第j个特征下各类训练样本计算出来的相似度之和。与现有技术相比，本专利技术的有益效果为：本专利技术针对对象的分类方法，提出了一种新的区间数相似度确定方式，使得到的待测样本与区间数之间的相似度更为合理；同时根据特征数据的不确定性，引入特征权重，使得不同特征的数据在数据融合过程中所占的重要程度更加合理，从而结合区间相似度以及特征权重构造出更加合理的基本概率分配BPA，从而使得对对象的分类更为准确。附图说明图1为现有的基本概率分配BPA生成方法的步骤流程图。图2为本专利技术提出的基本概率分配BPA生成方法的步骤流程图。图3为本专利技术实验1的实验结果示意图。图4为本专利技术实验2的实验结果示意图。图5为本专利技术实验3中Iris数据集的实验结果示意图。图6为本专利技术实验3中Wine数据集的实验结果示意图。图7为本专利技术实验3中Seed数据集的实验结果示意图。具体实施方式如图2所示，本专利技术一种对对象进行基于区间数的基本概率分配生成方法的具体步骤包括：S1、获取已知分类情况的原始训练样本形成训练集，每一类训练样本包括至少一个属性特征；S2、对所有训练样本的属性特征进行归一化处理；S3、提取各类训练样本中各本文档来自技高网...

【技术保护点】
1.一种对对象进行基于区间数的基本概率分配生成方法，其特征在于，所述方法包括步骤：/nS1、获取已知分类情况的原始训练样本形成训练集，每一类训练样本包括至少一个属性特征；/nS2、对所有训练样本的属性特征进行归一化处理；/nS3、提取各类训练样本中各个属性特征的最大值和最小值构建各个属性特征的区间数模型；/nS4、将待测对象的各个属性特征进行归一化处理；/nS5、计算待测对象归一化后的各个属性特征和区间数模型中各个区间数的相似度；/nS6、根据训练集中不同属性特征数据的不确定程度确定每个属性特征权重；/nS7、利用所计算的相似度和属性特征权重确定待测对象的基本概率分配BPA；/nS8、利用组合规则将待测对象的基本概率分配BPA进行融合得到待测对象最终的基本概率分配BPA。/n

【技术特征摘要】
1.一种对对象进行基于区间数的基本概率分配生成方法，其特征在于，所述方法包括步骤：
S1、获取已知分类情况的原始训练样本形成训练集，每一类训练样本包括至少一个属性特征；
S2、对所有训练样本的属性特征进行归一化处理；
S3、提取各类训练样本中各个属性特征的最大值和最小值构建各个属性特征的区间数模型；
S4、将待测对象的各个属性特征进行归一化处理；
S5、计算待测对象归一化后的各个属性特征和区间数模型中各个区间数的相似度；
S6、根据训练集中不同属性特征数据的不确定程度确定每个属性特征权重；
S7、利用所计算的相似度和属性特征权重确定待测对象的基本概率分配BPA；
S8、利用组合规则将待测对象的基本概率分配BPA进行融合得到待测对象最终的基本概率分配BPA。

2.根据权利要求1所述的对对象进行基于区间数的基本概率分配生成方法，其特征在于，S5的具体步骤为：
S51、计算区间数A和B中点之间的距离其中A表示待测对象对应的区间数，B表示训练样本对应的区间数，a1、a2分别表示区间数A的上、下界，b1、b2分别表示区间数B的上、下界；
S52、根据区间数A和B中点之间的距离计算区间数A和B的相似度：S(A,B)＝1-d(A,B)。

3.根据权利要求1所述的对对象进行基于区间数的基本概...

【专利技术属性】
技术研发人员：刘星成，钟思强，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人