基于混合整数线性规划的粗糙集模型建立方法和装置制造方法及图纸

技术编号:16365683 阅读:44 留言:0更新日期:2017-10-10 21:46
本发明专利技术提供了一种基于混合整数线性规划的粗糙集模型建立方法和装置,该方法包括:获取原始数据;根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。本发明专利技术还公开相应的基于混合整数线性规划的粗糙集模型建立装置。

Method and apparatus for building rough set model based on mixed integer linear programming

The present invention provides a method and apparatus for creating a rough set model based on mixed integer linear programming, the method includes: obtaining the original data; according to the original data of the condition attributes and decision attributes, constraint conditions in the calculation of the original data belongs to the approximate equivalence classes and attributes belong to decision attribute approximate equivalence class target approximation the number of equivalence classes in the sample required for the objective function and the performance parameters of the use of the obtained rough set model based on mixed integer linear programming, the objective function contains at least representation model of condition attributes and decision attribute parameters, the original data is used to indicate the value of the model in the performance parameters. The invention also discloses a corresponding rough set model building device based on mixed integer linear programming.

【技术实现步骤摘要】
基于混合整数线性规划的粗糙集模型建立方法和装置
本专利技术涉及计算
,具体而言,涉及一种基于混合整数线性规划的粗糙集模型建立方法和装置。
技术介绍
粗糙集理论是一门关于不确定性的学科,粗糙集理论的核心思想是通过将给定的有限集合表示为上近似集合和下近似集合,并以此来进行对不精确数据的推理,或者发现数据间的关系。粗糙集有一很明显的缺点,对噪声数据很敏感。在实际应用中,对于包含噪声数据的数据集,基于粗糙集的决策模型的精度会比较低。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于混合整数线性规划的粗糙集模型建立方法和设备,以力图解决或者至少缓解上面存在的问题。第一方面,本专利技术的实施例提供一种基于混合整数线性规划的粗糙集模型建立方法,包括:获取原始数据;根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。可选地,所述计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目的目标函数至少基于条件属性近似等价类集合和决策属性近似等价类集合进行计算,其中,所述条件属性近似等价类至少采用表征模型条件属性的性能参数进行计算,所述条件属性近似等价类集合包括至少一个条件属性近似等价类,所述决策属性近似等价类至少采用表征模型决策属性的性能参数进行计算,所述决策属性近似等价类集合包括至少一个决策属性近似等价类。可选地,所述确定所述性能参数的约束条件,包括:确定表征模型条件属性的性能参数所满足的平衡条件;确定表征模型决策属性的性能参数所满足的平衡条件;确定表征模型条件属性和决策属性的性能参数所满足的平衡条件。可选地,所述确定表征模型条件属性的性能参数所满足的平衡条件,包括:M*ssijc≥αc-|Xci-Xcj|,i∈I,j∈I,c∈CM*(1-ssijc)≥|Xci-Xcj|-αc,i∈I,j∈I,c∈Cω_cij≤ssijc+(1-slc),i∈I,j∈I,c∈Cssijc≥1-slc,i∈I,j∈I,c∈C其中,i、j分别为属于同一条件属性c的论域中两样本,i、j为自然数;Xci为i样本在条件属性c下的取值;Xcj为j样本在条件属性c下的取值;C为条件属性集;c为条件属性集中的任意一个属性;M为任意大数;αc为条件属性集的相似度阈值;ssijc的取值为0或1,对于论域I中的任意两个样本点i和j,以及条件属性集中的任意属性c,若ssijc=1,则样本点i和j在属性c上的取值满足对应的相似度阈值αc,否则为0;ω_cij取值为0或1,对于论域I中任意两个样本点i和j,若ω_cij=1,则i和j可以在同一个由条件属性划分的近似等价类中,反之,i和j无法被划分到同一个条件属性划分的近似等价类中;slc取值为0或1,对于条件属性集中的条件属性c,若slc=1,则该属性c被选择为新的条件属性集参与对论域的划分,否则该条件属性c选择与否对决策规则的建立影响很小,从条件属性集中被剔除。可选地,所述确定表征模型决策属性的性能参数所满足的平衡条件,包括:M*ss′ijd≥αd-|Xdi-Xdj|,i∈I,j∈I,d∈DM*(1-ss′ijd)≥|Xdi-Xdj|-αd,i∈I,j∈I,d∈Dss′ijd≥1-sl′d,i∈I,j∈I,d∈D其中,D为决策属性集;d为决策属性集中的任意一个属性;αd为决策属性集的相似度阈值;i、j分别为属于同一决策属性d的论域中两样本,i、j为自然数;Xdi为i样本在决策属性c下的取值;Xdj为j样本在决策属性c下的取值;ss′ijd取值为0或1,对于论域I中的任意两个样本点i和j,以及决策属性集中的任意属性d,若ss′ijd=1,则样本点i和j在属性d上的取值满足对应的相似度阈值αd;ω_dij取值为0或1,对于论域I中任意两个样本点i和j,若ω_dij=1,则i和j可以在同一个由决策属性集划分的近似等价类中,反之,i和j无法被划分到同一个决策属性集的近似等价类中;sl′d取值为0或1,对于决策属性集中的决策属性d,若sl′d=1,则该决策属性d被选择为新的决策属性集并参与对论域的划分,否则决策属性d选择与否对决策规则的建立影响很小,从决策属性集中被剔除。可选地,在所述获取原始数据之后,还包括:对原始数据进行缺失值处理和降维处理。可选地,还包括:根据所述原始数据及所述约束条件计算所述目标函数,得到原始数据中既为条件属性近似等价类又为决策属性近似等价类的目标近似等价类中的样本数目;基于所述样本数目和原始数据,计算该基于混合整数线性规划的粗糙集模型的决策精度,所述决策精度用于评价该模型的决策结果。第二方面,本专利技术的实施例提供一种模型建立装置,包括:获取单元,用于获取原始数据;第一计算单元,用于根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。可选地,所述第一计算单元所述计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目的目标函数,至少基于条件属性近似等价类集合和决策属性近似等价类集合进行计算,其中,所述条件属性近似等价类至少采用表征模型条件属性的性能参数进行计算,所述条件属性近似等价类集合包括至少一个条件属性近似等价类,所述决策属性近似等价类至少采用表征模型决策属性的性能参数进行计算,所述决策属性近似等价类集合包括至少一个决策属性近似等价类。可选地,所述第一计算单元还用于:确定表征模型条件属性的性能参数所满足的平衡条件;确定表征模型决策属性的性能参数所满足的平衡条件;确定表征模型条件属性和决策属性的性能参数所满足的平衡条件。可选地,还包括:处理单元,所述处理单元用于:对原始数据进行缺失值处理和降维处理。可选地,还包括:第二计算单元,所述第二计算单元用于:根据所述原始数据及所述约束条件计算所述目标函数,得到原始数据中既为条件属性近似等价类又为决策属性近似等价类的目标近似等价类中的样本数目;基于所述样本数目和原始数据,计算该基于混合整数线性规划的粗糙集模型的决策精度,所述决策精度用于评价该模型的决策结果。根据本专利技术的技术方案,可以剔除各个属性集中对决策精度影响较小的属性,自动完成属性筛选过程,实现了属性集对原始的划分,具有很强的可扩展性,可以根据具体的研究对象,选择属性集对论域的具体划分依据和方法,以适应多种数据类型的数据组成的数据集。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域本文档来自技高网...
基于混合整数线性规划的粗糙集模型建立方法和装置

【技术保护点】
一种基于混合整数线性规划的粗糙集模型建立方法,其特征在于,包括:获取原始数据;根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。

【技术特征摘要】
1.一种基于混合整数线性规划的粗糙集模型建立方法,其特征在于,包括:获取原始数据;根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。2.如权利要求1所述的方法,其特征在于,所述计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目的目标函数至少基于条件属性近似等价类集合和决策属性近似等价类集合进行计算,其中,所述条件属性近似等价类至少采用表征模型条件属性的性能参数进行计算,所述条件属性近似等价类集合包括至少一个条件属性近似等价类,所述决策属性近似等价类至少采用表征模型决策属性的性能参数进行计算,所述决策属性近似等价类集合包括至少一个决策属性近似等价类。3.如权利要求1所述的方法,其特征在于,所述确定所述性能参数的约束条件,包括:确定表征模型条件属性的性能参数所满足的平衡条件;确定表征模型决策属性的性能参数所满足的平衡条件;确定表征模型条件属性和决策属性的性能参数所满足的平衡条件。4.如权利要求3所述的方法,其特征在于,所述确定表征模型条件属性的性能参数所满足的平衡条件,包括:M*ssijc≥αc-|Xci-Xcj|,i∈I,j∈I,c∈CM*(1-ssijc)≥|Xci-Xcj|-αc,i∈I,j∈I,c∈Cω_cij≤ssijc+(1-slc),i∈I,j∈I,c∈Cssijc≥1-slc,i∈I,j∈I,c∈C其中,i、j分别为属于同一条件属性c的论域中两样本,i、j为自然数;Xci为i样本在条件属性c下的取值;Xcj为j样本在条件属性c下的取值;C为条件属性集;c为条件属性集中的任意一个属性;M为任意大数;αc为条件属性集的相似度阈值;ssijc的取值为0或1,对于论域I中的任意两个样本点i和j,以及条件属性集中的任意属性c,若ssijc=1,则样本点i和j在属性c上的取值满足对应的相似度阈值αc,否则为0;ω_cij取值为0或1,对于论域I中任意两个样本点i和j,若ω_cij=1,则i和j可以在同一个由条件属性划分的近似等价类中,反之,i和j无法被划分到同一个条件属性划分的近似等价类中;slc取值为0或1,对于条件属性集中的条件属性c,若slc=1,则该属性c被选择为新的条件属性集参与对论域的划分,否则该条件属性c选择与否对决策规则的建立影响很小,从条件属性集中被剔除。5.如权利要求3所述的方法,其特征在于,所述确定表征模型决策属性的性能参数所满足的平衡条件,包括:M*ss′ijd≥αd-|Xdi-Xdj|,i∈I,j∈I,d∈DM*(1-ss′ijd)≥|Xdi-Xdj|-αd,i∈I,j∈I,d∈D

【专利技术属性】
技术研发人员:常文兵雷景淞高春雨周晟瀚
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1