The present invention provides a method and apparatus for creating a rough set model based on mixed integer linear programming, the method includes: obtaining the original data; according to the original data of the condition attributes and decision attributes, constraint conditions in the calculation of the original data belongs to the approximate equivalence classes and attributes belong to decision attribute approximate equivalence class target approximation the number of equivalence classes in the sample required for the objective function and the performance parameters of the use of the obtained rough set model based on mixed integer linear programming, the objective function contains at least representation model of condition attributes and decision attribute parameters, the original data is used to indicate the value of the model in the performance parameters. The invention also discloses a corresponding rough set model building device based on mixed integer linear programming.
【技术实现步骤摘要】
基于混合整数线性规划的粗糙集模型建立方法和装置
本专利技术涉及计算
,具体而言,涉及一种基于混合整数线性规划的粗糙集模型建立方法和装置。
技术介绍
粗糙集理论是一门关于不确定性的学科,粗糙集理论的核心思想是通过将给定的有限集合表示为上近似集合和下近似集合,并以此来进行对不精确数据的推理,或者发现数据间的关系。粗糙集有一很明显的缺点,对噪声数据很敏感。在实际应用中,对于包含噪声数据的数据集,基于粗糙集的决策模型的精度会比较低。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于混合整数线性规划的粗糙集模型建立方法和设备,以力图解决或者至少缓解上面存在的问题。第一方面,本专利技术的实施例提供一种基于混合整数线性规划的粗糙集模型建立方法,包括:获取原始数据;根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。可选地,所述计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目的目标函数至少基于条件属性近似等价类集合和决策属性近似等价类集合进行计算,其中,所述条件属性近似等价类至少采用表征模型条件属性的性能参数进行计算,所述条件属性近似等价类集合包括至少一个条件属性近似等价类,所述决策属性近似等价类至少采用表征模型决策属性的性能参数进行计算,所述决策属性近似等价类 ...
【技术保护点】
一种基于混合整数线性规划的粗糙集模型建立方法,其特征在于,包括:获取原始数据;根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。
【技术特征摘要】
1.一种基于混合整数线性规划的粗糙集模型建立方法,其特征在于,包括:获取原始数据;根据所述原始数据的条件属性和决策属性,确定计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目所需使用的目标函数和性能参数的约束条件,得到基于混合整数线性规划的粗糙集模型,所述目标函数至少包含表征模型条件属性及决策属性的性能参数,所述原始数据用于指示该模型中所述性能参数的取值。2.如权利要求1所述的方法,其特征在于,所述计算原始数据中既属于条件属性近似等价类又属于决策属性近似等价类的目标近似等价类中的样本数目的目标函数至少基于条件属性近似等价类集合和决策属性近似等价类集合进行计算,其中,所述条件属性近似等价类至少采用表征模型条件属性的性能参数进行计算,所述条件属性近似等价类集合包括至少一个条件属性近似等价类,所述决策属性近似等价类至少采用表征模型决策属性的性能参数进行计算,所述决策属性近似等价类集合包括至少一个决策属性近似等价类。3.如权利要求1所述的方法,其特征在于,所述确定所述性能参数的约束条件,包括:确定表征模型条件属性的性能参数所满足的平衡条件;确定表征模型决策属性的性能参数所满足的平衡条件;确定表征模型条件属性和决策属性的性能参数所满足的平衡条件。4.如权利要求3所述的方法,其特征在于,所述确定表征模型条件属性的性能参数所满足的平衡条件,包括:M*ssijc≥αc-|Xci-Xcj|,i∈I,j∈I,c∈CM*(1-ssijc)≥|Xci-Xcj|-αc,i∈I,j∈I,c∈Cω_cij≤ssijc+(1-slc),i∈I,j∈I,c∈Cssijc≥1-slc,i∈I,j∈I,c∈C其中,i、j分别为属于同一条件属性c的论域中两样本,i、j为自然数;Xci为i样本在条件属性c下的取值;Xcj为j样本在条件属性c下的取值;C为条件属性集;c为条件属性集中的任意一个属性;M为任意大数;αc为条件属性集的相似度阈值;ssijc的取值为0或1,对于论域I中的任意两个样本点i和j,以及条件属性集中的任意属性c,若ssijc=1,则样本点i和j在属性c上的取值满足对应的相似度阈值αc,否则为0;ω_cij取值为0或1,对于论域I中任意两个样本点i和j,若ω_cij=1,则i和j可以在同一个由条件属性划分的近似等价类中,反之,i和j无法被划分到同一个条件属性划分的近似等价类中;slc取值为0或1,对于条件属性集中的条件属性c,若slc=1,则该属性c被选择为新的条件属性集参与对论域的划分,否则该条件属性c选择与否对决策规则的建立影响很小,从条件属性集中被剔除。5.如权利要求3所述的方法,其特征在于,所述确定表征模型决策属性的性能参数所满足的平衡条件,包括:M*ss′ijd≥αd-|Xdi-Xdj|,i∈I,j∈I,d∈DM*(1-ss′ijd)≥|Xdi-Xdj|-αd,i∈I,j∈I,d∈D
【专利技术属性】
技术研发人员:常文兵,雷景淞,高春雨,周晟瀚,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。