The invention discloses a cost-sensitive classification method based on sequential three-branch decision, which embodies the advantages of information granulation and cost-sensitive learning, in which information granulation is the basis of human cognition and decision execution, and cost is an important factor involved in information processing. A sequential three-branch decision model for cost-sensitive learning is proposed. Firstly, the relationship between information granulation and decision-making cost is defined and described. Then, from the perspective of sequential decision-making process, cost functions are constructed by using cost matrices of different granularity levels. Finally, two optimization problems are proposed to balance the cost of decision-making results and the cost of decision-making process. Its significance is verified by the analysis of experimental results, which shows the superiority of sequential three-branch decision-making in cost-sensitive classification.
【技术实现步骤摘要】
基于序贯三支决策的代价敏感分类方法
本专利技术属于数据挖掘和机器学习
,涉及一种基于序贯三支决策的代价敏感分类方法。
技术介绍
代价敏感学习(Cost-sensitivelearning)是数据挖掘和机器学习重要研究课题,其主要目的是处理在决策过程中产生的各种代价问题。代价敏感学习问题在现实生活生产中具有普适性,例如:医学诊断、机器人、工业生产过程、通信网络故障诊断等等。根据Huntetal的研究,在代价敏感学习研究中主要由两类代价值得关注:决策误分类代价和对象属性的测试代价。Turney在归纳概念学习研究中对代价进行了分类,对代价敏感学习研究提供了语境。很多研究表明代价敏感学习在决策过程中是重要的且是必要的。针对人类的决策认知和规则学习,三支决策(Three-waydecisions,3WD)作为一个重要的决策方法论在近十年得到了蓬勃发展。三支决策主要由两个紧密交织的任务构成:三分和三治。三分指的是把论域划分为三个两两不相交的区域(例如:区域Ⅰ、区域Ⅱ、区域Ⅲ);三治指的是针对在三个不同域中的对象采用不同的治理方式(例如:策略Ⅰ、策略Ⅱ、策略Ⅲ)。在不同的研究背景下,很多研究对三分和三治两个任务进行的具体的构造和解释,提出了大量三支决策相关的具体模型和应用。在扩展模型和优化模型上,相关的研究有:决策粗糙集、概率粗糙集、博弈论粗糙集、区间集、模糊区间集、基于三支决策的不完备信息系统、基于统计的三支决策,三支概念格等等。在应用方面,相关的研究有:临床诊断、论文同行评审、政府和投资决策、文本分类、邮件过滤、推荐系统、聚类分析、人脸识别、属性约简等。专利技 ...
【技术保护点】
1.基于序贯三支决策的代价敏感分类方法,其特征在于,包括以下操作:1)对信息粒化和决策代价之间的关系进行以下定义和描述:1.1)在S3WD模型中,假设论域是由独立的元素构成,论域空间有n+1,n≥1层粒度,{0,1,2,...,n}索引集合标识n+1层;层序列n到0,标示信息粒从最粗到最细的粒度层;对应粒度层的多个描述存在一个全序关系≤,即:Des0(x)≤Des1(x)≤…≤Desn(x),Des0(x)是对象x最精细的描述,Desn(x)是最粗糙的描述;针对某一特定层对Ui,0≤i‑1≤n进行三分,引入评价函数vi(Desi(x))和阈值对(αi,βi),对S3WD模型给出定义1和定义2;1.2)从粒计算角度定义S3WD中的代价函数,对信息粒化进行解释;通过聚集具有相同粒度的信息粒,得到一个系统或问题的整体描述,这些粒的集合构成了一个粒度,构建一个粒度的过程称作对系统或问题在特定层的粒化;让[x]A表示为信息粒,g(A)为对论域U的划分,其中,A表示为条件属性C的子集;对于决策表,给出决策表的多粒度空间构建和解释定义3和定义4;1.3)在提出的S3WD模型中,在做出明确的决策前,有 ...
【技术特征摘要】
1.基于序贯三支决策的代价敏感分类方法,其特征在于,包括以下操作:1)对信息粒化和决策代价之间的关系进行以下定义和描述:1.1)在S3WD模型中,假设论域是由独立的元素构成,论域空间有n+1,n≥1层粒度,{0,1,2,...,n}索引集合标识n+1层;层序列n到0,标示信息粒从最粗到最细的粒度层;对应粒度层的多个描述存在一个全序关系≤,即:Des0(x)≤Des1(x)≤…≤Desn(x),Des0(x)是对象x最精细的描述,Desn(x)是最粗糙的描述;针对某一特定层对Ui,0≤i-1≤n进行三分,引入评价函数vi(Desi(x))和阈值对(αi,βi),对S3WD模型给出定义1和定义2;1.2)从粒计算角度定义S3WD中的代价函数,对信息粒化进行解释;通过聚集具有相同粒度的信息粒,得到一个系统或问题的整体描述,这些粒的集合构成了一个粒度,构建一个粒度的过程称作对系统或问题在特定层的粒化;让[x]A表示为信息粒,g(A)为对论域U的划分,其中,A表示为条件属性C的子集;对于决策表,给出决策表的多粒度空间构建和解释定义3和定义4;1.3)在提出的S3WD模型中,在做出明确的决策前,有一系列的属性测试和延迟决策,对应的代价为测试代价和延迟代价,关于代价函数在不同粒度层之间的变化过程可以标识为两两相邻层之间的可重复的序列操作;给定一个决策表S,有n+1,n≥1层粒度,在S上的S3WD代价结构定义为定义5:2)从序决策过程的视角,利用不同粒度层次的代价矩阵构建了代价函数;在4个不同粒度下三个域的划分情况,以及对应的决策代价,表下所示。3)为平衡决策结果代价和决策过程代价,提出两个优化问题并给出解释性算法;决策过程代价和决策过程代价是此消彼长的关系,采用以下两种模型在这两种代价之间寻找一个平衡点;3.1)最小决策结果代价序贯三支决策模型,决策者设定决策过程代价上限的基础上,在S3WD过程中找到最小决策结果代价的粒度层下的对象划分,通过定义6来划分;3.2)最小决策过程代价序贯三支决策模型,最小决策过程代价相关粒度层下的对象划分,通过定义7来划分;运用这两个模型和相应的算法,可在现实生活中平衡两种代价从而做出符合实际的决策。2.如权利要求1所述的基于序贯三支决策的代价敏感分类方法,其特征在于,所述的定义1为:假设论域U有n+1,n≥1层粒度,vi:为从Ui到全序集(Li,≤i)的评价函数,给定一个阈值对(αi,βi∈Li)且βi<iαi,在特定层i,1≤i≤n上,Li可以分为三个两两不相交的域:其中,是边界域,边界域中的对象均被延迟决策;随着从低层获取更多的细节信息,边界域大小会逐渐减小,...
【专利技术属性】
技术研发人员:方宇,闵帆,杨新,刘忠慧,
申请(专利权)人:西南石油大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。