基于序贯三支决策的代价敏感分类方法技术

技术编号:19635762 阅读:16 留言:0更新日期:2018-12-01 16:23
本发明专利技术公开了一种基于序贯三支决策的代价敏感分类方法,序贯三支决策体现了信息粒化和代价敏感学习的优势,其中信息粒化是人类认知和决策执行的基础,代价则是信息处理涉及的重要因素。提出针对代价敏感学习的序贯三支决策模型。首先,对信息粒化和决策代价之间的关系进行了定义和描述;然后,从序决策过程的视角,利用不同粒度层次的代价矩阵构建了代价函数;最后,为平衡决策结果代价和决策过程代价,提出了两个优化问题,并从理论上阐述了其意义,从实验结果分析上验证了算法的有效性,体现了序贯三支决策在代价敏感分类问题上的优势。

A Cost-Sensitive Classification Method Based on Sequential Three-Branch Decision Making

The invention discloses a cost-sensitive classification method based on sequential three-branch decision, which embodies the advantages of information granulation and cost-sensitive learning, in which information granulation is the basis of human cognition and decision execution, and cost is an important factor involved in information processing. A sequential three-branch decision model for cost-sensitive learning is proposed. Firstly, the relationship between information granulation and decision-making cost is defined and described. Then, from the perspective of sequential decision-making process, cost functions are constructed by using cost matrices of different granularity levels. Finally, two optimization problems are proposed to balance the cost of decision-making results and the cost of decision-making process. Its significance is verified by the analysis of experimental results, which shows the superiority of sequential three-branch decision-making in cost-sensitive classification.

【技术实现步骤摘要】
基于序贯三支决策的代价敏感分类方法
本专利技术属于数据挖掘和机器学习
,涉及一种基于序贯三支决策的代价敏感分类方法。
技术介绍
代价敏感学习(Cost-sensitivelearning)是数据挖掘和机器学习重要研究课题,其主要目的是处理在决策过程中产生的各种代价问题。代价敏感学习问题在现实生活生产中具有普适性,例如:医学诊断、机器人、工业生产过程、通信网络故障诊断等等。根据Huntetal的研究,在代价敏感学习研究中主要由两类代价值得关注:决策误分类代价和对象属性的测试代价。Turney在归纳概念学习研究中对代价进行了分类,对代价敏感学习研究提供了语境。很多研究表明代价敏感学习在决策过程中是重要的且是必要的。针对人类的决策认知和规则学习,三支决策(Three-waydecisions,3WD)作为一个重要的决策方法论在近十年得到了蓬勃发展。三支决策主要由两个紧密交织的任务构成:三分和三治。三分指的是把论域划分为三个两两不相交的区域(例如:区域Ⅰ、区域Ⅱ、区域Ⅲ);三治指的是针对在三个不同域中的对象采用不同的治理方式(例如:策略Ⅰ、策略Ⅱ、策略Ⅲ)。在不同的研究背景下,很多研究对三分和三治两个任务进行的具体的构造和解释,提出了大量三支决策相关的具体模型和应用。在扩展模型和优化模型上,相关的研究有:决策粗糙集、概率粗糙集、博弈论粗糙集、区间集、模糊区间集、基于三支决策的不完备信息系统、基于统计的三支决策,三支概念格等等。在应用方面,相关的研究有:临床诊断、论文同行评审、政府和投资决策、文本分类、邮件过滤、推荐系统、聚类分析、人脸识别、属性约简等。专利技术内容本专利技术的目的在于提出针对代价敏感学习的序贯三支决策模型,从而提出基于序贯三支决策的代价敏感分类方法,并验证了序贯三支决策在代价敏感分类问题上的优势。本专利技术是通过以下技术方案来实现:基于序贯三支决策的代价敏感分类方法,包括以下操作:1)对信息粒化和决策代价之间的关系进行以下定义和描述:1.1)在S3WD模型中,假设论域是由独立的元素构成,论域空间有n+1,n≥1层粒度,{0,1,2,…,n}索引集合标识n+1层;层序列n到0,标示信息粒从最粗到最细的粒度层;对应粒度层的多个描述存在一个全序关系即:Des0(x)是对象x最精细的描述,Desn(x)是最粗糙的描述;针对某一特定层对Ui,0≤i-1≤n进行三分,引入评价函数vi(Desi(x))和阈值对(αi,βi),对S3WD模型给出定义1和定义2;1.2)从粒计算角度定义S3WD中的代价函数,对信息粒化进行解释;通过聚集具有相同粒度的信息粒,得到一个系统或问题的整体描述,这些粒的集合构成了一个粒度,构建一个粒度的过程称作对系统或问题在特定层的粒化;让[x]A表示为信息粒,g(A)为对论域U的划分,其中,A表示为条件属性C的子集;对于决策表,给出决策表的多粒度空间构建和解释定义3和定义4;1.3)在提出的S3WD模型中,在做出明确的决策前,有一系列的属性测试和延迟决策,对应的代价为测试代价和延迟代价,关于代价函数在不同粒度层之间的变化过程可以标识为两两相邻层之间的可重复的序列操作;给定一个决策表S,有n+1,n≥1层粒度,在S上的S3WD代价结构定义为定义5;2)从序决策过程的视角,利用不同粒度层次的代价矩阵构建了代价函数;在4个不同粒度下三个域的划分情况,以及对应的决策代价,表下所示。3)为平衡决策结果代价和决策过程代价,提出两个优化问题并给出解释性算法;决策过程代价和决策过程代价是此消彼长的关系,采用以下两种模型在这两种代价之间寻找一个平衡点;3.1)最小决策结果代价序贯三支决策模型,决策者设定决策过程代价上限的基础上,在S3WD过程中找到最小决策结果代价的粒度层下的对象划分,通过定义6来划分;3.2)最小决策过程代价序贯三支决策模型,最小决策过程代价相关粒度层下的对象划分,通过定义7来划分;运用这两个模型和相应的算法,可在现实生活中平衡两种代价从而做出符合实际的决策。与现有技术相比,本专利技术具有以下有益的技术效果:(1)旨在通过三支决策的驱动、解释和实现,在粒计算(GranularComputing,GrC)的概念下,提出了代价敏感序贯三支决策模型。(2)利用不同属性个数反映对系统不同的描述能力这一特性,构造等价类的集合,实现了对信息系统的粒化,进一步构成了具有序关系的多粒度空间。(3)研究了序贯三支决策构建多粒度空间过程相关的决策代价,根据信息获取的粒化过程,粒度的粗化--细化原则提出了代价函数;利用代价矩阵,构建了一个合理的代价结构用于评价序贯三支决策,合理地解释了阈值对(α,β)。(4)在粒度由粗到细的变化过程中,决策结果代价具有非单调下降的特点,而决策过程代价具有单调上升的特点;由此,提出了两个优化问题,优化目标为:由用户设定一种代价上限,最小化另一种代价,对信息系统的对象进行三分。反映了人们在现实生活中对待风险的两种不同态度。具体实施方式下面结合具体的实施例对本专利技术做进一步的详细说明,所述是对本专利技术的解释而不是限定。1代价敏感序贯三支决策模型本节主要讨论了粒计算驱使下序贯三支决策的代价敏感方法。首先,从粒计算的概念出发,介绍了序贯三支决策的定义,然后给出了序贯三支决策模型的多粒度空间的构造,最后给出了序贯三支决策中的代价结构,提出代价敏感序贯三支决策模型。1.1序贯三支决策序贯三支决策(Sequentialthree-waydecisions,S3WD)理论作为粒计算概念下的产物,其目标是提供一个灵活的机制和方法,使得用户在信息粒化序列过程中做出合适的决策。由于S3WD过程需要的时间和信息较少,因此,相比3WD而言,S3WD的优势在于决策过程代价小,决策速度快。例如,通过考察一个对象的描述或者相关信息来判断它的真状态。但是,这样的有效信息往往不完整、不明确;条件集合可能是非标准的;关于对象的描述具有二义性。所以需要延迟决策,只有当信息的细节足够支持决策精度的情况下,才能做出一个明确的决策。这样的决策方式是人类认知和决策的基本原则,这也是S3WD模型的基础。在S3WD模型中,假设论域是由独立的元素构成,论域空间有n+1,n≥1层粒度,{0,1,2,…,n}索引集合标识n+1层。层序列n到0,标示信息粒从最粗到最细的粒度层。如果对象x∈U在每一粒度层下存在一个描述,而对应粒度层的多个描述存在一个全序关系即:Des0(x)是对象x最精细的描述,Desn(x)是最粗糙的描述。针对某一特定层对Ui,0≤i-1≤n进行三分,引入评价函数vi(Desi(x))和阈值对(αi,βi)。对S3WD模型给出以下基本定义(包括定义1和2)。定义1假设论域U有n+1,n≥1层粒度,为从Ui到全序集的评价函数,给定一个阈值对(αi,βi∈Li)且在特定层i,1≤i≤n上,Li可以分为三个两两不相交的域:其中,是边界域,边界域中的对象均被延迟决策。随着从低层获取更多的细节信息,边界域大小会逐渐减小,对象会从BND划分到POS和NEG。最终,S3WD在第0层实现简单二支决策。定义2在第0层,L0可以分为两个不相交的域:其中,阈值γ0∈L0表示两个域是基于该阈值而划分的。1.2序贯三支决策多粒度空间的构建从本文档来自技高网...

【技术保护点】
1.基于序贯三支决策的代价敏感分类方法,其特征在于,包括以下操作:1)对信息粒化和决策代价之间的关系进行以下定义和描述:1.1)在S3WD模型中,假设论域是由独立的元素构成,论域空间有n+1,n≥1层粒度,{0,1,2,...,n}索引集合标识n+1层;层序列n到0,标示信息粒从最粗到最细的粒度层;对应粒度层的多个描述存在一个全序关系≤,即:Des0(x)≤Des1(x)≤…≤Desn(x),Des0(x)是对象x最精细的描述,Desn(x)是最粗糙的描述;针对某一特定层对Ui,0≤i‑1≤n进行三分,引入评价函数vi(Desi(x))和阈值对(αi,βi),对S3WD模型给出定义1和定义2;1.2)从粒计算角度定义S3WD中的代价函数,对信息粒化进行解释;通过聚集具有相同粒度的信息粒,得到一个系统或问题的整体描述,这些粒的集合构成了一个粒度,构建一个粒度的过程称作对系统或问题在特定层的粒化;让[x]A表示为信息粒,g(A)为对论域U的划分,其中,A表示为条件属性C的子集;对于决策表,给出决策表的多粒度空间构建和解释定义3和定义4;1.3)在提出的S3WD模型中,在做出明确的决策前,有一系列的属性测试和延迟决策,对应的代价为测试代价和延迟代价,关于代价函数在不同粒度层之间的变化过程可以标识为两两相邻层之间的可重复的序列操作;给定一个决策表S,有n+1,n≥1层粒度,在S上的S3WD代价结构定义为定义5:2)从序决策过程的视角,利用不同粒度层次的代价矩阵构建了代价函数;在4个不同粒度下三个域的划分情况,以及对应的决策代价,表下所示。...

【技术特征摘要】
1.基于序贯三支决策的代价敏感分类方法,其特征在于,包括以下操作:1)对信息粒化和决策代价之间的关系进行以下定义和描述:1.1)在S3WD模型中,假设论域是由独立的元素构成,论域空间有n+1,n≥1层粒度,{0,1,2,...,n}索引集合标识n+1层;层序列n到0,标示信息粒从最粗到最细的粒度层;对应粒度层的多个描述存在一个全序关系≤,即:Des0(x)≤Des1(x)≤…≤Desn(x),Des0(x)是对象x最精细的描述,Desn(x)是最粗糙的描述;针对某一特定层对Ui,0≤i-1≤n进行三分,引入评价函数vi(Desi(x))和阈值对(αi,βi),对S3WD模型给出定义1和定义2;1.2)从粒计算角度定义S3WD中的代价函数,对信息粒化进行解释;通过聚集具有相同粒度的信息粒,得到一个系统或问题的整体描述,这些粒的集合构成了一个粒度,构建一个粒度的过程称作对系统或问题在特定层的粒化;让[x]A表示为信息粒,g(A)为对论域U的划分,其中,A表示为条件属性C的子集;对于决策表,给出决策表的多粒度空间构建和解释定义3和定义4;1.3)在提出的S3WD模型中,在做出明确的决策前,有一系列的属性测试和延迟决策,对应的代价为测试代价和延迟代价,关于代价函数在不同粒度层之间的变化过程可以标识为两两相邻层之间的可重复的序列操作;给定一个决策表S,有n+1,n≥1层粒度,在S上的S3WD代价结构定义为定义5:2)从序决策过程的视角,利用不同粒度层次的代价矩阵构建了代价函数;在4个不同粒度下三个域的划分情况,以及对应的决策代价,表下所示。3)为平衡决策结果代价和决策过程代价,提出两个优化问题并给出解释性算法;决策过程代价和决策过程代价是此消彼长的关系,采用以下两种模型在这两种代价之间寻找一个平衡点;3.1)最小决策结果代价序贯三支决策模型,决策者设定决策过程代价上限的基础上,在S3WD过程中找到最小决策结果代价的粒度层下的对象划分,通过定义6来划分;3.2)最小决策过程代价序贯三支决策模型,最小决策过程代价相关粒度层下的对象划分,通过定义7来划分;运用这两个模型和相应的算法,可在现实生活中平衡两种代价从而做出符合实际的决策。2.如权利要求1所述的基于序贯三支决策的代价敏感分类方法,其特征在于,所述的定义1为:假设论域U有n+1,n≥1层粒度,vi:为从Ui到全序集(Li,≤i)的评价函数,给定一个阈值对(αi,βi∈Li)且βi<iαi,在特定层i,1≤i≤n上,Li可以分为三个两两不相交的域:其中,是边界域,边界域中的对象均被延迟决策;随着从低层获取更多的细节信息,边界域大小会逐渐减小,...

【专利技术属性】
技术研发人员:方宇闵帆杨新刘忠慧
申请(专利权)人:西南石油大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1