一种中医体质优化分类方法技术

技术编号:13736619 阅读:81 留言:0更新日期:2016-09-22 04:53
本发明专利技术公开了一种基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法,属于中医体质科学与信息科学技术交叉融合的工程技术领域。本发明专利技术建立了多维人体面部皮肤指标体系,筛选出相关性较强的指标集合,并根据各指标不同的贡献程度,有所侧重的保留原属性以剔除冗余属性。针对需要兼顾可解释性与准确性的分类要求,充分发挥了训练样本较少条件下决策树对属性和类间关系的良好归纳特性和训练样本较多条件下朴素贝叶斯分类准确率最高的优势,所述中医体质优化分类方法可以用于定量地研究皮肤与中医体质间的潜在联系,为皮肤的健康养护、调理和治疗提供一定的科学依据与数据、方法支撑。 1

【技术实现步骤摘要】

本专利技术涉及一种基于人体面部皮肤指标信息的中医体质分类方法,属于中医体质科学与信息科学技术交叉融合的工程
具体地说,是一种基于改进型CART(Classification And Regression Tree)决策树与模糊朴素贝叶斯组合模型的分类方法,根据面部皮肤指标与人体内在的中医体质类型间的隐形关联关系,实现通过面部皮肤测试信息,快速确定中医体质类型的目的。
技术介绍
皮肤作为人体最外层,最大的组织器官,遍布于身体的各个部位,是覆盖身体的屏障,起着最基础的保护作用。中医体质是中医基础理论的重要组成部分,主要研究人的体质和健康之间的相关关系。中医学认为,体质是人体生命过程中,在先天禀赋和后天获得的基础上所形成的形态结构、生理功能和心理状态等方面综合的、相对稳定的固有特质。根据传统的中医面诊思想,皮肤表象可以反映人体身体健康程度及疾病迹象,中医体质学则进一步认为体质状态对皮肤状态具有决定性作用。因此,探索建立基于皮肤状态信息的体质分类模型,研究皮肤与体质间的潜在联系,可以深入了解每种体质类型的皮肤特性,实现从内调理体质的角度开展指导外部皮肤养护的工作,为增进皮肤健康提供新的手段和方法。然而,目前在中医体质分类领域,由于问题的复杂性,现阶段学者们大多仅研究了体质与生活习惯、年龄、周围环境等因素的相关关系,对皮肤与体质关系的研究相对较少。在仅有的一些研究中,由于受到测试设备、时间、环境及经济等因素的影响,研究工作一般仅针对少数几个皮肤指标进行分析,虽然在一定程度上佐证了皮肤和体质具有相关性,但仍未能建立描述二者间复杂关系的较精确的定量模型。因此,需要借鉴数据挖掘领域的研究方法与成果,开展基于多属性皮肤指标数据的中医体质分类研究。在建模过程中,一方面要最大化提高模型的分类准确度,另一方面还要探究皮肤信息与体质类型间的客观统计规律,在确定中医体质类型的同时探索人体内在体质类型及健康程度对各皮肤指标的影响趋势。
技术实现思路
本专利技术的目的是为了解决现有的体质分类算法仅简单分析皮肤与中医体质间存在的相关关系,不能定量建立分类模型,且常规研究中涉及的皮肤指标属性过于单一、不够全面等问题,提出一种基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法。本专利技术提供的中医体质优化分类方法,充分全面的反映人体面部皮肤状态,建立了多维人体
面部皮肤指标体系,在此基础上,筛选出相关性较强的指标集合,并根据各指标不同的贡献程度,有所侧重的保留原属性以剔除冗余属性。针对需要兼顾可解释性与准确性的分类要求,充分发挥了训练样本较少条件下决策树对属性和类间关系的良好归纳特性和训练样本较多条件下朴素贝叶斯分类准确率最高的优势,所述中医体质优化分类方法可以用于定量地研究皮肤与中医体质间的潜在联系。本专利技术提供的基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法,主要包括以下五个步骤:步骤一、人体面部皮肤指标体系构建及关键指标提取;根据皮肤领域背景知识,结合中医理论,从水润度、色泽度、弹力度、光滑度等角度分析、确定下能够充分全面衡量人体面部皮肤状态的皮肤指标,构建综合性较强的多维人体面部皮肤指标体系。为了避免指标体系包含冗余属性和信息量很少的属性指标,在构建体质分类模型前先对相关性较强的指标集合通过主成分分析法进行降维,重新组合为一组新的相互无关的综合变量。步骤二、不同部位皮肤指标信息加权综合;为了全面的反应人体面部皮肤状态,选取额头、左眼角、左脸颊和下巴四个部位的皮肤指标属性,并根据专家意见采用层次分析法计算出四个部位的权重,对四个部位的皮肤指标值加权综合得到各皮肤指标属性的四部位综合值。步骤三、基于改进CART决策树模型的中医体质分类;将人体的体质类型集表示为因变量,皮肤指标属性集表示为自变量,以人体面部皮肤指标属性的四部位综合值和其相应的体质类型为训练样本,对训练样本通过递归分割的方式建立CART决策树。为了避免决策树过于庞大导致对噪声数据出现过拟合,对未知新样本(待分类的人体面部皮肤指标属性的四部位综合值)的分类准确度降低,模型的可解释性变差等情况,定义了综合考虑分类模型精度和复杂度的最优树评价指标,用以选择出最佳的CART决策树后剪枝方式,得到综合性能最优的决策树分类模型。步骤四、基于模糊朴素贝叶斯模型的中医体质分类;将中医体质类型设定为贝叶斯模型的类变量,皮肤指标属性集设定为贝叶斯模型的属性集。为了解决皮肤指标属性值受内外影响会产生波动这一问题,定义各皮肤指标属性值对归属区间的模糊隶属度函数,用以计算贝叶斯模型的模糊类条件概率。并通过统计分析计算出各类中医体质类型的先验概率,带入贝叶斯模型中求解得到各皮肤指标属性集对三类中医体质的模糊后验概率,最大后验概率所对应的中医体质类型就是该皮肤指标属性对应的基础体质。步骤五、改进CART决策树与模糊朴素贝叶斯模型的组合;分别统计CART决策树和贝叶斯模型对训练样本的中医体质类型分类的准确度ACART和ANB,以及各自对每种体质类型的后验概率,对后验概率加权综合,得到最大概率所对应的体质类型即为最终的体质分类输出结果。本专利技术的优点在于:1、本专利技术考虑到人体面部皮肤状态受多指标、多部位测试信息的共同影响,提出构建多维人体面部皮肤指标体系,并通过前期的数据预处理,将多部位的测试信息加权得到能完备反应人体面部皮肤状态的指标综合值,进而又采用主成分分析法去除冗余属性,提取出了全面、客观、又简捷高效的皮肤指标体系。这对于后续减少皮肤测试指标、节省测试时间、加快信息挖掘速度、简化算法,具有重要意义。2、本专利技术提出采用改进CART决策树模型用于实现基于皮肤指标属性的中医体质分类,可以在训练样本较少的条件下快速准确的挖掘出皮肤与体质间的分类规则,从信息处理的角度为中医领域专家提供客观存在但隐藏在数据中未被发现的知识。同时,针对决策树算法可能出现的过拟合问题,定义了综合考虑模型精度和复杂度的最优树评价指标,用以选择最佳的决策树后剪枝方式,得到对训练样本以及未知新样本分类准确性均较高的分类模型。3、本专利技术提出采用模糊贝叶斯模型对中医体质进行分类,前瞻并发挥了在训练样本较多的条件下贝叶斯模型分类准确率最高的优势,通过计算模糊类条件概率解决了皮肤指标受内外影响会产生波动这一问题,较好地实现了体质归类判别不确定性和边界划分不确定性的融合。4、本专利技术提出了将CART决策树和贝叶斯的后验概率加权综合的方法对两算法的分类结果进行融合,最大化的提高了模型分类精度和可解释性。在确定体质类型的同时探索面部皮肤指标与人体内在中医体质类型间的关联关系,从“外象”(皮肤)和“内因”(体质)两个方面进行研究,为皮肤的健康养护、调理和治疗提供一定的科学依据与数据、方法支撑。附图说明图1为本专利技术提供的基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法的流程图;图2为多维人体面部皮肤指标体系结构图;图3为建立改进CART决策树模型的算法流程图;图4是各皮肤指标对归属区间的模糊隶属度函数图;图5是经过剪枝后的完整的CART决策树。具体实施方式下面结合附图对本专利技术作进一步的详细说明。本专利技术提供一种基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分...
一种中医体质优化分类方法

【技术保护点】
基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法,其特征在于:包括以下步骤,步骤一、人体面部皮肤指标体系构建及关键指标提取;确定人体面部皮肤状态的皮肤指标,选择Spearman秩相关系数来度量皮肤指标两两之间的相关性,并对筛选出的相关性强的皮肤指标采用主成分分析法进行降维,重新组合为一组新的相互无关的综合变量,作为皮肤指标属性集;步骤二、不同部位皮肤指标信息加权综合;选取额头、左眼角、左脸颊和下巴四个部位的皮肤指标属性,采用层次分析法计算出四个部位的权重,对四个部位的皮肤指标值加权综合得到各皮肤指标属性的四部位综合值;步骤三、基于改进CART决策树模型的中医体质分类;将人体的体质类型集表示为因变量,皮肤指标属性集表示为自变量,以人体面部皮肤指标属性的四部位综合值和其相应的体质类型为训练样本,对训练样本通过递归分割的方式建立CART决策树;步骤四、基于模糊朴素贝叶斯模型的中医体质分类;将中医体质类型设定为贝叶斯模型的类变量,皮肤指标属性集设定为贝叶斯模型的属性集,定义各皮肤指标属性值对归属区间的模糊隶属度函数,用以计算贝叶斯模型的模糊类条件概率;并通过统计分析计算出各类中医体质类型的先验概率,带入贝叶斯模型中求解得到各皮肤指标属性集对三类中医体质的模糊后验概率,最大后验概率所对应的中医体质类型就是该皮肤指标属性对应的基础体质;步骤五、改进CART决策树与模糊朴素贝叶斯模型的组合;分别统计CART决策树和贝叶斯模型在训练过程中分类正确的训练样本个数,除以训练样本总数即为两算法的分类准确度ACART和ANB;进而计算决策树模型分别对各类体质的训练准确度b(k),k=1,2,…,m,m为全部的体质类型总数;定义决策树模型在输出体质类型为Yt时对各类体质的后验概率为,P(Yk|X)CART=bk,k=t1-bk/(m-1),k≠t---(7)]]>将其与贝叶斯模型输出的后验概率P(Yk|X)NB加权综合,得,P(Yk|X)=ACART×P(Yk|X)CART+ANB×P(Yk|X)NBACART+ANB---(8)]]>此时,得到的最大概率所对应的体质类型即为最终的分类输出结果。...

【技术特征摘要】
1.基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法,其特征在于:包括以下步骤,步骤一、人体面部皮肤指标体系构建及关键指标提取;确定人体面部皮肤状态的皮肤指标,选择Spearman秩相关系数来度量皮肤指标两两之间的相关性,并对筛选出的相关性强的皮肤指标采用主成分分析法进行降维,重新组合为一组新的相互无关的综合变量,作为皮肤指标属性集;步骤二、不同部位皮肤指标信息加权综合;选取额头、左眼角、左脸颊和下巴四个部位的皮肤指标属性,采用层次分析法计算出四个部位的权重,对四个部位的皮肤指标值加权综合得到各皮肤指标属性的四部位综合值;步骤三、基于改进CART决策树模型的中医体质分类;将人体的体质类型集表示为因变量,皮肤指标属性集表示为自变量,以人体面部皮肤指标属性的四部位综合值和其相应的体质类型为训练样本,对训练样本通过递归分割的方式建立CART决策树;步骤四、基于模糊朴素贝叶斯模型的中医体质分类;将中医体质类型设定为贝叶斯模型的类变量,皮肤指标属性集设定为贝叶斯模型的属性集,定义各皮肤指标属性值对归属区间的模糊隶属度函数,用以计算贝叶斯模型的模糊类条件概率;并通过统计分析计算出各类中医体质类型的先验概率,带入贝叶斯模型中求解得到各皮肤指标属性集对三类中医体质的模糊后验概率,最大后验概率所对应的中医体质类型就是该皮肤指标属性对应的基础体质;步骤五、改进CART决策树与模糊朴素贝叶斯模型的组合;分别统计CART决策树和贝叶斯模型在训练过程中分类正确的训练样本个数,除以训练样本总数即为两算法的分类准确度ACART和ANB;进而计算决策树模型分别对各类体质的训练准确度b(k),k=1,2,…,m,m为全部的体质类型总数;定义决策树模型在输出体质类型为Yt时对各类体质的后验概率为, P ( Y k | X ) C A R T = b k , k = t 1 - b k / ( m - 1 ) , k ≠ t - - - ( 7 ) ]]>将其与贝叶斯模型输出的后验概率P(Yk|X)NB加权综合,得, P ( Y k | X ) = A C A R T × P ( Y k | X ) C A R T + A N B × P ( Y k | X ) N B A C A R T + A N B - - - ( 8 ) ]]>此时,得到的最大概率所对应的体质类型即为最终的分类输出结果。2.根据权利要求1所述的基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法,其特征在于:所述的人体面部皮肤指标包括光泽度、粗糙度、pH值、气血、水分含量、水分散失、色度、油脂、黑红色素和弹性;所述的相关性较强是指Spearman秩相关系数大于0.4。3.根据权利要求1所述的基于改进型CART决策树与模糊朴素贝叶斯组合模型的中医体质优化分类方法,其特征在于:步骤三中,将训练样本的中医体质类型集表示为因变量,皮肤指标属性集表示为自变量,对训练样本采用二分递归分割的方式建立CART决策树,具体为:第一步,创建根节点;第二步,计算根节点中全部训练样本的Gini系数G;第三步,指定某一皮肤指标属性X为划分属性;第四步,设定皮肤指标属性X的分割阈值,将训练样本分成两组,计算划分后的Gini系数G';求出划分前后的Gini系数减少量ΔG=G-G';求解皮肤指标属性X的所有可能分割阈值对应的Gini系...

【专利技术属性】
技术研发人员:张慧妍王小艺王立李爽许继平于家斌董银卯孟宏
申请(专利权)人:北京工商大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1