一种基于决策树的医学检测指标筛选方法技术

技术编号：17100702 阅读：25 留言：0更新日期：2018-01-21 11:57

本发明专利技术涉及一种基于决策树的医学检测指标筛选方法，包括以下步骤：S1，获取多个样本的各项医学检测指标数据，所述的样本被分为多个类别；S2，将决策树训练方法中选用的医学检测指标作为筛选出来的医学检测指标，所述的决策树的叶节点为类别，节点的测试属性为医学检测指标。与现有技术相比，本发明专利技术对已知分类结果的医学样本进行数据计算，总结了医学专家的经验，将医学检测指标与类别中的隐含关系挖掘出来，筛选出相关性较大的医学检测指标，可为未来临床医学诊断提供参考，提高诊断效率。

A method of screening medical detection indexes based on decision tree

The invention relates to a method for screening medicine detection index based on decision tree, which comprises the following steps: S1, data of the medical examination indexes and obtaining a plurality of samples, the samples are divided into several categories; S2, medical detection index selection decision tree training method as the medical examination indexes were screened out the leaf node of the decision tree, the test for Category attribute node for medical detection index. Compared with the prior art, the invention of medicine samples of known classification results for data calculation, summarizes the experience of medical experts, to dig out the hidden relationship of medical detection indicators and categories, selected medical detection index correlated, for future clinical diagnosis and provide reference, to improve the efficiency of diagnosis.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于决策树的医学检测指标筛选方法
本专利技术涉及一种数据处理方法，尤其是涉及一种基于决策树的医学检测指标筛选方法。
技术介绍
在临床医学中，多年的门诊积累了大量患者的检测数据，然而这些检测数据种类多，数据量大，如何筛选出相关性较大的检测指标用于诊断，一直是医务人员非常关心的问题。如果利用这些检测数据发现检测数据内部及数据之间隐藏的规律，则可以提高诊断效率。医学数据的挖掘和处理重在从已知医学数据本身出发，能够提炼数据中的知识，总结医学专家的经验，是近年来医学信息领域颇受关注的研究方向。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于决策树的医学检测指标筛选方法。本专利技术的目的可以通过以下技术方案来实现：一种基于决策树的医学检测指标筛选方法，包括以下步骤：S1，获取多个样本的各项医学检测指标数据，所述的样本被分为多个类别；S2，将决策树训练方法中选用的医学检测指标作为筛选出来的医学检测指标，所述的决策树的叶节点为类别，节点的测试属性为医学检测指标。所述的决策树训练过程中，选择具有最高信息增益的属性作为当前节点的测试属性。所述的信息增益计算过程包括以下步骤：1)计算对给定数据分类需要的信息量；2)计算利用测试属性划分当前节点样本集合所需要的信息熵；3)步骤2)计算结果减去步骤1)计算结果即为当前节点的测试属性的信息增益。所述的信息量计算式为：其中，当前节点s个样本被划分为m个不同类别Ci，i∈{1,2,3,…,m}，si为类别Ci中的样本个数，pi是任意一个样本属于类别Ci的概率，其中的log函数以2为底。所述的任意一个样本属于...
一种基于决策树的医学检测指标筛选方法

【技术保护点】
一种基于决策树的医学检测指标筛选方法，其特征在于，包括以下步骤：S1，获取多个样本的各项医学检测指标数据，所述的样本被分为多个类别；S2，将决策树训练方法中选用的医学检测指标作为筛选出来的医学检测指标，所述的决策树的叶节点为类别，节点的测试属性为医学检测指标。

【技术特征摘要】
1.一种基于决策树的医学检测指标筛选方法，其特征在于，包括以下步骤：S1，获取多个样本的各项医学检测指标数据，所述的样本被分为多个类别；S2，将决策树训练方法中选用的医学检测指标作为筛选出来的医学检测指标，所述的决策树的叶节点为类别，节点的测试属性为医学检测指标。2.根据权利要求1所述的一种基于决策树的医学检测指标筛选方法，其特征在于，所述的决策树训练过程中，选择具有最高信息增益的属性作为当前节点的测试属性。3.根据权利要求2所述的一种基于决策树的医学检测指标筛选方法，其特征在于，所述的信息增益计算过程包括以下步骤：1)计算对给定数据分类需要的信息量；2)计算利用测试属性划分当前节点样本集合所需要的信息熵；3)步骤2)计算结果减去步骤1)计算结果即为当前节点的测试属性的信息增益。4.根据权利要求3所述的一种基于决策树的医学检测指标筛选方法，其特征在于，所述的信息量计算式为：其中，当前节点s个样本被划分为m个不同类别Ci，i∈{1,2,3,…,m}，si为类别Ci中的样本个数，pi是任意一个样...

【专利技术属性】
技术研发人员：张挺，
申请(专利权)人：上海电力学院，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人