当前位置: 首页 > 专利查询>大连大学专利>正文

房颤预测决策树及其剪枝的方法技术

技术编号:23534172 阅读:62 留言:0更新日期:2020-03-20 08:13
房颤预测决策树及其剪枝的方法,属于数据处理领域,为了解决建决策树以挖掘出影响房颤预测的指标的问题,决策树中根节点A峰,该属性是信息增益率最大的,它的正常范围是41到87,决策树的第一个分支,当a<=0时,a指代的是A峰的值,患者发生房颤,由于数据中没有非0数,所以也就是当a=0时,判断该患者发生房颤;当a>0时,需要继续考虑ef属性,当ef值小于58时,则判断该患者为正常,本发明专利技术给出了决策树对于用于确定影响房颤的一些重要参考指标,具有重要指导意义。

Decision tree for AF prediction and its pruning method

【技术实现步骤摘要】
房颤预测决策树及其剪枝的方法
本专利技术属于数据处理领域,涉及一种构建房颤预测决策树的方法及该决策树。
技术介绍
房颤是一种以快速、无序心房电活动为特征的室上性快速性心律失常。房颤在心电图上主要表现为:P波消失,代之以不规则的心房颤动波;RR间期绝对不规则(房室传导存在时)。这也是现在医学等方面用于判断房颤的主要依据。医学上主要根据房颤发作的持续时间将房颤分为阵发性房颤(paroxysmalAF)、持续性房颤(persistentAF)、长程持续性房颤(long-standingpersistentAF)和永久性房颤(permanentAF)。具体分类如表1。表1.1医学上房颤的详细分类心房颤动在临床上是一种非常常见的心律失常,在我国其发病率在0.5%-1%,随着年龄的增加发病的概率就越高。而高血压患者发生房颤的风险较血压正常者高1.7倍,目前已有33%房颤患者的发生归于高血压。针对高血压患者房颤的高发病率,有人甚至认为,房颤是高血压靶器官损害的另一种表现。但目前临床上尚无较好的指标预测高血压患者AF的发生。此外,一些房颤患者并无明显临床症状,导致这些患者无意识地暴露在各种危重病症的风险之下,当临床症状出现或突发疾病时,往往已导致心血管发生器质性病变,从而极大地影响患者的身体健康甚至危及生命。因此,研究高血压患者人群中患有房颤的概率则显得尤为重要。现阶段预测房颤的方法很多,在医学领域,从房颤的治疗方面着手。在国际上虽然有CHA2DS2-VASc评分(高血压、年龄、糖尿病、中风、血管病变、性别、充血性心力衰竭)和HATCH评分(高血压、年龄、脑缺血发作、慢阻肺、心衰)用于预测房颤,但是这两种评分都存在各种局限性,使得预测方法不规范,预测结果不准确。在计算机领域,大家普遍根据的是患者的心电图,根据判断P波、分析RR间期分布随时间的变化规律等因素来判断患者是否患有房颤,用到的算法有统计学方面的还有机器学习方面的。还有通过智能手表来检验人体一些特征指标从而来预测,通过智能手机扫描脸部通过人的脸色来预测,甚至有时对于无症的患者,直接借用医学仪器测试患者的Holter心率来预测。但这些仍然缺乏规范性、无特定标准。
技术实现思路
为了解决建决策树以挖掘出影响房颤预测的指标的问题,本专利技术提出如下技术方案:一种房颤预测决策树,决策树中根节点A峰,该属性是信息增益率最大的,它的正常范围是41到87,决策树的第一个分支,当a<=0时,a指代的是A峰的值,患者发生房颤,由于数据中没有非0数,所以也就是当a=0时,判断该患者发生房颤;当a>0时,需要继续考虑ef属性,当ef值小于58时,则判断该患者为正常。另一种房颤预测决策树,决策树中根节点为XGN,当XGN等级大于1时即判断患者为房颤,当XGN等级小于等于1,继续考虑A峰,当A峰为0时,继续考虑FS,当FS大于0时,判断患者患有房颤,否则继续考虑FJB,当FJB小于等于0,考虑LVPWD,当LVPWD小于等于9时,继续考虑EF的值,当EF小于等于57时,则判断该患者为正常,否则为房颤;继续回溯到LVPWD的右支,当LVPWD大于9时,考虑FDMB1的值,当该值小于等于101时,则判断该患者为房颤,否则考虑LAD,当LAD小于等于50时,则判断患者是房颤,否则则判断患者为正常;继续回溯到FJB的右支,当FJB大于0时,考虑GXB,当GXB小于等于2,则判断患者为正常,否则判断患者为房颤;继续回溯到FS的右支,当FS大于0,则判断患者为房颤;继续回溯到A峰的右支,当A大于0,则考虑TNB,当TNB小于等于0时,则判断患者为正常,否则考虑FDMB当FDMB大于0,则判断患者为正常,否则考虑E值,当E大于72时,则判断患者为房颤,否则考虑MCHC值,当MCHC小于等于338,则判断患者为房颤,否则为正常,遍历整棵决策树。一种对房颤预测决策树的剪枝的方法,包括:1)分别计算三种预测错分样本数:计算子树Tv的所有叶节点预测错分样本数之和,记为E1;计算子树Tv被剪枝以叶节点代替时的预测错分样本数,记为E2;计算子树Tv的最大分支预测错分样本数,记为E3;2)进行比较:E1最小时,不剪枝;E2最小时,进行剪枝,以一个叶节点代替子树Tv;E3最小时,用最大分支代替子树Tv。有益效果:本专利技术给出了预测决策树,并给出了决策树对于用于确定影响房颤的一些重要参考指标,具有重要指导意义,剪枝方法适用于该决策树,修建效率及准确性更佳。附图说明图1是决策树结构示意图;图2是医疗数据原稿示意图;图3是导成Excel表格示意图;图4是心脏超声属性示意图;图5是4weka操作界面示意图;图6是均使用默认值决策树示意图;图7是决策树准确率示意图;图8是154项因素的决策树示意图;图9是决策树准确率示意图。具体实施方式实施例1:为了解决房颤预测的构建决策树构建问题,本专利技术提出如下技术方案:一种构建房颤预测决策树的方法,包括:步骤1:如果数据集S属于同一个类别,则创建一个叶子结点,并标记相应类标号,停止构建树;否则,进行步骤2;步骤2:计算数据集S中所有属性的信息增益率Gain-rate(A);步骤3:选取最大信息增益率的属性A;步骤4:将属性A建立为决策树T的根节点,T是要构建的决策树;步骤5:根据属性A的不同取值对数据集进行划分成多个子集,对子集Sv循环执行步骤1-4,构建子树Tv,Sv是属性A取值为v的样本子集;步骤6:将子树Tv添加到决策树T相应的分支中;步骤7:循环结束,得出决策树T。进一步的,数据处理的方法是:对于类标签缺失,直接删除该条信息;对于属性值缺失的,将值并入最常见的某一类中或者以最常用的值代替;处理连续值首先要多数据进行排序,以每个数据为阈值划分数据集,计算各个划分的信息增益,根据最大增益选择阈值,使用阈值对数据集进行划分。进一步的,对决策树进行剪枝操作:1)分别计算三种预测错分样本数:计算子树Tv的所有叶节点预测错分样本数之和,记为E1;计算子树Tv被剪枝以叶节点代替时的预测错分样本数,记为E2;计算子树Tv的最大分支预测错分样本数,记为E3;2)进行比较:E1最小时,不剪枝;E2最小时,进行剪枝,以一个叶节点代替子树Tv;E3最小时,用最大分支代替子树Tv。进一步的,根据信息增益率选择分裂属性:信息熵的公式为:Info_Gain(A)=H(S)-H(A)其中S代表数据集,ci代表数据集的第i个分类,p(ci)代表ci这个类别被选择的概率;在决策树划分时,计算的一般是某个特征属性的信息熵,假设特征属性A有n个不同的值,则特征属性A将数据集S划分成n个小数据集,用si表示,每个小数据集被选择的概率为p(si),根据公式(1)可知,每个小数据集si的信息熵为H(si),特征属本文档来自技高网
...

【技术保护点】
1.一种房颤预测决策树,其特征在于:决策树中根节点A峰,该属性是信息增益率最大的,它的正常范围是41到87,决策树的第一个分支,当a<=0时,a指代的是A峰的值,患者发生房颤,由于数据中没有非0数,所以也就是当a=0时,判断该患者发生房颤;当a>0时,需要继续考虑ef属性,当ef值小于58时,则判断该患者为正常。/n

【技术特征摘要】
1.一种房颤预测决策树,其特征在于:决策树中根节点A峰,该属性是信息增益率最大的,它的正常范围是41到87,决策树的第一个分支,当a<=0时,a指代的是A峰的值,患者发生房颤,由于数据中没有非0数,所以也就是当a=0时,判断该患者发生房颤;当a>0时,需要继续考虑ef属性,当ef值小于58时,则判断该患者为正常。


2.一种房颤预测决策树,其特征在于:决策树中根节点为XGN,当XGN等级大于1时即判断患者为房颤,当XGN等级小于等于1,继续考虑A峰,当A峰为0时,继续考虑FS,当FS大于0时,判断患者患有房颤,否则继续考虑FJB,当FJB小于等于0,考虑LVPWD,当LVPWD小于等于9时,继续考虑EF的值,当EF小于等于57时,则判断该患者为正常,否则为房颤;继续回溯到LVPWD的右支,当LVPWD大于9时,考虑FDMB1的值,当该值小于等于101时,则判断该患者为房颤,否则考虑LAD,当LAD小于等于50时,则判断患者是房颤,...

【专利技术属性】
技术研发人员:张敏张树龙汪祖民杨慧英
申请(专利权)人:大连大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1