一种基于投票集成学习的心电数据智能分类方法技术

技术编号：23779653 阅读：49 留言：0更新日期：2020-04-14 20:48

本发明专利技术的基于投票集成学习的心电数据智能分类方法，其特征在于，通过以下步骤来实现：a).数据预处理；b).建立logistic回归模型；c).建立决策树模型；d).建立一个支持向量机；e).建立朴素贝叶斯模型；f).建立神经元模型；g).建立k邻近模型；h).模型集成，最终获得一个正确率不低于80%的模型，效果优于步骤b)至步骤g)中建立的单个模型。本发明专利技术的心电数据智能分类方法，首先从ccdd中获取足够数量的数据，将其分为训练集和测试集，然后建立各类模型，最后，获得一个正确率不低于80%的模型，可实现对“正常、房颤、房性早搏、偶发房性早搏、频发房性早搏、房性心动过速、房颤伴快速心室率”进行智能识别分类，实现心血管疾病的早发现、早治疗。

An intelligent classification method of ECG data based on voting integrated learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于投票集成学习的心电数据智能分类方法
本专利技术涉及一种心电数据智能分类方法，更具体的说，尤其涉及一种基于投票集成学习的心电数据智能分类方法。
技术介绍
随着全球人口老龄化问题的日益加剧，患心脏疾病的人群日益增加。据不完全统计，全世界死亡人口中大约有三分之一属于心脏疾病；在我国，每年也有大约54万人死于心脏疾病。心脏疾病及其引发的其他心血管疾病正不断威胁着人类健康，通过各种方式提前预防、诊断心血管疾病显得尤为重要。随着穿戴式心电设备的普及，心电图的获取日益简单，但由于只有专业医师才能解读心电图，严重制约着心电图的应用。研究智能模型，实现心电图的智能诊断，从而使普通人也能看懂心电图，成为重要研究课题。本专利设计一种集成学习模型，针对心电数据进行“正常、房颤、房性早搏、偶发房性早搏、频发房性早搏、房性心动过速、房颤伴快速心室率”，这七种诊断的智能识别分类。
技术实现思路
本专利技术为了克服上述技术问题的缺点，提供了一种基于投票集成学习的心电数据智能分类方法。本专利技术的基于投票集成学习的心电数据智能分类方法，其特征在于，通过以下步骤来实现：a).数据预处理，从中国心血管数据库ccdd获取足够数量的N条数据，并对每条数据进行特征提取，使得每条数据由172列组成，每条数据中第1列为序号、第2列为标签、剩余的169列为特征；按照30％和70％的比例将N条数据分为训练集和测试集，同时提取标签列和特征列；b).建立logistic回归模型，设计一个one-vs-rest的分类模型，...

【技术保护点】
1.一种基于投票集成学习的心电数据智能分类方法，其特征在于，通过以下步骤来实现：/na).数据预处理，从中国心血管数据库ccdd获取足够数量的N条数据，并对每条数据进行特征提取，使得每条数据由172列组成，每条数据中第1列为序号、第2列为标签、剩余的169列为特征；按照30％和70％的比例将N条数据分为训练集和测试集，同时提取标签列和特征列；/nb).建立logistic回归模型，设计一个one-vs-rest的分类模型，不考虑各类型的权重；选择L2正则化，其中优化算法使用开源的liblinear库，通过坐标轴下降法来迭代优化损失函数，迭代100次获得一个准确率不低于76.5％的logistic回归模型；/nc).建立决策树模型，使用基尼系数为当前分裂特征，设计最大深度为3的决策树，设置叶子节点上的最小样本数为1，获得一个准确率不低于71％的决策树模型；/nd).建立一个支持向量机，在样本空间中，划分超平面可通过如下线性方程来描述：/nw

【技术特征摘要】
1.一种基于投票集成学习的心电数据智能分类方法，其特征在于，通过以下步骤来实现：
a).数据预处理，从中国心血管数据库ccdd获取足够数量的N条数据，并对每条数据进行特征提取，使得每条数据由172列组成，每条数据中第1列为序号、第2列为标签、剩余的169列为特征；按照30％和70％的比例将N条数据分为训练集和测试集，同时提取标签列和特征列；
b).建立logistic回归模型，设计一个one-vs-rest的分类模型，不考虑各类型的权重；选择L2正则化，其中优化算法使用开源的liblinear库，通过坐标轴下降法来迭代优化损失函数，迭代100次获得一个准确率不低于76.5％的logistic回归模型；
c).建立决策树模型，使用基尼系数为当前分裂特征，设计最大深度为3的决策树，设置叶子节点上的最小样本数为1，获得一个准确率不低于71％的决策树模型；
d).建立一个支持向量机，在样本空间中，划分超平面可通过如下线性方程来描述：
wTx+b＝0(1)
其中w为法向量，决定了超平面的方向，b为位移项，决定了超平面与原点之间的距离；决策边界由参数w和b确定，我们将其记为(w，b)；样本空间中任意点x到超平面(w，b)的距离可写为：

因此，线性支持向量机的学习就是要寻找满足约束条件的参数w和b，使得γ最大，即：

s.t.yi(wTxi+b)≥1(4)
由于目标函数是二次的，并且约束条件在参数w和b上是线性的，因此线性支持向量机的学习问题是一个凸二次优化问题，直接用现成的优化计算包求解，获得一个准确率不低于72.8％的支持向量机模型；
e).建立朴素贝叶斯模型，选择使用先验为伯努利分布的朴素贝叶斯，得到的准确率不低于68％的朴素贝叶斯模型；
f).建立神经元模型，输入：来自其他m个神经云传递过来的输入信号；处理：输入信号通过带权重的连接进行传递，神经元接受到总输入值将与神经元的阈值进行比较；输出：通过激活函数的处理以得到输出；
激活函数选择logistic函数，设置准牛顿方法族的优化器，共两个隐藏层，第一层10个神经元，第二层2个神经元，获得一个准确率不低于75％的神经元模型；
g).建立k邻近模型，在训练...

【专利技术属性】
技术研发人员：王迪，武鲁，葛菁，赵志刚，霍吉东，李响，李娜，
申请(专利权)人：山东省计算中心国家超级计算济南中心，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人