【技术实现步骤摘要】
一种基于投票集成学习的心电数据智能分类方法
本专利技术涉及一种心电数据智能分类方法,更具体的说,尤其涉及一种基于投票集成学习的心电数据智能分类方法。
技术介绍
随着全球人口老龄化问题的日益加剧,患心脏疾病的人群日益增加。据不完全统计,全世界死亡人口中大约有三分之一属于心脏疾病;在我国,每年也有大约54万人死于心脏疾病。心脏疾病及其引发的其他心血管疾病正不断威胁着人类健康,通过各种方式提前预防、诊断心血管疾病显得尤为重要。随着穿戴式心电设备的普及,心电图的获取日益简单,但由于只有专业医师才能解读心电图,严重制约着心电图的应用。研究智能模型,实现心电图的智能诊断,从而使普通人也能看懂心电图,成为重要研究课题。本专利设计一种集成学习模型,针对心电数据进行“正常、房颤、房性早搏、偶发房性早搏、频发房性早搏、房性心动过速、房颤伴快速心室率”,这七种诊断的智能识别分类。
技术实现思路
本专利技术为了克服上述技术问题的缺点,提供了一种基于投票集成学习的心电数据智能分类方法。本专利技术的基于投票集成学习的心电数据智能分类方法,其特征在于,通过以下步骤来实现:a).数据预处理,从中国心血管数据库ccdd获取足够数量的N条数据,并对每条数据进行特征提取,使得每条数据由172列组成,每条数据中第1列为序号、第2列为标签、剩余的169列为特征;按照30%和70%的比例将N条数据分为训练集和测试集,同时提取标签列和特征列;b).建立logistic回归模型,设计一个one-vs-rest的分类模型, ...
【技术保护点】
1.一种基于投票集成学习的心电数据智能分类方法,其特征在于,通过以下步骤来实现:/na).数据预处理,从中国心血管数据库ccdd获取足够数量的N条数据,并对每条数据进行特征提取,使得每条数据由172列组成,每条数据中第1列为序号、第2列为标签、剩余的169列为特征;按照30%和70%的比例将N条数据分为训练集和测试集,同时提取标签列和特征列;/nb).建立logistic回归模型,设计一个one-vs-rest的分类模型,不考虑各类型的权重;选择L2正则化,其中优化算法使用开源的liblinear库,通过坐标轴下降法来迭代优化损失函数,迭代100次获得一个准确率不低于76.5%的logistic回归模型;/nc).建立决策树模型,使用基尼系数为当前分裂特征,设计最大深度为3的决策树,设置叶子节点上的最小样本数为1,获得一个准确率不低于71%的决策树模型;/nd).建立一个支持向量机,在样本空间中,划分超平面可通过如下线性方程来描述:/nw
【技术特征摘要】
1.一种基于投票集成学习的心电数据智能分类方法,其特征在于,通过以下步骤来实现:
a).数据预处理,从中国心血管数据库ccdd获取足够数量的N条数据,并对每条数据进行特征提取,使得每条数据由172列组成,每条数据中第1列为序号、第2列为标签、剩余的169列为特征;按照30%和70%的比例将N条数据分为训练集和测试集,同时提取标签列和特征列;
b).建立logistic回归模型,设计一个one-vs-rest的分类模型,不考虑各类型的权重;选择L2正则化,其中优化算法使用开源的liblinear库,通过坐标轴下降法来迭代优化损失函数,迭代100次获得一个准确率不低于76.5%的logistic回归模型;
c).建立决策树模型,使用基尼系数为当前分裂特征,设计最大深度为3的决策树,设置叶子节点上的最小样本数为1,获得一个准确率不低于71%的决策树模型;
d).建立一个支持向量机,在样本空间中,划分超平面可通过如下线性方程来描述:
wTx+b=0(1)
其中w为法向量,决定了超平面的方向,b为位移项,决定了超平面与原点之间的距离;决策边界由参数w和b确定,我们将其记为(w,b);样本空间中任意点x到超平面(w,b)的距离可写为:
因此,线性支持向量机的学习就是要寻找满足约束条件的参数w和b,使得γ最大,即:
s.t.yi(wTxi+b)≥1(4)
由于目标函数是二次的,并且约束条件在参数w和b上是线性的,因此线性支持向量机的学习问题是一个凸二次优化问题,直接用现成的优化计算包求解,获得一个准确率不低于72.8%的支持向量机模型;
e).建立朴素贝叶斯模型,选择使用先验为伯努利分布的朴素贝叶斯,得到的准确率不低于68%的朴素贝叶斯模型;
f).建立神经元模型,输入:来自其他m个神经云传递过来的输入信号;处理:输入信号通过带权重的连接进行传递,神经元接受到总输入值将与神经元的阈值进行比较;输出:通过激活函数的处理以得到输出;
激活函数选择logistic函数,设置准牛顿方法族的优化器,共两个隐藏层,第一层10个神经元,第二层2个神经元,获得一个准确率不低于75%的神经元模型;
g).建立k邻近模型,在训练...
【专利技术属性】
技术研发人员:王迪,武鲁,葛菁,赵志刚,霍吉东,李响,李娜,
申请(专利权)人:山东省计算中心国家超级计算济南中心,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。