当前位置: 首页 > 专利查询>江南大学专利>正文

一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法技术

技术编号:25346625 阅读:35 留言:0更新日期:2020-08-21 17:05
本发明专利技术公开了一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,属于数据源分类技术领域。所述方法包括:对心电数据进行特征提取,获得心电信号训练样本数据集;根据心电信号样本的初始权重,抽样选取心电信号训练数据集获得心电信号样本;用弱分类器对心电信号样本进行分类,分类错误的样本的加权方式由弱分类器的分类错误率和样本被错分的概率这两个因素所决定。本发明专利技术充分考虑分错样本的错分概率,通过设置合适的阈值,并以此对弱分类器进行筛选,来得到分类精度更高的强分类器。

【技术实现步骤摘要】
一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法
本专利技术涉及一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,属于数据源分类

技术介绍
AdaBoost算法最早源于1990年,Schapire提出了Boosting(自举)算法,是一种提高预测能力的有效工具,然而,Boosting算法并不能解决如何将弱分类器合成强分类器的问题。1995年,Freund和Schapire提出了AdaBoost算法,其是一种迭代算法,其通过样本分布和弱分类器权值,得到相应的弱分类器,并组成强分类器,其具有很高的精度,并在分类问题和回归问题得到了广泛的应用,目前,主要广泛的应用于生物电信号处理、人脸识别、图片检索等方面。传统的AdaBoost算法中的权重主要用于弱分类器寻找其分类误差最小的点,那么其权重对于待测实例来说是固定的,因此,分类正确率不是很高。心脏疾病具有实时性和突发性,且死亡率较高,因此,将对心电信号情况判断的准确性要求很高。现有的利用AdaBoost算法进行心电信号分类是通过弱分类器的错分率来调整训练集中的权值,并且所有被分错的心电信号样本均用同一个权重因子进行加权,并未考虑错误样本的错分率对弱分类器进行筛选,这种分类方式分类的精度不高。
技术实现思路
本专利技术提供一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,所述方法包括:对心电数据进行特征提取,获得心电信号训练样本数据集;确定心电信号训练样本数据集的初始权重;用弱分类器对心电信号训练样本数据集进行分类,弱分类器分类错误的样本的加权方式由弱分类器对心电信号训练样本数据集分类错误的概率和对心电信号训练样本数据集分类后取错误类值的概率所决定。在本专利技术的一种实施方式中,所述AdaBoost算法通过训练不同的弱分类器,然后综合起来,形成最终的强分类器;训练弱分类器时,给予每条心电数据用于计算误差的不同权重,对每个分类器,给予用于分类的不同权重。在本专利技术的一种实施方式中,所述特征提取算法为离散小波变换,具体为二进小波变换,包括如下步骤:S201:取能保证预处理的心电信号的数据量个数的采样点;S202:设置正阈值为极大值点幅值的平均值的1/4,负阈值为极小值点幅值的平均值的1/4;S203:函数选择二次B样条小波,尺度为4,利用1-4尺度上的小波系数选出QRS波能量最大的某一尺度求出模极大值序列;S204:在选取的尺度上设置初始阈值,在极大值点组成的序列和极小值点组成的序列中搜索极值对,保留正极大值大于正阈值,负极大值小于负阈值的模极大值对,同时将不符合要求的极值对从序列中删除;S205:由最终的极值点组成的序列确定极值对的过零点位置,每一对的过零点就是R波的估计定位,将这些过零点纳入R波候选点序列中,并求出R波候选点序列中两两间隔的平均值RRmean;S206:求出每个R波间隔,若在0.6×RRmean的时间内出现第二个R波,那么去掉绝对值小的R波,并将该点从R波候选点序列中去除;S207:当发现R波间隔超过1.6×RRmean时,减小正阈值为平均值的1/6,返回步骤S204设置第二个阈值检测R波;若还检测不到目标,则存在倒向R波,将波形沿x轴翻转重新检测。在本专利技术的一种实施方式中,所述用弱分类器对心电信号数据集分类错误的样本加权的步骤包括:S301:设输入的特征提取后的心电信号训练样本数据集为{(A1,B1),(A2,B2),……,(At,Bt)},At是数据集的属性向量,Bt是标志向量,Bt={-1,1};算法的循环次数为固定的数值n;所述标志向量Bt将心电信号训练样本数据集分为两类,分别为1和-1,其中,-1代表心电异常类值,1代表心电正常类值;S302:确定心电信号训练样本数据集的初始权重为D(Ai)=1/t,i=1,2,…,t;S303:确定弱分类器Ht,,用弱分类器对心电信号训练样本数据集进行分类,分类错误的概率为εt,心电信号训练样本数据集取正常类值和异常类值时的概率为(P(1),P(2),…,P(t));S304:当分类错误时,弱分类器Ht对心电信号训练样本数据集分类后取错误类值的概率为P(a),分类后取正确类值的概率为1-P(a),加权因子为η=2P(a)-1;S305:预设阈值,当步骤S5得到的取错误类值的概率P(a)大于预设的阈值时,返回步骤S302;S306:当εt>0.5时,重新初始化心电信号训练样本数据集权重,并返回步骤S303,否则S307:更新分布Dt,Zt是一个标准化因子,则:其中,αt表示Ht(At)为最终的强分类器的重要程度;S308:n轮训练结束后,输出最终的强分类器:在本专利技术的一种实施方式中,所述S305中,阈值为3/4。本专利技术的利用优化的AdaBoost加权方式和弱分类器对心电信号分类方法用于人体心电信号的分类。有益效果:(1)本专利技术充分考虑弱分类器的分类错误率和样本被错分的概率这两个因素对AdaBoost分类错误样本的加权方式影响,并以此为基础对加权因子做出了改进,来得到分类精度更高的强分类器,能够更好地对心电信号进行分类。(2)本专利技术充分考虑分错心电信号样本的错分概率,通过设置合适的阈值,并以此对弱分类器进行筛选,来得到分类精度更高的强分类器。(3)本专利技术通过考虑分错样本的错分概率这一个数值,同时改进了算法的加权因子和弱分类器的筛选方式,使得改进过程更方便简单,心电信号分类效果更明显。附图说明图1是本专利技术算法流程图。图2是本专利技术AdaBoost改进部分的算法示意图。图3是本专利技术AdaBoost算法原理图。图4是实施例2的原算法和改进后的算法对比图。具体实施方式下面结合附图和实施例对本专利技术作进一步详细说明。实施例1如图1、图2所示,一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,所述方法包括:S1:获取心电数据,所述数据集来自MIT-BIH数据库(美国麻省理工学院提供的研究心律失常的数据库)中的心率失常数据库;S2:进行心电数据特征提取,所述特征提取算法为离散小波变换(DWT),具体为二进小波变换,具体步骤如下:S201:取前500个采样点,保证预处理的心电信号的数据量;S202:设置正阈值为极大值点幅值的平均值的1/4,负阈值为极小值点幅值的平均值的1/4;S203:函数选择二次B样条小波,尺度为4,利用1-4尺度上的小波系数选出QRS波(QRSwavecomplex)能量最大的某一尺度求出模极大值序列;S204:在选取的尺度上设置初始阈值,在极大值点组成的序列和极小值点组成的序列中搜索极值对,保留正极大值大于正阈值,负极大值小于负阈值的模极大值对,同时将不符合要求的极值对从本文档来自技高网...

【技术保护点】
1.一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,其特征在于,所述方法包括:对心电数据进行特征提取,获得心电信号训练样本数据集;用AdaBoost算法对心电信号训练样本数据集进行分类,所述AdaBoost算法为单决策树的弱分类器的分类算法,所述弱分类器分类错误的样本的加权方式由弱分类器对心电信号训练样本数据集分类错误的概率和对心电信号训练样本数据集分类后取错误类值的概率所决定。/n

【技术特征摘要】
1.一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,其特征在于,所述方法包括:对心电数据进行特征提取,获得心电信号训练样本数据集;用AdaBoost算法对心电信号训练样本数据集进行分类,所述AdaBoost算法为单决策树的弱分类器的分类算法,所述弱分类器分类错误的样本的加权方式由弱分类器对心电信号训练样本数据集分类错误的概率和对心电信号训练样本数据集分类后取错误类值的概率所决定。


2.如权利要求1所述的一种基于心电信号的优化AdaBoost加权方式和弱分类器的方法,其特征在于,所述AdaBoost算法通过训练不同的弱分类器,然后综合起来,形成最终的强分类器;训练弱分类器时,给予每条心电数据用于计算误差的不同权重,对每个分类器,给予用于分类的不同权重。


3.如权利要求1所述的一种基于心电信号的优化AdaBoost加权方式和弱分类器的方法,其特征在于,所述特征提取算法为离散小波变换,具体为二进小波变换,包括如下步骤:
S201:在需预处理的心电数据中取采样点;
S202:设置正阈值为极大值点幅值的平均值的1/4,负阈值为极小值点幅值的平均值的1/4;
S203:函数选择二次B样条小波,尺度为4,利用1-4尺度上的小波系数选出QRS波能量最大的某一尺度求出模极大值序列;
S204:在选取的尺度上设置初始阈值,在极大值点组成的序列和极小值点组成的序列中搜索极值对,保留正极大值大于正阈值,负极大值小于负阈值的模极大值对,同时将不符合要求的极值对从序列中删除;
S205:由最终的极值点组成的序列确定极值对的过零点位置,每一对的过零点就是R波的估计定位,将这些过零点纳入R波候选点序列中,并求出R波候选点序列中两两间隔的平均值RRmean;
S206:求出每个R波间隔,若在0.6×RRmean的时间内出现第二个R波,那么去掉绝对值小的R波,并将该点从R波候选点序列中去除;
S207:当发现R波间隔超过1.6×RRmean时,减小正阈值为平均值的1/6,返回步骤S204设置第二个阈值...

【专利技术属性】
技术研发人员:虞致国王恬魏敬和顾晓峰
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1