当前位置: 首页 > 专利查询>东华大学专利>正文

基于特征选择和支持向量回归的电池健康状况预测方法技术

技术编号:29250950 阅读:25 留言:0更新日期:2021-07-13 17:19
本发明专利技术涉及一种基于特征选择和支持向量回归算法的电池健康状况预测方法,首先对电池生命周期充电过程中的电压、电流和温度曲线进行特征提取,再通过特征选择,筛选出可用于SOH预测的特征样本集,以支持向量回归算法求得各特征和SOH之间的回归关系并以相关性为基准进行加权平均,即可代入待测数据进行SOH预测。本发明专利技术充分发挥了特征提取和特征选择的优势,仅选用数据中可用度高的特征信息作为估计的参考标准,相较于传统方法,在保证预测精度的同时大大降低了计算量和训练复杂度,更加适用于实时系统。

【技术实现步骤摘要】
基于特征选择和支持向量回归的电池健康状况预测方法
本专利技术涉及一种电池健康状况预测方法,属于车载电池健康监测领域和机器学习领域。
技术介绍
近年来,随着电动汽车的迅速发展和普及,车载动力电池的健康状况监测正在成为一个越来越热门的研究方向,通过分析和研究电池的健康状况和老化程度,推算电池剩余使用寿命,对提升电池安全性有着重要的意义。动力电池的健康状态SOH(StateofHealth)表征电池在使用过程中老化和衰退的程度,是使用者制定使用标准和推算剩余使用寿命的重要参考依据。目前使用最为广泛的定义是基于电池最大可用容量,即通过电池在使用过程中的容量衰减来表现电池的老化程度。由于电池的容量信息在使用过程中难以测算,故现有的SOH测算方法一般是通过研究分析充电过程中电压、电流以及温度数据和容量衰减之间的相关性,对SOH进行估计,常用的方法包括等效模型法和神经网络法。而这类方法用于训练的数据集都十分巨大,难以用于实时系统。特征选择(featureselection)是机器学习中通过选择最有效特征以降低数据集维度的一种数据预处理方法,它可以将数据集中不相关或者相关性较小的特征去除,从而降低学习任务的难度,提升算法的性能。在特征选择中,将相关性作为评价标准,用以评估数据的重要程度,常用的方法有过滤法(Filter)和包裹法(Wrapper)。支持向量回归(SVR)是一种机器学习回归算法,由支持向量机(SVM)推广得到。在支持向量机中,原样本空间通过非线性映射转化为一个高维的空间,从而使得原本线性不可分的问题在该空间中线性可分。类似地,将分类问题中的分类边界当作是回归曲线,支持向量机同样可以解决回归问题,SVR算法和一般的线性回归算法的区别在于,SVR采用了非线性核函数,并非当样本点落在曲线之外就要计算损失,而是允许一定的误差范围存在,故SVR算法在处理回归问题时能更有效地体现样本之间的相关性。
技术实现思路
本专利技术的目的是:提供一种可以有效提取车载电池数据中的可用样本,对电池健康状况进行预测的方法。为了达到上述目的,本专利技术的技术方案是提供了一种基于特征选择和支持向量回归算法的电池健康状况预测方法,其特征在于,包括以下步骤:步骤一、从电池管理系统中采集a个电池组的离线数据,组成总训练数据集Tr={Tr1,Tr2,......,Tra},式中,总训练数据集Tr中的第i个数据集Tri={V,I,T,sT},V、I、T、s分别为第i个电池组在生命周期内N次充电时的电压序列集合、电流序列集合、温度序列集合、每次充电后记录的最大可用容量序列集合;步骤二、对每个电池组的数据集进行特征提取,从电压、电流和温度序列中测算提取出和电池容量相关性较高的J个特征,将每个电池组提取出的特征序列组成特征序列集合,得到a个特征序列集合X1,X2,....,Xa,其中,将第i个电池组提取出的特征序列组成的特征序列集合定义为Xi={xi1,xi2,......,xiJ},i=1,2,......,a,xi1、xi2、......、xiJ分别对应于属于第i个特征序列集合Xi的J个特征的特征向量;步骤三、对步骤二得到的每个特征序列集合进行特征选择,根据Filter法,首先去除变化量最小的特征向量,然后计算剩余各特征向量与最大可用容量序列集合s之间的皮尔森系数,皮尔森系数越大表示该特征向量与容量之间有着更好的相关性,根据特征选择的要求,选择相关性最好的K个特征序列作为回归模型训练的样本集{X′1,X′2,......,X′a};步骤四、设通过特征选择筛选的样本集为{X′1,X′2,......,X′a},将样本集{X′1,X′2,......,X′a}中的第i个样本定义为X′i,X′i={x′i1,x′i2,......,xiK′},xiK′表示第i个特征序列集合Xi经过步骤三筛选后的第K个特征向量,其维度为N,由此共获得了a×K个特征向量;步骤五、获得样本集{X′1,X′2,......,X′a}中所有样本的每个特征向量组成的特征子集与最大可用容量序列集合s之间的回归关系,其中,将样本集{X′1,X′2,......,X′a}中所有样本的第k个特征向量组成的特征子集xk与最大可用容量序列集合s之间的回归关系定义为fk(xk),则fk(xk)通过以下步骤获得:步骤501、设样本集{X′1,X′2,......,X′a}中所有样本的第k个特征向量组成的特征子集根据SVR算法,特征子集xk与最大可用容量序列集合s存在回归关系:上式中,ω、b表示待优化参数,表示SVR算法中的非线性核函数,即可得到以下优化问题:subjecttofk(xk)-si≤ε+ξiξi≥0,i=1,2,3,...,3×170式中,ε=ω·xk+b为算法设定在回归超平面周围的误差带;ξi=max(0,1-f(ωTxi+b))为松弛变量,用于计算落在误差带以外样本点至边界的距离,当样本点与超平面距离超过ε的范围则计入误差,否则不计误差;C为惩罚因数,表示优化方向中两个指标偏好的权重;表示计算超平面另一侧的误差的松弛变量;而误差带间隔为2/||ω||,优化目标即为最大化误差带间隔,即最小化ω让尽量多的样本点落在该区域;使用拉格朗日乘子将约束条件融合进损失函数,并求解即可得到特征子集xk与最大可用容量序列集合s的回归关系s=fk(xk);步骤五、当K个特征子集全部完成上述步骤,可获得K个回归关系f1(x1),f2(x2),......,fk(xk),按照各特征的皮尔森系数将其加权平均,即得到SOH估计的公式:式中,αk为加权因子,皮尔森系数越高,加权因子越大;步骤六、对待测电池进行在线参数采集,具体方法为:以恒流充电模式为基准,记录电池在单次充电至截至容量的过程中的电压、电流和温度曲线,将采集所得的电压数据记作序列v′=[v1,v2,v3,......,vs],所得的电流数据记作序列i′=[i1,i2,i3,......,is],所得的温度数据记作序列t′=[t1,t2,t3,......,ts],其中,s为各曲线中包含数据的个数;步骤七、对步骤六中在线采集所获得的序列进行特征提取,但并不要求提取如步骤二中的所有特征,仅需提取经步骤三特征选择后所筛选的K个特征,记作n′=[n1,n2,......,nk];步骤八、将在线采集并经过特征提取的特征序列n′=[n1,n2,......,nk]代入步骤五得到的SOH估计公式,即可得到待测电池的SOH,其公式为:式中,s′即为待测电池的SOH。优选地,步骤一中,V={v1,v2,......,vk,......,vN},vk包含a个电池组中第i个电池组第k次完整充电操作的电压数据;I={i1,i2,......,ik,......,iN},ik包含a个电池组中第i个电池组第k次完整充电操作的电流数据;T={t1,t2,......,tk,...本文档来自技高网
...

【技术保护点】
1.一种基于特征选择和支持向量回归算法的电池健康状况预测方法,其特征在于,包括以下步骤:/n步骤一、从电池管理系统中采集a个电池组的离线数据,组成总训练数据集T

【技术特征摘要】
1.一种基于特征选择和支持向量回归算法的电池健康状况预测方法,其特征在于,包括以下步骤:
步骤一、从电池管理系统中采集a个电池组的离线数据,组成总训练数据集Tr={Tr1,Tr2,......,Tra},式中,总训练数据集Tr中的第i个数据集Tri={V,I,T,sT},V、I、T、s分别为第i个电池组在生命周期内N次充电时的电压序列集合、电流序列集合、温度序列集合、每次充电后记录的最大可用容量序列集合;
步骤二、对每个电池组的数据集进行特征提取,从电压、电流和温度序列中测算提取出和电池容量相关性较高的J个特征,将每个电池组提取出的特征序列组成特征序列集合,得到a个特征序列集合X1,X2,....,Xa,其中,将第i个电池组提取出的特征序列组成的特征序列集合定义为Xi={xi1,xi2,......,xiJ},i=1,2,......,a,xi1、xi2、......、xiJ分别对应于属于第i个特征序列集合Xi的J个特征的特征向量;
步骤三、对步骤二得到的每个特征序列集合进行特征选择,根据Filter法,首先去除变化量最小的特征向量,然后计算剩余各特征向量与最大可用容量序列集合s之间的皮尔森系数,皮尔森系数越大表示该特征向量与容量之间有着更好的相关性,根据特征选择的要求,选择相关性最好的K个特征序列作为回归模型训练的样本集{X′1,X′2,......,X′a};
步骤四、设通过特征选择筛选的样本集为{X′1,X′2,......,X′a},将样本集{X′1,X′2,......,X′a}中的第i个样本定义为X′i,X′i={x′i1,x′i2,......,xiK′},xiK′表示第i个特征序列集合Xi经过步骤三筛选后的第K个特征向量,其维度为N,由此共获得了a×K个特征向量;
步骤五、获得样本集{X′1,X′2,......,X′a}中所有样本的每个特征向量组成的特征子集与最大可用容量序列集合s之间的回归关系,其中,将样本集{X′1,X′2,......,X′a}中所有样本的第k个特征向量组成的特征子集xk与最大可用容量序列集合s之间的回归关系定义为fk(xk),则fk(xk)通过以下步骤获得:
步骤501、设样本集{X′1,X′2,......,X′a}中所有样本的第k个特征向量组成的特征子集根据SVR算法,特征子集xk与最大可用容量序列集合s存在回归关系:



上式中,ω、b表示待优化参数,表示SVR算法中的非线性核函数,即可得到以下优化问题:



subjecttofk(xk)-si≤ε+ξi



ξi≥0,i=1,2,3,...,3×170



式中,ε=ω·xk+b为算法设定在回归超平面周围的误差带;ξi=max(0,1-f(ωTxi+b))为松弛变量,用于计算落在误差带以外样本点至边界的距离,当样本点与超平面距离超过ε的范围则计入误差,否则不计误差;C为惩罚因数,表示优化方向中两个指标偏好的权重;表示计算超平面另一侧的误差的松弛变量;
而误差带间隔为2/||ω||,优化目标即为最大化误差带间隔,即最小化ω让尽量多的样本点落在该区...

【专利技术属性】
技术研发人员:吴贇杨智鹏蒋学芹白恩健
申请(专利权)人:东华大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1