基于压差监控电池生产异常的方法、电子设备、存储介质技术

技术编号:38666339 阅读:13 留言:0更新日期:2023-09-02 22:46
本发明专利技术涉及于电池生产异常监控系统领域,尤其涉及一种基于压差监控电池生产异常的方法、电子设备、存储介质。方法包括:S1:采集电池压差数据清洗过滤并匹配标签;S2:划分训练、测试集;S3:结合统计学方法构建新特征;S4:对构建的特征统一量纲;S5:用XGBoost算法建模,结合上述构建的特征采用大数据分析技术手段,挑选部分相关性高的特征,减少相关性弱的特征对预测目标值的干扰;S6:在电池生产过程中,将数据输入到构建好的XGBoost分类模型中,模型根据压差与标签之间的关联性,反馈此刻电池的压差数据状态。本发明专利技术通过大量压差数据结合大数据分析技术手段,拟合出与电池异常的特征权重,预测结果准确率较高。预测结果准确率较高。预测结果准确率较高。

【技术实现步骤摘要】
基于压差监控电池生产异常的方法、电子设备、存储介质


[0001]本专利技术属于电池生产异常监控系统领域,涉及一种源自电池生产过程中压差变化的异常监控方法,具体是一种基于XGBoost有监督分类模型监控电池压差是否异常的方法。

技术介绍

[0002]在电池生产过程中,如电池容量不足、泄露、短路等,都会是由于原材料、设备、工艺等多种因素影响出现各种异常情况,这些异常情况如果不及时发现和处理,会对电池的质量和性能产生负面影响,甚至会导致安全事故。为此,本专利技术提出一种利用数据挖掘和机器学习,对电池生产过程中的异常情况进行实时监控的技术。

技术实现思路

[0003]本专利技术是为了要解决电池生产过程中,工艺参数保护功能的不灵活性,参数不适配所有电池特性的弊端,以及电池生产安全保护问题而提出的一种具备高效率、高精确率的自主学习迭代的方法,该方法基于有监督学习的XGBoost分类模型可以实现对每条采样数据的压差波动进行判断是否异常。
[0004]为实现所述目的,本专利技术的技术方案为:
[0005]依据本专利技术的一个方面,提供一种基于压差监控电池生产异常的方法,包括:
[0006]S1、从电池生产设备中获取多条已生产电池的历史压差数据并为之匹配异常标签,对历史压差数据进行清洗过滤以去除缺失值和异常值;
[0007]S2、根据设定的训练数据和测试数据的比例,对历史压差数据划分出训练集、测试集;
[0008]S3、结合统计学构建出压差数据与标签之间关联的多个新特征;
>[0009]S4、对构建的特征采用标准化方式统一量纲;
[0010]S5、用XGBoost算法建模,结合构建的特征采用大数据分析手段不断地训练模型并挑选其中与预测目标值相关性高的特征,剔除相关性低的特征;
[0011]S6、在电池生产过程中,将需要预测的数据输入到构建好的XGBoost分类模型中,模型会根据压差数据与标签之间的关联性,反馈此刻电池的压差数据处于正常或异常的状态。
[0012]作为一种改进方案,所述步骤S1的清洗过滤,包括但不限于标签匹配、检查各工步压差记录条数是否大于设定阈值、检查电池数据是否具备完整工步的一者或多者。进一步,步骤S1被配置为包括:
[0013]S1

1:获取压差数据对应的标签,采用Pandas库对采样的压差数据和标签值对应匹配;
[0014]S1

2:检查电池各工步的压差特征记录条数是否都大于60行记录;
[0015]S1

3:检查数据是否含有完整13工步的数据;
[0016]S1

4:对不符合S1

2、S1

3条件的数据进行剔除。
[0017]作为另一种改进方案,步骤S2中采用的是sklearn库中train_test_split函数对所述比例随机划分数据集。
[0018]作为另一种改进方案,所述大数据分析手段被配置为递归特征消除(RFE),在训练模型的过程中,采用递归特征消除计算各个特征与预测目标值之间的相关系数进行排序,通过迭代所述排序不断地训练模型并剔除剔除相关性低的特征。进一步的,步骤S3构建的新特征,包括但不限于压差的一阶差分、压差与时间的导数、压差的标准差中的一者或多者。
[0019]优选地,步骤S3进一步包括:
[0020]S3

1:根据工艺流程区分充电和放电步骤的特征提取;
[0021]S3

2:计算压差的一阶差分(FirstDifference),输入N个测试点的数据{X1,X2,...,X
N
},根据公式(1)计算连续相邻两项之差,其中x表示第N个测试点的压差数据;
[0022][0023]S3

2:计算压差与时间的导数(Derivative),导数计算公式为:
[0024][0025]S3

3:计算压差的标准差(StandardDeviation),根据标准差公式(3),判断单个电池数据的压差特征离散程度:
[0026][0027]以一阶差分、导数以及标准差作为所述特征。
[0028]作为另一种改进方案,步骤S4进一步包括:
[0029]所述统一量纲被配置为利用标准化(Standardization)公式,将构建的所有特征变换为均值为0、标准差为1的分布状况,其中标准化公式定义为:
[0030][0031]作为另一种改进方案,步骤S5进一步包括:
[0032]S5

1:基于步骤S4的特征处理结果,使用XGBoost模型进行训练,给定步骤S5标准化过后的特征数据集合:其中为一组输入模型的特征向量,y
i
为训练向量记录的对应数值标签,训练XGBoost分类模型使得符合模型函数:
[0033][0034]S5

2:构造目标函数,XGBoost加入正则项,含有正则项的目标函数定义如下:
[0035][0036]式中,表示模型的损失函数,即每个样本预测值与真实值之间的误差;表示树的复杂度,可以采用树的层数和叶子节点来评估;
[0037]S5

3:泰勒级数近似目标函数,根据S5

2的目标函数,进行泰勒二阶展开如公式
(7):
[0038][0039]对损失函数二阶泰勒展开如下:
[0040][0041]式中,y
i
是标签值是个常数,而是前一次学习的结果;
[0042]S5

4:树结构结合目标函数,即有如下的映射关系f
k
(x)=w
q(x)
,其中w是叶子节点的取值,q(x)表示叶子节点的编号,也就是说对于任意一个电池压差的样本x,其最后的结果都会落在这棵树的某一个叶子节点上面,其值表示为根据正则项优化控制叶子节点个数T,则有以下正则项公式:
[0043][0044]最终,当树模型结构一定时,经过泰勒公式简化后的目标函数:
[0045][0046]S5

5:每次选取一个特征都需要进行信息增益计算,采用Obj
new

Obj
old
的方式计算各特征之间的信息增益Gai n:
[0047][0048]其中:当节点不分裂时,损失为:当节点分裂时,左右叶子结点的损失分别为:当训练损失减少量小于正则的时候,分裂的增益为负值;如果最好的分裂产生的增益结果是负,则该停止分裂。
[0049]优选地,步骤S5中,在XGBoost模型训练后检查模型的预测精度是否达到设定阈值;若是则上生产系统,否则等待下一批训练数据融入上批模型再训练。
[0050]作为另一种改进方案,步骤S6进一步包括:基于步骤S5训练的XGBoost分类模型,给定一组输入本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于压差监控电池生产异常的方法,其特征在于,所述方法包括以下步骤:S1、从电池生产设备中获取多条已生产电池的历史压差数据并为之匹配异常标签,对历史压差数据进行清洗过滤以去除缺失值和异常值;S2、根据设定的训练数据和测试数据的比例,对历史压差数据划分出训练集、测试集;S3、结合统计学构建出压差数据与标签之间关联的多个新特征;S4、对构建的特征采用标准化方式统一量纲;S5、用XGBoost算法建模,结合构建的特征采用大数据分析手段不断地训练模型并挑选其中与预测目标值相关性高的特征,剔除相关性低的特征;S6、在电池生产过程中,将需要预测的数据输入到构建好的XGBoost分类模型中,模型会根据压差数据与标签之间的关联性,反馈此刻电池的压差数据处于正常或异常的状态。2.根据权利要求1所述的方法,其特征在于:所述步骤S1的清洗过滤,包括但不限于标签匹配、检查各工步压差记录条数是否大于设定阈值、检查电池数据是否具备完整工步的一者或多者。3.根据权利要求2所述的方法,其特征在于,所述步骤S1进一步包括:S1

1:获取压差数据对应的标签,采用Pandas库对采样的压差数据和标签值对应匹配;S1

2:检查电池各工步的压差特征记录条数是否都大于60行记录;S1

3:检查数据是否含有完整13工步的数据;S1

4:对不符合S1

2、S1

3条件的数据进行剔除。4.根据权利要求1所述的方法,其特征在于,所述步骤S2进一步包括:采用的是sklearn库中train_test_split函数对所述比例随机划分数据集。5.根据权利要求1所述的方法,其特征在于:所述大数据分析手段被配置为递归特征消除(RFE);在训练模型的过程中,采用递归特征消除计算各个特征与预测目标值之间的相关系数进行排序,通过迭代所述排序不断地训练模型并剔除剔除相关性低的特征。6.根据权利要求5所述的方法,其特征在于,所述步骤S3构建的新特征,包括但不限于压差的一阶差分、压差与时间的导数、压差的标准差中的一者或多者。7.根据权利要求6所述的方法,其特征在于,所述步骤S3进一步包括:S3

1:根据工艺流程区分充电和放电步骤的特征提取;S3

2:计算压差的一阶差分(First Difference),输入N个测试点的数据{X1,X2,...,X
N
},根据公式(1)计算连续相邻两项之差,其中x表示第N个测试点的压差数据;Δ
yx
=y
x+1

y
x
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)S3

2:计算压差与时间的导数(Derivative),导数计算公式为:S3

3:计算压差的标准差(Standard Deviation),根据标准差公式(3),判断单个电池数据的压差特征离散程度:
以一阶差分、导数以及标准差作为所述特征。8.根据权利要求1所述的方法,其特征在于,所述步骤S4进一步包括:所述统一量纲被配置为利用标准化(Standardization)公式,...

【专利技术属性】
技术研发人员:周智鸿张浩陈东陈谦谢缔王守模
申请(专利权)人:广东恒翼能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1