System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及机器学习领域,特别是涉及一种基于对比学习的电池数据处理模型的无监督训练方法、系统、计算机设备和计算机可读存储介质。
技术介绍
1、电池数据包括电池的容量、续航距离、可用寿命,以及与电池相关的换电工单信息等。利用电池数据进行大数据分析,可以为外卖、共享单车等行业提供积极有效的数据支持。
2、在相关技术中,电池领域内的研究都是针对单一任务的有监督学习,以获取特定任务的电池编码表示;该类方法,普遍数据规模较小并且忽略了电池其他任务包含的领域信息,并且,实际电池使用中,电池数据具有‘无标签,数据波动较大’等特点,构建高效的数据集的过程也通常难以获得。
3、以上综合原因,导致对电池数据的分析处理复杂度较高,且效率低下。
技术实现思路
1、本申请实施例提供了一种基于对比学习的电池数据处理方法、装置、系统、计算机设备和计算机可读存储介质,以至少解决相关技术中电池数据的分析处理复杂度较高的问题。
2、第一方面,本申请实施例提供了一种基于对比学习的电池数据处理模型的无监督训练方法,用于训练目标模型,所述目标模型包括输入层、编码层、投影层、预测层和动量编码器,所述方法包括:
3、通过输入层获取训练数据集,其中,所述训练数据集包括原始电池数据和与所述原始电池数据对应的对比电池数据,所述对比电池数据包括正样本数据和负样本数据;
4、通过编码层,分别将所述原始电池数据和所述正样本数据映射至嵌入式空间,得到低维度的电池编码表示;
6、通过预测层,分别将所述电池低维编码表示和所述嵌入式表示结合,得到预测层嵌入式表示;
7、通过动量编码器,在分别将所述原始电池数据和所述负样本数据映射至嵌入式空间的过程中,基于所述编码层的迭代参数,以动量的方式更新所述动量编码器的参数,得到负样本数据的电池编码表示;
8、通过所述训练数据集,通过计算正样本数据的预测损失和负样本数据集合对比损失,对所述目标模型进行优化训练,得到训练好的电池数据处理模型。
9、在其中一些实施例中,通过所述训练数据集,对所述目标模型所进行训练,得到训练好的电池数据处理模型包括:
10、通过最大化所述原始电池的预测层的嵌入式编码表示和正样本电池投影层的嵌入式表示之间的相似度,以及最小化所述原始电池投影层嵌入式表示和所述负样本电池嵌入式编码表示之间的相似度,确定对比损失函数;
11、以最小化所述对比损失函数为约束条件,基于所述训练数据集训练所述目标模型,在模型迭代完成之后,得到所述训练好的电池数据处理模型。
12、在其中一些实施例中,使用informer作为编码层,在通过编码层得到低维度的电池编码表示的过程中,所述方法还包括:
13、所述编码层通过包含多个informer的自注意力层和蒸馏层来得到原始电池的低维编码表示,其中:
14、所述编码层的自注意力层使用probsparse自注意力机制,计算自注意力值;
15、原始的电池数据和正样本数据输入所述自注意力层之后,经过基于卷积和池化处理的蒸馏层,以处理序列普遍较长的电池数据;
16、在其中一些实施例中,
17、所述投影层一般由一个或多个全连接层组成,每个全连接层后接一个非线性激活函数,以更好地捕捉特征之间的非线性关系;
18、所述投影层是使得编码层的输出通过投影后得到的嵌入式表示更具区分性,有助于模型学到对模型输入更有意义的表示。
19、在其中一些实施例中,所述方法还包括;
20、在获取电池的投影层嵌入式表示后,基于所述的投影层嵌入式表示和编码层的编码表示,确定所述的预测层嵌入式表示;
21、根据所述原始电池数据的预测层嵌入式表示,和所述正样本数据的所述嵌入式表示,确定正样本对损失函数,根据所述原始电池数据与负样本数据的嵌入式表示,确定负样本对损失函数;
22、基于所述正样本对损失函数和所述负样本对损失函数,确定所述对比损失函数。
23、在其中一些实施例中,在每一次的训练负样本数据的过程中,通过所述动量编码器,不断更新训练负样本数据相关的模型参数:
24、基于所述负样本数据集合,通过队列机制,构建所述字典库;
25、基于所述队列机制,采用动量更新负样本数据对应的动量编码器的参数,得到所述负样本数据对应的低维编码层特征,其中,所述动量编码器的参数更新公式如下:
26、
27、其中,为第k次迭代时字典库对应编码层的参数,为此次正样本对的编码器(query encoder)的参数,为动量参数。
28、在其中一些实施例中,获取所述原始电池数据包括:
29、获取目标电池在任意一次放电和充电时间段内的多组电池特征,按照时间序列组合所述多组电池特征得到所述原始电池数据,所述电池特征包括:电池电压、电池温度、电池剩余电量、电池对应的车辆运动状态、电池异常信息和剩余soc;
30、获取所述原始电池数据对应的对比电池数据包括:
31、获取所述原始电池数据对应的时间序列信息和id信息,通过采集与所述id信息相同且时序信息之间间隔小于第一预设时间阈值的电池数据,得到所述正样本数据;
32、通过采集与原始电池不同id的时间序列信息得到所述负样本数据。
33、在其中一些实施例中,训练好的模型可以经过微调用于不同的下游任务,所述方法包括:
34、获取不同下游任务的电池数据以及数据的真实标签;
35、通过对上述方法训练得到电池数据处理模型的编码层进行冻结网络参数,并在编码层的末尾添加由一个多层全连接网络构成的输出层,将所述电池数据处理更新为优化模型;
36、将下游任务对应的有标签数据输入至所述优化模型,对所述优化模型进行训练,其中,所述训练过程中使用ia3进行网络参数的微调;
37、基于所述训练结束之后的优化模型对所述电池数据进行预测或分类,得到与所述下游任务对应的预测任务结果。
38、第二方面,本申请实施例提供了一种电池数据的处理系统,所述系统包括:采集模块和处理模块,其中;
39、所述采集模块用于,获取不同下游任务的带标签电池数据;
40、所述处理模块用于,通过对第一方面所述的方法训练得到电池数据处理模型的编码层进行冻结网络参数,并在编码层的末尾添加由一个多层全连接网络构成的输出层,将所述电池数据处理更新为优化模型,
41、以及,将下游任务对应的有标签数据输入至所述优化模型,对所述优化模型进行训练,其中,所述训练过程中使用ia3进行网络参数的微调;
42、基于所述训练结束之后的优化模型对所述电池数据进行预测或分类,得到与本文档来自技高网...
【技术保护点】
1.一种基于对比学习的电池数据处理模型的无监督训练方法,其特征在于,用于训练目标模型,所述目标模型包括输入层、编码层、投影层、预测层和动量编码器,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,通过所述训练数据集,对所述目标模型所进行训练,得到训练好的电池数据处理模型包括:
3.根据权利要求1所述的方法,其特征在于,使用Informer作为编码层,在通过编码层得到低维度的电池编码表示的过程中,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括;
6.根据权利要求1所述的方法,其特征在于,基于所述负样本数据集合,通过队列机制,构建字典库,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,获取所述原始电池数据包括:
8.根据权利要求1所述的方法,其特征在于,训练好的所述电池数据模型可以经过微调用于不同的下游任务,所述方法包括:
9.一种电池数据的处理系统,其特征在于,所述系统包括:采集模块和处理模块,其
10.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的方法。
...【技术特征摘要】
1.一种基于对比学习的电池数据处理模型的无监督训练方法,其特征在于,用于训练目标模型,所述目标模型包括输入层、编码层、投影层、预测层和动量编码器,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,通过所述训练数据集,对所述目标模型所进行训练,得到训练好的电池数据处理模型包括:
3.根据权利要求1所述的方法,其特征在于,使用informer作为编码层,在通过编码层得到低维度的电池编码表示的过程中,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括;
6.根据...
【专利技术属性】
技术研发人员:李朝,丁东辉,钟逸晨,潘仁波,胡始昌,肖劼,
申请(专利权)人:杭州宇谷科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。