一种模型训练及异常数据识别方法、装置、设备及介质制造方法及图纸

技术编号:34376628 阅读:53 留言:0更新日期:2022-07-31 13:49
本发明专利技术公开了一种模型训练及异常数据识别方法、装置、设备及介质。该方法包括:根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值;其中,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。通过本发明专利技术实施例提供的技术方案,训练的异常数据识别模型准确性更高,进而可以实现基于该模型对油色谱数据中的异常数据进行更精准的识别。对油色谱数据中的异常数据进行更精准的识别。对油色谱数据中的异常数据进行更精准的识别。

A method, device, equipment and medium for model training and abnormal data recognition

【技术实现步骤摘要】
一种模型训练及异常数据识别方法、装置、设备及介质


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种模型训练及异常数据识别方法、装置、设备及介质。

技术介绍

[0002]随着变压器技术的发展,油浸式变压器已经取得了广泛的应用,油浸式变压器的器身往往装在充满变压器油的油箱中,油箱用钢板焊成。在油浸式变压器的应用场景中,需要利用油色采集装置对油浸式变压器的油色谱数据进行采集,但油色采集装置发生故障时,会导致采集的油浸式变压器油色谱数据异常。
[0003]因此,如何对油浸式变压器油色谱数据进行异常检测,提供更高质量的油色谱数据,是目前亟待解决的问题。

技术实现思路

[0004]本专利技术实施例提供一种模型训练及异常数据识别方法、装置、设备及介质,训练的异常数据识别模型准确性更高,进而可以实现基于该模型对油色谱数据中的异常数据进行更精准的识别。
[0005]第一方面,本专利技术实施例提供了一种模型训练方法,包括:
[0006]根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值;其中,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
[0007]根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
[0008]第二方面,本专利技术实施例还提供了一种基于油色谱数据的异常数据识别方法,包括
[0009]获取目标油色谱数据中的至少两组目标已有特征值,其中,不同组目标已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
[0010]将所述目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到所述至少两组目标已有特征值中的异常数据;
[0011]其中,所述异常数据识别模型根据本专利技术任意实施例中所提供的模型训练方法训练得到。
[0012]第三方面,本专利技术实施例还提供了一种模型训练装置,包括:
[0013]确定模块,用于根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值;其中,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
[0014]训练模块,用于根据所述至少两组样本已有特征值、所述至少两组样本已有特征
值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。
[0015]第四方面,本专利技术实施例还提供了一种基于油色谱数据的异常数据识别装置,包括:
[0016]获取模块,用于获取目标油色谱数据中的至少两组目标已有特征值,其中,不同组目标已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;
[0017]得到模块,用于将所述目标油色谱数据中的至少两组目标已有特征值输入到训练好的异常数据识别模型中,得到所述至少两组目标已有特征值中的异常数据;其中,所述异常数据识别模型根据本专利技术任意实施例中所提供的模型训练方法训练得到。
[0018]第五方面,本专利技术实施例还提供了一种电子设备,该电子设备包括:
[0019]一个或多个处理器;
[0020]存储器,用于存储一个或多个程序;
[0021]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任意实施例中所提供的模型训练方法,和/或基于油色谱数据的异常数据识别方法。
[0022]第六方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序。其中,该程序被处理器执行时实现如本专利技术任意实施例所提供的模型训练方法,和/或基于油色谱数据的异常数据识别方法。
[0023]本专利技术实施例提供的方案,根据样本油色谱数据中的至少两组样本已有特征值,确定扩充特征值,然后根据至少两组样本已有特征值、对应的扩充特征值,以及样本油色谱数据关联的异常数据标签,训练异常数据识别模型,从而可以得到用于识别油色谱数据中的异常数据的模型。进一步的,通过获取目标油色谱数据中的至少两组目标已有特征值,并将其输入到训练好的异常数据识别模型中,可以得到已有特征值中的异常数据,实现对异常数据的识别。通过这样的方式,训练出的异常数据识别模型准确性更高,从而可以基于该模型对油色谱数据中的异常数据进行更精准的识别,获得更高质量的油色谱数据。
附图说明
[0024]图1A为本专利技术实施例一提供的一种模型训练方法的流程图;
[0025]图1B为本专利技术实施例一提供的模型结构示意图;
[0026]图2为本专利技术实施例二提供的一种模型训练方法的流程图;
[0027]图3为本专利技术实施例三提供的一种模型训练方法的流程图;
[0028]图4为本专利技术实施例四提供的一种基于油色谱数据的异常数据识别方法的流程图;
[0029]图5为本专利技术实施例五提供的一种模型训练装置的结构框图;
[0030]图6为本专利技术实施例六提供的一种基于油色谱数据的异常数据识别装置的结构框图;
[0031]图7为本专利技术实施例七提供的一种电子设备的结构示意图。
具体实施方式
[0032]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0033]实施例一
[0034]图1A为本专利技术实施例一提供的一种模型训练方法的流程图,图1B为本专利技术实施例一提供的模型结构示意图。本实施例可适用于对异常数据识别模型进行训练的情况,其中,油色谱数据中出现异常数据是油色采集装置故障所导致的。该方法可以由模型训练装置来执行,该装置可以采用软件和/或硬件的方式来实现。如图1A所示,该方法具体包括:
[0035]S101、根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值。
[0036]其中,样本油色谱数据是指包含至少两组样本已有特征值和已有特征值对应的扩充特征值的数据,样本油色谱数据中异常数据的标签信息是已知的。样本已有特征值是指油色采集装置采集的变压器油液中溶解的至少两种气体的含量数据。扩充特征值是指根据已有特征值扩充确定出的数据特征值。一组样本已有特征值是指同时采集的变压器油液中至少两种气体的含量值,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值,其中,气体含量的单位表示为浓度(ppm,parts per million)。变压器油液中包含的气体可以是氢气(h2)、甲烷(ch4)、乙烯(c2h4)、乙炔(c2h2)、一氧化碳(co)、二氧化碳(co2)、氧气(o2)、碳氢化合物(thc,total hydrocarbons)以及乙烷(c2h6)中的至少两种。
[0037本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值;其中,不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值;根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,用于识别油色谱数据中的异常数据。2.根据权利要求1所述的方法,其特征在于,所述根据样本油色谱数据中的至少两组样本已有特征值,确定每组样本已有特征值对应的扩充特征值,包括:根据样本油色谱数据中每组样本已有特征值之间的相关性,确定每组样本已有特征值对应的第一扩充特征值;根据同一气体在不同组样本已有特征值中对应的含量值,确定每组样本已有特征值对应的第二扩充特征值。3.根据权利要求2所述的方法,其特征在于,所述根据样本油色谱数据中每组样本已有特征值之间的相关性,确定每组样本已有特征值对应的第一扩充特征值,包括:采用秩和校验法,解析样本油色谱数据中每组样本已有特征值之间的相关性,得到每组样本已有特征值对应的至少两个气体关联值;根据所述每组样本已有特征值对应的至少两个气体关联值,确定每组样本已有特征值对应的第一扩充特征值。4.根据权利要求2所述的方法,其特征在于,所述根据同一气体在不同组样本已有特征值中对应的含量值,确定每组样本已有特征值对应的第二扩充特征值,包括:根据目标气体在第一组样本已有特征值和第二组样本已有特征值中对应的含量值,确定所述目标气体的绝对增长量和/或相对增长率,并将所述绝对增长量和/或相对增长率作为所述第二组样本已有特征值对应的第二扩充特征值;其中,所述第一组样本已有特征值的采集时间点早于所述第二组样本已有特征值的采集时间点。5.根据权利要求1所述的方法,其特征在于,所述根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值,以及所述样本油色谱数据关联的异常数据标签,训练异常数据识别模型,包括:将每组样本已有特征值与该组样本已有特征值对应的扩充特征值,作为一组数据集;按照每组样本已有特征值的采集时间,对不同组数据集进行合并,得到训练集、验证集和测试集;基于所述训练集、验证集和测试集,以及所述样本油色谱数据关联的异常数据标签,训练异常数...

【专利技术属性】
技术研发人员:马坤鹏翟志祥刘寒寒杨浩巍
申请(专利权)人:上海思源弘瑞自动化有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1