一种模型训练及异常数据识别方法、装置、设备及介质制造方法及图纸

技术编号：34376628 阅读：53 留言：0更新日期：2022-07-31 13:49

本发明专利技术公开了一种模型训练及异常数据识别方法、装置、设备及介质。该方法包括：根据样本油色谱数据中的至少两组样本已有特征值，确定每组样本已有特征值对应的扩充特征值；其中，不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值；根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值，以及所述样本油色谱数据关联的异常数据标签，训练异常数据识别模型，用于识别油色谱数据中的异常数据。通过本发明专利技术实施例提供的技术方案，训练的异常数据识别模型准确性更高，进而可以实现基于该模型对油色谱数据中的异常数据进行更精准的识别。对油色谱数据中的异常数据进行更精准的识别。对油色谱数据中的异常数据进行更精准的识别。

A method, device, equipment and medium for model training and abnormal data recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练及异常数据识别方法、装置、设备及介质

[0001]本专利技术实施例涉及数据处理
，尤其涉及一种模型训练及异常数据识别方法、装置、设备及介质。

技术介绍

[0002]随着变压器技术的发展，油浸式变压器已经取得了广泛的应用，油浸式变压器的器身往往装在充满变压器油的油箱中，油箱用钢板焊成。在油浸式变压器的应用场景中，需要利用油色采集装置对油浸式变压器的油色谱数据进行采集，但油色采集装置发生故障时，会导致采集的油浸式变压器油色谱数据异常。
[0003]因此，如何对油浸式变压器油色谱数据进行异常检测，提供更高质量的油色谱数据，是目前亟待解决的问题。

技术实现思路

[0004]本专利技术实施例提供一种模型训练及异常数据识别方法、装置、设备及介质，训练的异常数据识别模型准确性更高，进而可以实现基于该模型对油色谱数据中的异常数据进行更精准的识别。
[0005]第一方面，本专利技术实施例提供了一种模型训练方法，包括：
[0006]根据样本油色谱数据中的至少两组样本已有特征值，确定每组样本已有特征值对应的扩充特征值；其中，不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值；
[0007]根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值，以及所述样本油色谱数据关联的异常数据标签，训练异常数据识别模型，用于识别油色谱数据中的异常数据。
[0008]第二方面，本专利技术实施例还提供了一种基于油色谱数据的异常数据识别方法，包括...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：根据样本油色谱数据中的至少两组样本已有特征值，确定每组样本已有特征值对应的扩充特征值；其中，不同组样本已有特征值为不同时间点采集的变压器油液中至少两种气体的含量值；根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值，以及所述样本油色谱数据关联的异常数据标签，训练异常数据识别模型，用于识别油色谱数据中的异常数据。2.根据权利要求1所述的方法，其特征在于，所述根据样本油色谱数据中的至少两组样本已有特征值，确定每组样本已有特征值对应的扩充特征值，包括：根据样本油色谱数据中每组样本已有特征值之间的相关性，确定每组样本已有特征值对应的第一扩充特征值；根据同一气体在不同组样本已有特征值中对应的含量值，确定每组样本已有特征值对应的第二扩充特征值。3.根据权利要求2所述的方法，其特征在于，所述根据样本油色谱数据中每组样本已有特征值之间的相关性，确定每组样本已有特征值对应的第一扩充特征值，包括：采用秩和校验法，解析样本油色谱数据中每组样本已有特征值之间的相关性，得到每组样本已有特征值对应的至少两个气体关联值；根据所述每组样本已有特征值对应的至少两个气体关联值，确定每组样本已有特征值对应的第一扩充特征值。4.根据权利要求2所述的方法，其特征在于，所述根据同一气体在不同组样本已有特征值中对应的含量值，确定每组样本已有特征值对应的第二扩充特征值，包括：根据目标气体在第一组样本已有特征值和第二组样本已有特征值中对应的含量值，确定所述目标气体的绝对增长量和/或相对增长率，并将所述绝对增长量和/或相对增长率作为所述第二组样本已有特征值对应的第二扩充特征值；其中，所述第一组样本已有特征值的采集时间点早于所述第二组样本已有特征值的采集时间点。5.根据权利要求1所述的方法，其特征在于，所述根据所述至少两组样本已有特征值、所述至少两组样本已有特征值对应的扩充特征值，以及所述样本油色谱数据关联的异常数据标签，训练异常数据识别模型，包括：将每组样本已有特征值与该组样本已有特征值对应的扩充特征值，作为一组数据集；按照每组样本已有特征值的采集时间，对不同组数据集进行合并，得到训练集、验证集和测试集；基于所述训练集、验证集和测试集，以及所述样本油色谱数据关联的异常数据标签，训练异常数...

【专利技术属性】
技术研发人员：马坤鹏，翟志祥，刘寒寒，杨浩巍，
申请(专利权)人：上海思源弘瑞自动化有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人