System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开属于数据处理,更具体地说,是涉及一种故障数据自动标注方法及装置。
技术介绍
1、随着风力发电产业迅猛发展,风电机组装机容量逐年攀升。作为风能资源获取的重要媒介,风电机组多安装在条件恶劣的地区,这给机组安全稳定运行带来严峻挑战。风电机组数据采集与监视控制(supervisory control and data acquisition, scada)系统包含着风电机组运行性能相关的上百个参数,长期积累的高维海量数据可提供的信息量十分丰富。
2、因为scada数据极为庞大,现有的故障数据标注一般通过人工标注,工作量大且精度低。因此,亟需一种故障数据自动标注方法及装置。
技术实现思路
1、本公开的目的在于提供一种故障数据自动标注方法及装置,以解决人工标注精度低、工作量大的问题。
2、本公开实施例的第一方面,提供了一种故障数据自动标注方法,包括:
3、对第一数据集进行一次清洗得到第二数据集;所述第一数据集为目标设备的历史运行数据集;所述第一数据集包含待标注故障数据集;
4、根据待标注故障数据集确定关键特征参数,基于所述关键特征参数对所述第二数据集进行二次清洗得到第三数据集;
5、根据故障类型,基于所述第三数据集确定所述故障类型对应的超限阈值;
6、基于所述超限阈值对所述待标注故障数据集进行标注得到故障标注数据集。
7、本公开实施例的第二方面,提供了一种故障数据自动标注装置,包括:
8、第一
9、第二数据清洗单元,用于根据待标注故障数据集确定关键特征参数,基于所述关键特征参数对所述第二数据集进行二次清洗得到第三数据集;
10、故障阈值确定单元,用于根据故障类型,基于所述第三数据集确定所述故障类型对应的超限阈值;
11、数据标注单元,用于基于所述超限阈值对所述待标注故障数据集进行标注得到故障标注数据集。
12、本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的故障数据自动标注方法的步骤。
13、本公开实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的故障数据自动标注方法的步骤。
14、本公开实施例提供的一种故障数据自动标注方法及装置的有益效果在于:
15、一方面,本公开提出的故障数据自动标注方法,在数据清洗阶段,与现有的仅根据风速-功率曲线进行数据清洗的思路不同。本公开针对待标注的故障数据集对应的关键特征参数,基于机器学习算法(孤立森林算法)对数据进行二次深度清洗,进一步提高了数据的质量,获得的阈值更加精确。
16、另一方面,本公开可以实现故障数据的自动标注,极大地减少了人工参与,提高了数据处理效率,降低了成本。同时,由于标注的准确性和可靠性的提高,使得基于这些标注数据进行的故障分析和预测结果也更为准确可靠。
本文档来自技高网...【技术保护点】
1.一种故障数据自动标注方法,其特征在于,包括:
2.如权利要求1所述的故障数据自动标注方法,其特征在于,所述基于所述超限阈值对所述待标注故障数据集进行标注得到故障标注数据集,包括:
3.如权利要求2所述的故障数据自动标注方法,其特征在于,所述第一标注数据集包括多个连续的第一标注数据;
4.如权利要求1所述的故障数据自动标注方法,其特征在于,所述故障类型包括低于下限故障类型和高于上限故障类型,所述低于下限故障类型中的数据与所述高于上限故障类型中的数据不相同;
5.如权利要求4所述的故障数据自动标注方法,其特征在于,所述基于所述第三数据集确定所述低于下限故障类型对应的第一超限阈值,包括:
6.如权利要求4所述的故障数据自动标注方法,其特征在于,所述基于所述第三数据集确定所述高于上限故障类型对应的第二超限阈值,包括:
7.如权利要求1所述的故障数据自动标注方法,其特征在于,所述对第一数据集进行一次清洗得到第二数据集,包括:
8.一种故障数据自动标注装置,其特征在于,包括:
9.一种电子设备
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
...【技术特征摘要】
1.一种故障数据自动标注方法,其特征在于,包括:
2.如权利要求1所述的故障数据自动标注方法,其特征在于,所述基于所述超限阈值对所述待标注故障数据集进行标注得到故障标注数据集,包括:
3.如权利要求2所述的故障数据自动标注方法,其特征在于,所述第一标注数据集包括多个连续的第一标注数据;
4.如权利要求1所述的故障数据自动标注方法,其特征在于,所述故障类型包括低于下限故障类型和高于上限故障类型,所述低于下限故障类型中的数据与所述高于上限故障类型中的数据不相同;
5.如权利要求4所述的故障数据自动标注方法,其特征在于,所述基于所述第三数据集确定所述低于下限故障类型对应的第一超限阈值,包括:
6.如...
【专利技术属性】
技术研发人员:段新会,马良玉,程东炎,常喜茂,崔凝,苏志恒,王兴武,
申请(专利权)人:保定华仿科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。