System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据标注方法、装置、设备及介质制造方法及图纸_技高网

一种数据标注方法、装置、设备及介质制造方法及图纸

技术编号:40333326 阅读:9 留言:0更新日期:2024-02-09 14:24
本申请公开了一种数据标注方法、装置、设备及介质,该方法包括:获取故障风力发电机的初标注信息,其中,该初标注信息中包括故障风力发电机的故障信息。然后基于故障风力发电机的业务数据和/或正常风力发电机的业务数据,确定评估指标,该评估指标可以用于对初标注信息进行校准。基于评估指标对初标注信息进行校准,从而获取校准后的目标标注信息。在确定目标标注信息后,可以基于目标标注信息对SCADA数据进行标注。通过本申请所提供的数据标注方法,可以通过风力发电机的业务数据确定用于校准的评估指标,获得更准确的目标标注信息,实现对SCADA数据的标注,无需进行人工标注,既可以提高数据标注的效率还可以提高数据标注的准确性。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种数据标注方法、装置、设备及介质


技术介绍

1、数据采集与监视控制(supervisory control and data acquisition,scada)系统,是一种scada系统是以计算机为基础的生产过程控制与调度自动化系统,可以对现场的运行设备进行监视和控制,具有广泛的应用领域,例如可以应用于风电、石油、燃气、铁路等领域。

2、在风力发电
,scada系统所采集的故障数据是对风力发电机进行故障诊断和故障预警的基础。由于scada系统所采集的scada数据既包括正常数据也包括故障数据,因此需要对scada数据进行标注,提取出故障发生时的数据特征,才可以基于scada故障数据对风机进行故障诊断。也就是,只有被标注的scada数据才具备故障诊断和故障预警的数据挖掘条件。

3、目前风力发电行业内的scada数据依赖人工标注完成,需要具备一定专业知识的业务人员,参考风电故障信息对scada数据进行人工标注,需要消耗大量的时间和人力,导致数据标注的效率较低。并且业务人员的知识有限,在数据标注时也可能存在误判,导致数据标注的准确性较低。


技术实现思路

1、有鉴于此,本申请实施例提供了一种数据标注方法、装置、设备及介质,以便提高数据标注的效率和准确性。

2、第一方面,本申请实施例提供了一种数据标注方法,所述方法包括:

3、获取故障风力发电机的初标注信息,所述初标注信息中包括所述故障风力发电机的故障信息

4、基于所述故障风力发电机的业务数据和正常风力发电机的业务数据,确定评估指标,所述评估指标用于校准所述初标注信息;

5、基于所述评估指标对所述初标注信息进行校准,获取目标标注信息;

6、基于所述目标标注信息对scada数据进行标注。

7、在一种可能的实现方式中,所述基于所述故障风力发电机的业务数据和正常风力发电机的业务数据,确定评估指标,包括:

8、基于所述故障风力发电机的第一业务数据和所述正常风力发电机的第二业务数据,确定参考统计数据;

9、获取所述故障风力发电机在目标预设时间段内的第三业务数据,基于所述第三业务数据确定预设时间窗口所对应的目标统计数据,所述目标预设时间段为根据所述故障信息确定的;

10、基于所述参考统计数据和所述目标统计数据确定所述评估指标。

11、在一种可能的实现方式中,所述基于所述故障风力发电机的第一业务数据和所述正常风力发电机的第二业务数据,确定参考统计数据,包括:

12、基于所述故障风力发电机在故障发生前的第一预设时间段内的第一业务数据,确定所述第一业务数据所对应的第一均值和第一标准差;

13、基于所述正常风力发电机在所述故障风力发电机发生故障的时间内的第二业务数据,确定所述第二业务数据所对应的第二均值和第二标准差。

14、在一种可能的实现方式中,所述基于所述第三业务数据确定预设时间窗口所对应的目标统计数据,包括:

15、基于所述预设时间窗口划分所述目标预设时间段,获得多个所述预设时间窗口;

16、针对多个所述预设时间窗口中的任一预设时间窗口,基于所述第三业务数据确定所述预设时间窗口所对应的第四业务数据;

17、确定所述第四业务数据所对应的第三均值和第三标准差。

18、在一种可能的实现方式中,所述基于所述参考统计数据和所述目标统计数据确定评估指标,包括:

19、针对任一预设时间窗口所对应的第三均值和第三标准差,确定所述第一均值与所述第三均值的第一差值,以及所述第一标准差与所述第三标准差的第二差值,并基于所述第一差值和所述第二差值确定第一指标;

20、确定所述第二均值与所述第三均值的第三差值,以及所述第二标准差与所述第三标准差的第四差值,并基于所述第三差值和所述第四差值确定第二指标;

21、基于所述第一指标和所述第二指标确定所述评估指标。

22、在一种可能的实现方式中,所述基于所述评估指标对所述初标注信息进行校准,包括:

23、获取多个所述评估指标;

24、针对多个所述评估指标中的任一评估指标,当所述评估指标大于预设指标时,获取所述评估指标所对应的预设时间窗口;

25、基于所述评估指标所对应的预设时间窗口对所述初标注信息中的故障信息进行校准。

26、在一种可能的实现方式中,所述基于所述第一差值和所述第二差值确定第一指标,包括:

27、对所述第一差值的绝对值和所述第二差值的绝对值进行加权求和,确定所述第一指标。

28、在一种可能的实现方式中,所述基于所述第一指标和所述第二指标确定所述评估指标,包括:

29、确定所述第一指标和所述第二指标中数值较大的为所述评估指标。

30、在一种可能的实现方式中,所述基于所述目标标注信息对scada数据进行标注,包括:

31、基于所述目标标注信息生成故障标注检索表;

32、基于所述故障标注检索表标注所述scada数据中的故障数据。

33、在一种可能的实现方式中,所述获取故障风力发电机的初标注信息,包括:

34、对所述故障风力发电机的故障案例进行实体抽取,获取故障信息,所述故障信息包括故障时间信息、风场信息、风机信息以及部件故障信息中的至少一种;

35、将所述故障信息与scada数据进行关联,获取所述初标注信息。

36、在一种可能的实现方式中,当所述故障信息包括部件故障信息时,所述对所述故障风力发电机的故障案例进行实体抽取,获取所述部件故障信息,包括:

37、对所述故障风力发电机的故障案例进行实体抽取,获取部件实体和故障实体,所述部件实体表示所述故障风力发电机的故障点,所述故障实体表示对所述故障点的故障描述;

38、基于所述部件实体和所述故障实体进行拼接,获取所述部件故障信息。

39、在一种可能的实现方式中,当所述故障信息包括故障时间信息、风场信息、风机信息以及部件故障信息时,所述将所述故障信息与scada数据进行关联,包括:

40、获取风场信息表、风机信息表以及风电故障树;

41、基于所述风场信息表将所述风场信息与所述scada数据进行关联,所述风场信息包括风场名,所述风场信息表包括风场名和风场编号,所述scada数据包括风场编号;

42、基于所述风机信息表将所述风机信息与所述scada数据进行关联,所述风机信息包括风机名,所述风机信息表包括风机名和风机编号,所述scada数据包括风机编号;

43、基于所述风电故障树将所述部件故障信息与所述scada数据进行关联,所述部件故障信息包括部件实体和故障实体,所述风电故障树包括部件实体、故障实体以及业务字段,所述scada数据包括业务字段;

44、本文档来自技高网...

【技术保护点】

1.一种数据标注方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述故障风力发电机的业务数据和正常风力发电机的业务数据,确定评估指标,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述故障风力发电机的第一业务数据和所述正常风力发电机的第二业务数据,确定参考统计数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第三业务数据确定预设时间窗口所对应的目标统计数据,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述参考统计数据和所述目标统计数据确定评估指标,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述评估指标对所述初标注信息进行校准,包括:

7.根据权利要求5所述的方法,其特征在于,所述基于所述第一差值和所述第二差值确定第一指标,包括:

8.根据权利要求5所述的方法,其特征在于,所述基于所述第一指标和所述第二指标确定所述评估指标,包括:

9.根据权利要求1所述的方法,其特征在于,所述基于所述目标标注信息对SCADA数据进行标注,包括:

10.根据权利要求1所述的方法,其特征在于,所述获取故障风力发电机的初标注信息,包括:

11.根据权利要求10所述的方法,其特征在于,当所述故障信息包括部件故障信息时,所述对所述故障风力发电机的故障案例进行实体抽取,获取所述部件故障信息,包括:

12.根据权利要求11所述的方法,其特征在于,当所述故障信息包括故障时间信息、风场信息、风机信息以及部件故障信息时,所述将所述故障信息与SCADA数据进行关联,包括:

13.根据权利要求12所述的方法,其特征在于,所述基于风电故障树将所述部件故障信息与所述SCADA数据进行关联,包括:

14.一种数据标注装置,其特征在于,所述装置包括:

15.一种数据标注设备,其特征在于,所述设备包括:存储器以及处理器;

16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1至13任一项所述的数据标注方法。

...

【技术特征摘要】

1.一种数据标注方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述故障风力发电机的业务数据和正常风力发电机的业务数据,确定评估指标,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述故障风力发电机的第一业务数据和所述正常风力发电机的第二业务数据,确定参考统计数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第三业务数据确定预设时间窗口所对应的目标统计数据,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述参考统计数据和所述目标统计数据确定评估指标,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述评估指标对所述初标注信息进行校准,包括:

7.根据权利要求5所述的方法,其特征在于,所述基于所述第一差值和所述第二差值确定第一指标,包括:

8.根据权利要求5所述的方法,其特征在于,所述基于所述第一指标和所述第二指标确定所述评估指标,包括:

9.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员:孟鑫禹江容历莹
申请(专利权)人:北京金风慧能技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1