System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于自然语言处理的电网数据质量评价方法技术_技高网

基于自然语言处理的电网数据质量评价方法技术

技术编号:41344902 阅读:14 留言:0更新日期:2024-05-20 10:00
本发明专利技术涉及电网智能化技术领域,具体涉及基于自然语言处理的电网数据质量评价方法。该方法包括:接收文本模态的电网数据,其中,文本模态为表格模态;按照预设选取规则对电网数据进行自然语言处理,得到电网参数一致性数据;将电网参数一致性数据代入电网数据评价模型进行评价,得到对应的得分;根据对应的得分确定电网数据的质量。本发明专利技术能够提高对电网数据质量的评价的精确性。

【技术实现步骤摘要】

本专利技术涉及电网智能化,具体涉及基于自然语言处理的电网数据质量评价方法


技术介绍

1、随着电力行业的快速发展和信息化水平的不断提高,电网数据的质量问题越来越受到关注。电网数据的质量直接关系到电力系统的安全、稳定和经济运行。因此,对电网数据进行质量评价是十分必要的。

2、传统的电网数据质量评价方法主要依赖于人工分析和经验判断,存在主观性强、效率低下等问题。近年来,随着自然语言处理技术的发展,人们开始尝试将自然语言处理技术应用于电网数据质量评价中。

3、基于自然语言处理的电网数据质量评价方法,主要是通过对电网数据中的文本信息进行自然语言处理,提取出与数据质量相关的特征,然后利用这些特征对电网数据进行质量评价。这种方法具有自动化、客观性强、效率高等优点,为电网数据质量评价提供了新的思路和方法。

4、然而,现有技术中对电网数据质量进行评估时,依据人工分析,但面对海量数据时,效率较低,因此,亟需一种基于自然语言处理的电网数据质量评价方法。


技术实现思路

1、本专利技术的目的在于提供一种基于自然语言处理的电网数据质量评价方法:解决现有方案中因传统的电网数据质量评估依赖于人工分析和经验判断,存在主观性强、效率低下的技术问题。

2、本专利技术的目的可以通过以下技术方案实现:

3、基于自然语言处理的电网数据质量评价方法,方法包括:

4、接收文本模态的电网数据,其中,文本模态为表格模态;

5、按照预设选取规则对电网数据进行自然语言处理,得到电网参数一致性数据;

6、将电网参数一致性数据代入电网数据评价模型进行评价,得到对应的得分;

7、根据对应的得分确定电网数据的质量。

8、进一步地,按照预设选取规则对电网数据进行自然语言处理之前,方法还包括以下步骤:

9、建立电网语料库;

10、根据电网语料库对文本模态的电网数据中的地名进行统计模型的标记;

11、依据标记的地名进行确定地名所在的文本位置。

12、进一步地,按照预设选取规则对电网数据进行自然语言处理包括以下步骤:

13、识别地名并获取地名所在的文本位置;

14、按照地名所在的文本位置进行电网参数一致性数据内容选取:

15、当电网数据位表格首行且为行数一行时,以实体设备所在文本位置为起点,以文本空白为终点,选取起点与终点间的文本内容作为电网参数一致性数据;

16、当电网数据位于表格首行且为多行时,以实体设备所在文本位置为起点,选取首行的文本内容后,切换至下一行并略过地名和实体设备,选取下一行的文本内容,依次遍历电网数据的所有行,直至识别到地名变化,以地名变化的上一行空白处作为终点,整合所有识别的文本内容作为电网参数一致性数据;

17、当电网数据位于表格中间时,以地名所在的文本位置为起点,依次遍历所有行,直至识别到地名变化,以地名变化的上一行空白处作为终点,整合所有识别的文本内容作为电网参数一致性数据;

18、当电网数据位于表格尾行时,以实体设备所在文本位置为起点,以文本空白为终点,选取起点与终点间的文本内容作为电网参数一致性数据。

19、进一步地,将电网参数一致性数据代入电网数据评价模型进行评价,得到对应的得分包括以下步骤:

20、对电网参数一致性数据进行分析得到变电站参数一致性信息、拓扑线路参数一致性信息、设备状态参数一致性信息;

21、根据变电站参数一致性信息与标准变电站参数信息进行对比,得到变电站参数一致性b;

22、根据拓扑线路参数一致性信息与标准拓扑线路参数信息进行对比,得到拓扑线路参数一致性t;

23、根据设备状态参数一致性信息与标准设备状态参数信息对比,得到设备状态参数一致性s;

24、将变电站参数一致性b、拓扑线路参数一致性t和设备状态参数一致性s代入电网数据评价模型进行公式计算,得到对应的得分,该计算公式如下:

25、

26、其中,lmt为得分,e为电网归一化常量,其值为趋近于1的无理数,af、as、pd为权重因子,由电网系统进行设置,af、as、pd的和值为1。

27、进一步地,根据变电站参数一致性信息与标准变电站参数信息进行对比,得到变电站参数一致性b,该方法包括:

28、获取变电站参数一致性信息中变电站总数,统计满足标准变电站参数信息的变电站个数,计算满足标准变电站参数信息的变电站个数占变电站总数的比例,该比例为变电站参数一致性b。

29、进一步地,根据拓扑线路参数一致性信息与标准拓扑线路参数信息进行对比,得到拓扑线路参数一致性t,该方法包括:

30、获取拓扑线路参数一致性信息中拓扑线路总数,统计满足标准拓扑线路参数信息的拓扑线路个数,计算满足标准拓扑线路参数信息的拓扑线路个数占拓扑线路总数的比例,该比例为拓扑线路参数一致性t。

31、进一步地,根据设备状态参数一致性信息与标准设备状态参数信息对比,得到设备状态参数一致性s,该方法包括:

32、获取设备状态参数一致性信息中设备状态参数总数,统计满足标准设备状态参数信息的设备状态参数个数,计算满足标准设备状态参数信息的设备状态参数个数占设备状态参数总数的比例,该比例为设备状态参数一致性s。

33、进一步地,在接收文本模态的电网数据之前,对电网数据进行数据抽取、数据清理和数据加载,并根据标准信息数据规则,对电网数据命名规范进行整合。

34、相比于现有方案,本专利技术实现的有益效果:

35、本专利技术能够基于自然语言处理方法对电网数据进行处理,得到电网参数一致性数据,将电网参数一致性数据代入电网数据评价模型进行评价,得到对应的得分,根据对应的得分确定电网数据的质量,摆脱依赖于人工分析和经验判断,得到的评分客观性强、提高评估效率。

本文档来自技高网...

【技术保护点】

1.基于自然语言处理的电网数据质量评价方法,其特征在于,方法包括:

2.根据权利要求1所述的基于自然语言处理的电网数据质量评价方法,其特征在于,按照预设选取规则对电网数据进行自然语言处理之前,方法还包括以下步骤:

3.根据权利要求2所述的基于自然语言处理的电网数据质量评价方法,其特征在于,按照预设选取规则对电网数据进行自然语言处理包括以下步骤:

4.根据权利要求3所述的基于自然语言处理的电网数据质量评价方法,其特征在于,将电网参数一致性数据代入电网数据评价模型进行评价,得到对应的得分包括以下步骤:

5.根据权利要求4所述的基于自然语言处理的电网数据质量评价方法,其特征在于,根据变电站参数一致性信息与标准变电站参数信息进行对比,得到变电站参数一致性B,该方法包括:

6.根据权利要求4所述的基于自然语言处理的电网数据质量评价方法,其特征在于,根据拓扑线路参数一致性信息与标准拓扑线路参数信息进行对比,得到拓扑线路参数一致性T,该方法包括:

7.根据权利要求4所述的基于自然语言处理的电网数据质量评价方法,其特征在于,根据设备状态参数一致性信息与标准设备状态参数信息对比,得到设备状态参数一致性S,该方法包括:

8.根据权利要求1所述的基于自然语言处理的电网数据质量评价方法,其特征在于,在接收文本模态的电网数据之前,对电网数据进行数据抽取、数据清理和数据加载,并根据标准信息数据规则,对电网数据命名规范进行整合。

...

【技术特征摘要】

1.基于自然语言处理的电网数据质量评价方法,其特征在于,方法包括:

2.根据权利要求1所述的基于自然语言处理的电网数据质量评价方法,其特征在于,按照预设选取规则对电网数据进行自然语言处理之前,方法还包括以下步骤:

3.根据权利要求2所述的基于自然语言处理的电网数据质量评价方法,其特征在于,按照预设选取规则对电网数据进行自然语言处理包括以下步骤:

4.根据权利要求3所述的基于自然语言处理的电网数据质量评价方法,其特征在于,将电网参数一致性数据代入电网数据评价模型进行评价,得到对应的得分包括以下步骤:

5.根据权利要求4所述的基于自然语言处理的电网数据质量评价方法,其特征在于,根据变电站参数一致性信息...

【专利技术属性】
技术研发人员:王鑫潘如轩刘辉肖家锴张淑娟王潇赵龙钱光超邢璐张敏夏兆俊卞真旭史伟豪邹知炜徐军
申请(专利权)人:国网安徽省电力有限公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1