一种基于机器学习的中压配电网断线不接地故障检测方法技术

技术编号:19423184 阅读:154 留言:0更新日期:2018-11-14 09:54
本发明专利技术涉及一种基于机器学习的中压配电网断线不接地故障检测方法,包括以下步骤:S1、从配电变压器层级提取日用电量数据;S2、对提取的数据进行预处理,包括对时间序列进行去趋势项和周期性处理;S3、采用基于特征选择的随机森林算法对预处理后的数据进行分类,得到故障检测结果。与现有技术相比,本发明专利技术基于配用电信息系统数据和机器学习算法,用纯数据驱动的方法,提出一套智能检测配电网断线的检测方法,经多重比较,该方法分类的准确度高,而且可以选出判断配电网断线的主要标准的参量。

【技术实现步骤摘要】
一种基于机器学习的中压配电网断线不接地故障检测方法
本专利技术涉及配电网故障诊断技术,尤其是涉及一种基于机器学习的中压配电网断线不接地故障检测方法。
技术介绍
电力系统是城市基础设施的核心部分,中压电网是承担负荷的中心,是电力系统配电网的重要组成部分。其覆盖面广,能够直接为城市及其区域提供所需要的电力资源。中压配电网作为城市供电系统的重要组成部分,其重要性更是不言而喻。由于中压配电网变电站常采用中性点不接地方式,所以当线路单相断线后断口两侧的导线均不接地或是非电源侧导线落地等情况发生时,没有明显的故障特征产生,且无法通过变电站内现有的继电保护装置对故障进行检测。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于机器学习的中压配电网断线不接地故障检测方法。本专利技术的目的可以通过以下技术方案来实现:一种基于机器学习的中压配电网断线不接地故障检测方法,包括以下步骤:S1、从配电变压器层级提取日用电量数据;S2、对提取的数据进行预处理,包括对时间序列进行去趋势项和周期性处理;S3、采用基于特征选择的随机森林算法对预处理后的数据进行分类,得到故障检测结果。优选的,所述步骤S1中提取日用电量数据后筛选出不符合预处理要求的用电量数据。优选的,所述步骤S2具体包括:S21、提取每台变压器前三周对应时间段的时间序列;S22、以前三周时间序列中的时间点对应的每个窗口的平均值作为模板;S23、将原始时间序列减去模板,得到预处理后的时间序列;S24、进行平稳性检验。优选的,所述基于特征选择的随机森林算法具体包括:利用随机森林的变量重要性度量结果对特征按降序排列,取前p%作为特征子集,再随机分训练集和测试集,计算多次平均后的准确率、AUC值的均值和标准差。优选的,所述随机分训练集和测试集的比例为:70%作为训练集,30%作为测试集。优选的,所述日用电量数据包括:配电变压器的电压、电流、有功功率和无功功率。与现有技术相比,本专利技术基于配用电信息系统数据和机器学习算法,用纯数据驱动的方法,提出一套智能检测配电网断线的检测方法,经多重比较,该方法分类的准确度高,而且可以选出判断配电网断线的主要标准的参量。附图说明图1为本专利技术方法的流程示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。如图1所示,一种基于机器学习的中压配电网断线不接地故障检测方法,包括以下步骤:S1、从配电变压器层级提取日用电量数据;S2、对提取的数据进行预处理,包括对时间序列进行去趋势项和周期性处理;S3、采用基于特征选择的随机森林算法对预处理后的数据进行分类,得到故障检测结果。步骤S1中提取日用电量数据后筛选出不符合预处理要求的用电量数据。步骤S2具体包括:S21、提取每台变压器前三周对应时间段的时间序列;S22、以前三周时间序列中的时间点对应的每个窗口的平均值作为模板;S23、将原始时间序列减去模板,得到预处理后的时间序列;S24、进行平稳性检验。基于特征选择的随机森林算法具体包括:利用随机森林的变量重要性度量结果对特征按降序排列,取前p%作为特征子集,再随机分训练集和测试集,70%作为训练集,30%作为测试集,计算多次平均后的准确率、AUC值的均值和标准差,具体过程如下:输入:原始数据集S;输出:分类准确率、AUC值的均值和标准差及其对应的特征集的重要性Rank;Step1:初始化,设置重复训练次数N1和N2,Fori=1:N1;Step2:始数据集S中,用bootstrap有放回地随机抽取K个训练子集,并由此构造K个独立的分类回归树,每个训练子集的补集记为out-of-bag(OOB);Step3:对于m个特征,在每棵树的每个节点中随机抽取mtry个特征,产生特征子集,计算每个特征的基尼指数,选择特征子集中基尼指数最小的特征,作为分裂特征;Step4:每棵树最大限度生长,不剪枝;Step5:平均每个特征的重要性,按降序排列,得到Rank,取前p%作为特征子集,Forj=1:N2;Step6:将数据集S随机打乱后,分出70%的训练集和30%的测试集,重复Step2-4;Step7:将生成的K棵树组成随机森林,分类结果按树分类器的投票而定;Step8:计算每个特征的重要性,以及模型在测试集中的准确率和AUC值;Step9:计算准确率和AUC值的均值和标准差。其中,通常取mtry=floor(log2(m)+1。日用电量数据包括:配电变压器的电压、电流、有功功率和无功功率。有功和无功功率数据的有效率较低并且10kV馈线电流一般只采集一相,因此不考虑有功和无功功率及其变化率的相关特征量。实施例本实施例利用华东某地区2016年3月至2017年4月的配用电信息系统数据进行中压配电网分支线断线不接地故障诊断。从配电变压器层级提取电流、功率、电压A、B、C三相功率数据。其原因是为了准确定位配电变压器的分支。在筛选出不符合预处理要求的用电量数据后,得到了32个断线记录,对应604个配电变压器的三相用电数据。同时,还提取上述604个配电变压器发生断线前一周的三相用电数据作为正常用电的对照。对数据预处理,从三相用电数据的时间序列可以看出,其存在一定的趋势和周期性。为了消除这两种影响,对时间序列进行去趋势项和周期性处理。在预处理后,获得平稳的时间序列。基于特征选择的随机森林算法中参数分别取为ntree=500,mtry=7。经过多次实验,发现特征的平均重要性对ntree和mtry的值较不敏感,参数变化对模型的影响较弱。特征选择的结果表明,电压特性具有更好的断线检测能力。因此,下面使用Logistic回归、SVC和上述的随机森林算法来比较分类结果。首先,调查了三个分类器结果的AUC、准确性(ACC)、敏感性(TPR)和特异性(TNR)。从样本集中随机抽取70%的数据作为训练集,30%的数据作为测试集,重复1000次以获得预测结果的平均值。从三个分类的AUC值、准确性(ACC)、敏感性(TPR)和特异性(TNR)来衡量分类结果。从样本集中随机抽取70%的数据作为训练集,30%的数据作为测试集,重复1000次以获得预测结果的平均值。经过试验,在SVC模型中,选择“RBF”核函数的分类效果最好。本文档来自技高网...

【技术保护点】
1.一种基于机器学习的中压配电网断线不接地故障检测方法,其特征在于,包括以下步骤:S1、从配电变压器层级提取日用电量数据;S2、对提取的数据进行预处理,包括对时间序列进行去趋势项和周期性处理;S3、采用基于特征选择的随机森林算法对预处理后的数据进行分类,得到故障检测结果。

【技术特征摘要】
1.一种基于机器学习的中压配电网断线不接地故障检测方法,其特征在于,包括以下步骤:S1、从配电变压器层级提取日用电量数据;S2、对提取的数据进行预处理,包括对时间序列进行去趋势项和周期性处理;S3、采用基于特征选择的随机森林算法对预处理后的数据进行分类,得到故障检测结果。2.根据权利要求1所述的一种基于机器学习的中压配电网断线不接地故障检测方法,其特征在于,所述步骤S1中提取日用电量数据后筛选出不符合预处理要求的用电量数据。3.根据权利要求1所述的一种基于机器学习的中压配电网断线不接地故障检测方法,其特征在于,所述步骤S2具体包括:S21、提取每台变压器前三周对应时间段的时间序列;S22、以前三周时间序列中的时间点对应的每个窗口的平均值作为模板;S2...

【专利技术属性】
技术研发人员:郭乃网苏运田英杰方炯解梁军宋岩陈睿
申请(专利权)人:国网上海市电力公司华东电力试验研究院有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1