基于小波包变换和支持向量机的故障选线方法

高金峰1,秦瑜瑞1,殷红德2

(1.郑州大学 电气工程学院, 河南 郑州 450001;2.国网平顶山供电公司, 河南 平顶山 467000)

摘 要:配电网发生单相接地故障时,故障线路与正常线路的零序电流非工频分量差异明显。针对在高阻接地时以模极大值的极性为判据导致选线成功率不高的问题,给出了一种零序电流非工频分量和支持向量机相结合的选线方法。该方法通过小波包变换分解各线路零序电流,按能量最大原则选取特征频带,将不同线路在特征频带上的能量与模极大值作为特征向量,以故障线路标号为分类目标,把故障选线转化为多分类问题,使用支持向量机预测故障线路;通过大量仿真得到训练样本,利用K折交叉验证和网格搜索对支持向量机进行参数寻优。测试集上的结果表明,该方法准确、可靠。在不同接地距离、接地电阻、故障初始相角下均能正确选线。

关键词:故障选线;小波包变换;多分类;支持向量机

0 引言

配电网中发生单相接地故障的概率较高,准确地选出故障线路,对提高配电网运行安全性、稳定性具有重要意义。近年的故障选线方法主要有利用注入信号选线[1]、利用稳态量选线[2]和利用暂态量[3-4]选线。其中,利用注入信号的方法向发生故障的配电网注入功率或方波进行故障选线,信号发生器设计复杂,并难以应用于高电压等级的场景。利用稳态量选线的主要问题是当中性点非直接接地系统发生单相接地故障时,稳态量幅值较小。尤其在消弧线圈采取过补偿方式接地时,利用稳态量难以区分故障线路与正常线路。而故障后的暂态分量幅值较大,易于检测,蕴含着丰富的时频信息,可通过时频分析方法提取其故障特征,以此区分正常线路和故障线路。

已有大量研究利用暂态量进行故障选线。文献[5-7]利用暂态电流相关系数进行选线,但相关系数阈值难以确定;文献[8]基于衰减直流分量解决过零点选线困难的问题,但未考虑对暂态电流起主导作用的高频分量;文献[9-11]用小波变换分析故障前后的暂态电气量,提取高频特征,通过对比各线路零序电流在特征频带上的能量、模极大值进行故障选线,但当线路末端发生高阻接地故障时,故障线路的能量和模极大值与正常线路差异较小,没有明显的数量关系,不易进行对比。近年来,支持向量机被广泛应用于多分类问题,若以故障线路作为分类目标,把配电网故障选线视为多分类问题,利用支持向量机对故障特征进行分类,探究各线路故障特征量的内部关系,而不以模极大值的极性和大小作为判据,具有重要意义。与此同时,在智能电网的建设过程中,随着RPMS、WAMS系统被大量使用,在运行过程中记录了充足的故障信息,为电网故障选线的暂态信息量提供了充足的数据来源[12],使支持向量机运用到配电网故障诊断领域成为可能。

笔者通过Matlab/Simulink搭建4条出线配电网系统,进行大量仿真,分析不同工况下发生单相接地故障时各线路的零序电流,给出了一种“特征提取+支持向量机”的选线方法。采用小波包变换提取各线路零序电流在特征频带上的能量和模极大值,作为故障特征向量,线路标号作为分类目标,将故障选线转化为多分类问题。对此进行大量仿真得到训练集和测试集,以K折交叉验证和网格搜索相结合的方式对支持向量机进行参数寻优,以获得最优参数,并在测试集上对选线效果进行分析。

1 故障电流仿真分析

在Matlab/Simulink上搭建4条出线配电网仿真模型,线路正序参数取R1=0.132 Ω/km、X1=0.132 mH/km、C1=9.78 nF/km。零序参数R0=0.388 6 Ω/km、X0=4.126 mH/km、C0=7.758 nF/km,消弧线圈采取过补偿方式。其拓扑结构如图1所示。

图1 配电网结构

Figue 1 Distribution network structure

为模拟真实配电网各个线路长短不一的情况,4条出线长度分别取15、20、30、40 km。由于故障初始时刻暂态分量的频率在0.3~3 kHz,为满足奈奎斯特采样频率,仿真过程中采样频率取6 400 Hz。以线路4为故障线路,设置故障发生在距母线20 km处,接地电阻分别为1、500、1 000 Ω,故障线路与正常线路零序电流对比如图2~4所示。

图2 ..=1 Ω时各线路零序电流

Figue 2 Zero sequence currents wtih ..=1 Ω

图3 ..=500 Ω时各线路零序电流

Figue 3 Zero sequence currents wtih ..=500 Ω

图4 ..=1 000 Ω时各线路零序电流

Figue 4 Zero sequence currents wtih ..=1 000 Ω

由图2~4可以看出:各线路零序电流在发生单相接地故障后会突然增大;故障线路零序电流与正常线路零序电流极性相反且幅值较大;高阻接地时,零序电流震荡加剧,幅值变小。

2 小波包变换与特征提取

2.1 小波包变换原理

小波变换为一种多尺度时频分析方法,具有良好的时频局部化分析能力,适用于暂态零序电流的特征提取[10]。离散小波变换的过程可类比将信号通过一组高通滤波器和低通滤波器,经过高通滤波器得到高频分量D1,经过低通滤波器获得低频分量A1,高频分量和低频分量各占原始信号频带的一半。传统小波变换对第一层分解后得到的A1进行再一次分解得到下一层低频分量和高频分量;小波包变换对A1和D1都进行下一层分解,将原始信号划分到更多频带。传统小波变换和小波包变换的分解树如图5和图6所示。

图5 小波变换树

Figue 5 Wavelet transform tree

图6 小波包变换树

Figue 6 Wavelet packet transform tree

相比小波变换,小波包变换可更精细地分解原始信号,笔者采用小波包变换对零序电流进行分析。

2.2 特征提取

对于配电网发生接地故障后各出线的零序电流,选用“db10”小波进行j层小波包变换,在第j层分解中,每个出线的零序电流可得到2j组不同的频率分量,通过下式计算各频率分量的能量:

(1)

式中:为在第j层第k个频率分量,j为小波包分解层数,k为零序电流在第j层分解后各频率分量编号(k=0,2,…,2j-1)。

将任一出线零序电流进行4层小波包分解,在4层分解后,每个线路的零序电流可得到16组频率分量,按式(1)计算各分量能量,得到该出线零序电流第4层分解后在各频带上的能量:

.=[ε1,ε2,…,εn],

则该4条出线配电网系统的能量矩阵可表示为:

该矩阵维数为4×16,每行元素代表同一出线在不同频带下的能量,每列元素代表4条出线在各对应频带下的能量,基于能量最大原则[13],并对其进行改进:除工频量所在频带,选取列元素之和最大列所对应的频带为特征频带,以此表示4条出线配电网系统的能量特征,记为:

.=[e1,e2,e3,e4]。

零序电流在故障时刻存在突变点。经小波变换后,在特征频带上的模极大值与原信号的突变点之间存在对应关系,模极大值大小代表信号突变的强弱程度,极性代表信号的突变方向。4条出线配电网系统的模极大值向量为:

.=[m1,m2,m3,m4],

式中:m1m2m3m4代表各线路零序电流在特征频带上的模极大值。根据基于小波变换故障选线的理论,由于故障线路暂态零序电流与正常线路方向相反,其模极大值应与其余各线路模极大值极性相反[14],通过对比.中各元素极性,找出正负号与其余元素相反的元素,该元素代表的线路即为故障线路。但在线路末端发生高阻接地时,易出现故障线路模极大值极性与正常线路相同的情况,该判据失效。

采用上述仿真模型,设置线路4末端发生高阻接地故障,故障距离取距母线31.2 km,接地电阻为1 250 Ω。选取各线路故障前一个周期及故障后两个周期的零序电流,利用“db10”小波包对其进行4层分解,并在特征频带上经过重构,把模极大值标出后如图7所示。

图7 特征频带上的模极大值

Figue 7 Modulus maximum in characteristic frequency band

根据小波奇异性检测理论,故障线路零序电流模极大值应与正常线路相反[13],以此作为选出故障线路的依据。而线路1至线路4在特征频带上的模极大值依次为0.064 7、0.026 0、-0.044 3、-0.047 5,该判据在线路末端发生高阻接地时失效。因此,笔者引入支持向量机,通过挖掘数据内部特征,对各线路在特征频带上的能量和模极大值组成的样本进行分类。

3 多分类SVM及参数寻优

3.1 SVM与多分类问题

支持向量机(support vector machine, SVM)被广泛地应用于回归、分类、异常点检测等领域。SVM通过构造最优分类平面,将不同样本类别分开。

在图8中,实线为最优分类面,最优平面不仅能将不同类别的样本分隔,还要分类间隔最大,即使得样本中离最优分类面最近的点,距最优分类面的距离最大,这些点被称为支持向量。

图8 最优分类面

Figue 8 Optimal classification surface

设样本(.i,yi),i=1,2,…,myi∈{-1,+1},.i为特征向量,yi为类别标号,分类面决策方程可表示为:

f(.)=.T.+b

(2)

利用该超平面区分不同类别的样本:当.T.+b<0,将样本归为-1类;当.T.+b>0,将样本归为+1类。

对于给定的训练集,目标为找到对应的.b,使支持向量距分类平面的距离能够最远。将目标函数进行凸优化,结合约束条件,可将该问题转化为如下带有约束条件的最优化问题:

s.t.yi·(.T.+b)≥1,

(3)

式中:C为惩罚系数;ξ为松弛因子,用于减小难以分类的样本带来的影响,防止过拟合。

对式(3)的约束化模型构建拉格朗日函数,引入拉格朗日乘子ai(i=1,2,…,m)得:

L(.,b,a)=

(4)

通过求解该对偶问题,得到最优的拉格朗日乘子a*和参数b*,并引入核函数,得到分类器的最终决策方程为:

(5)

常见的核函数有高斯核函数和线性核函数。

原始SVM算法是根据二分类问题设计的,而4条出线配电网故障选线问题,具有4个分类目标,属于多分类问题,因此需将该问题转化为SVM适用二分类问题。利用“一对一”方法可将多元分类转换为多个SVM二元分类问题:“一对一”方法对具有N类不同标签的训练集进行两两匹配,得出所有可能的分类器,共CN2种,待训练完毕,对未知样本分类时,则能得到CN2个预测结果,在多个分类器的预测结果中进行投票,得到多分类SVM的最终分类目标。

3.2 参数寻优

对于采用高斯核函数的SVM,惩罚系数C和高斯核函数参数γ直接影响SVM的性能,可采用网格搜索(grid search, GS)寻优[14],将不同取值的Cγ两两组合,构成参数空间,遍历所有的组合来寻找最优参数。通常GS会和K折交叉验证(K-CV)协作进行,在每个Cγ的组合下,K-CV将原始训练样本划分为K个子集,在每次验证时,选取其中一个子集作为测试集,其余K-1个子集作为训练集,由此可进行K组不同的训练过程,将每次训练过程的平均准确率作为该Cγ组合下的性能指标。对比不同组合下的性能,选择准确率最高的一组参数为最优参数。线性SVM不采用高斯核函数,仅对惩罚系数C构造搜索空间,同样结合K-CV,在每一个惩罚系数C下,以交叉验证得到的平均准确率作为评价指标。

笔者对高斯核函数SVM参数Cγ构成的二维空间和线性核函数SVM的参数C构成的一维空间都进行寻优,以选择分类效果最好的核函数及参数。

4 选线方法构建流程

小波包变换结合SVM选线步骤如下:

(1)以零序电流突然增大的时刻为故障点,记录故障点前一个周期和后两个周期的零序电流。

(2)改变故障参数,得到不同故障工况下的各线路零序电流,利用小波包从中提取特征频带能量和模极大值以及故障线路标号作为训练集。

(3)利用K-CV和训练集对SVM寻优,得到最优参数下的SVM。

(4)将测试样本输入SVM分类器,验证选线效果。

5 算例分析

5.1 样本获取

笔者从幅值和极性两个角度出发,利用小波包变换提取故障后配电网系统各线路在特征频带上的能量和模极大值构成特征向量。并采用上文所述仿真模型,通过改变故障参数获取数据集。以线路1为例,改变其接地电阻,依次取1、10、100、200、500、800、1 000 Ω共7种接地电阻阻值;故障初始角取0°、15°、30°、45°、60°、75°、90°共7种不同的角度;设D=故障点距母线距离/线路总长,D取0.1、0.3、0.5、0.7、0.9等5种不同的值。则线路1发生单相接地故障时,可获得7×7×5=245组样本。笔者所搭建模型共有4条出线,对每条出线依次设置故障,可得到4×7×7×5=980组样本。样本格式为(xi,yi),i=1,2,…,980。其中,xi=[Ei,Mi],代表在第i个样本中设置的故障参数下,4条出线系统的能量特征和模极大值;yi∈{1,2,3,4},代表第i个样本中的故障线路。按照上述获取样本的流程,在原有980组样本的基础上,针对高阻接地故障,创建400组样本,加入原有样本,构成训练集,共计1 380组。

5.2 双空间参数寻优

笔者以Scikit-learn 0.20为平台,构造高斯核函数SVM二维参数空间、线性核函数一维参数空间,结合K折交叉验证进行双空间参数寻优。流程如下:

(1)定义高斯核函数SVM和线性核函数SVM模型,并设置“一对一”分类方式,选取交叉验证折数,取K=10。

(2)设置两类SVM的搜索空间,对于高斯核函数SVM的Cγ,按1×10-5~1×105指数增长型方式取值,并进行两两组合,构造网格;对于线性核函数SVM,只需对C设置搜索范围,取1~1 500的线性空间。

(3)统计各参数组合下10折交叉验证准确率,以此为标准确定最优参数。

在双空间中,不同参数对应的准确度如图9和图10所示。

图9 二维空间寻优

Figue 9 Optimization in 2-D space

图10 一维空间寻优

Figue 10 Optimization in 1-D space

采用高斯核函数的二维(C,γ)空间内,在最优参数组合下,交叉验证后的准确率达到96.96%,对应参数:C=1×105γ=0.01;线性核函数的一维(C)空间内,在最优惩罚系数下,交叉验证后的准确率达到99.06%,对应参数:C=1 348。对于发生在不同故障参数下单相接地故障时的各线路零序电流,小波包变换所提取的零序电流暂态特征具有较好的线性可分性质,不需映射至高维空间。因此线性SVM在以此类暂态特征为对象时,寻优过程中表现出较高的准确率。同时,在最优参数组合下,虽然高斯核函数SVM的准确率略低于线性SVM,但高斯核函数SVM在面对线性不可分数据时性能更优,例如变压器故障诊断、负荷预测等,且在文中的故障选线问题中也有较高的准确率,因此高斯核函数SVM仍具有被广泛地应用于电气领域的潜力。

5.3 批量测试

按照5.1节的故障参数设置方法,接地电阻依次取5、50、300、700、1 100 Ω共5种接地电阻阻值;故障初始角取10°、40°、70°等3种不同的角度;D取0.2、0.4、0.6、0.8等4种不同的值。4条出线依次设置故障并进行小波包变换。共得到4×5×3×4=240组样本测试集。采用惩罚系数为1 348的线性核函数支持向量机(SVM)、朴素贝叶斯(NB)、决策树(DT)、随机森林(RF)4种分类器。以Scikit-learn 0.20为平台,基于上述训练集训练后,在该测试集上的准确率如图11所示。

图11 各分类器准确率

Figue 11 Accuracy of each classifier

由图11可看出,在该测试集上,经过改进网格寻优的SVM准确率大于其余几种分类器。

5.4 随机测试

由于在实际工程中,接地故障发生位置、初始相角、接地电阻阻值均有一定的随机性,使用随机函数产生多个区间为(0,1)的随机数,并用不同随机数与线路总长、90°、1 200 Ω相乘,以此模拟随机故障。将随机接地电阻Rg、故障点距母线距离L初始相角α及预测结果总结如表1所示。

表1 随机测试结果

Table 1 Results of random test

线路Rg/ΩL/kmαe1e2e3e4m1m2m3m4输出L1L2L3L4786.8814.3537.95°0.0560.0120.0050.003-0.0460.0210.0140.01111120.792.1386.35°0.9290.2110.0750.0520.280-0.135-0.079-0.0651332.3013.5758.99°0.1520.6680.0570.0350.093-0.1890.0550.0422988.157.842.86°0.1320.5780.0470.0310.106-0.2210.0630.0522224.2520.8439.48°0.1440.1010.7890.0350.0690.058-0.1620.0363775.571.0371.57°0.3630.2371.9070.082-0.168-0.1360.384-0.07831151.6928.3758.95°0.0050.0040.0020.0330.0170.0140.010-0.0414268.5727.1944.85°0.0740.0520.0290.455-0.0520.0440.034-0.1294

表1中最后一列代表分类器输出的结果,可以看出,在随机故障中,SVM得到了正确的分类结果。

5.5 高阻接地测试

针对线路末端发生高阻接地时,以小波模极大值为判据导致选线失效的问题,模拟高阻接地故障,提取特征向量后输入经寻优后的SVM分类器,将SVM分类器输出和各线路模极大值总结如表2所示。

表2 分类器输出和模极大值

Table 2 Outputs of classifier and maximum modulus

线路L/kmRg/Ωm1m2m3m4输出L215.611500.0210.082-0.025-0.0372L217.212500.059-0.034-0.023-0.0682L323.412500.0750.0350.033-0.0923L431.212500.0580.024-0.032-0.0504

由表2可看出,依据模极大值的极性,无法正确地进行故障选线。而经过训练的SVM可识别出故障线路。

6 结论

(1)配电网发生单相高阻接地故障后,若故障特征不明显,则无法依据各线路模极大值极性进行故障选线,而经训练后的SVM可识别出故障线路。

(2)对于不同故障工况下经小波包变换提取的故障暂态特征,线性核函数SVM和高斯核函数SVM在惩罚系数较大时取得了较高的准确率,且高于其余经典机器学习分类器,但相比高斯核函数SVM,线性核函数SVM能更准确地依据暂态特征进行故障选线。

(3)将故障选线转化为多分类问题具有可行性。实际工程中,可依据历史故障数据创建数据集,将支持向量机运用在故障选线领域,提高配电网自动化的程度。

参考文献:

[1] 高志鹏,张慧芬,孙旭娜.注入半波直流的小电流接地故障选线定位方法[J].电力系统保护与控制, 2013, 41(13):139-145.

[2] 徐鹏,王钢,李海锋,等.基于环流量的同杆四回输电线路故障选线[J].电力系统保护与控制, 2011, 39(3):78-83.

[3] 陈奎,陈博博.基于改进暂态相关分析和支持向量机的电弧故障选线研究[J].电力系统保护与控制, 2016, 44(24):66-73.

[4] 魏臻珠,蒋建东,陈帆,等.小电流接地系统故障选线的暂态零序电流变化率方法[J].郑州大学学报(工学版), 2012, 33(1):106-108.

[5] 高杰,程启明,程尹曼,等.基于量子遗传双稳态系统的配电网故障选线方法[J].电力自动化设备, 2018, 38(5):164-170.

[6] 邵翔,郭谋发,游林旭.基于改进DTW的接地故障波形互相关度聚类选线方法[J].电力自动化设备, 2018, 38(11):63-71.

[7] 汤涛,黄纯,江亚群,等.基于高低频段暂态信号相关分析的谐振接地故障选线方法[J].电力系统自动化, 2016, 40(16):105-111.

[8] 宋金钊,李永丽,石峥,等.一种新的谐振接地系统单相接地故障选线方法[J].电力系统保护与控制, 2017, 45(6):9-15.

[9] 黄景光,刘会家,胡汉梅,等.行波小波系数极大值极性法接地故障选线研究[J].高电压技术, 2006,32(8):100-104.

[10] 吴乐鹏,黄纯,林达斌,等.基于暂态小波能量的小电流接地故障选线新方法[J].电力自动化设备, 2013, 33(5):70-75.

[11] 刘渝根,王建南,马晋佩,等.结合小波包变换和5次谐波法的谐振接地系统综合故障选线方法[J].高电压技术, 2015, 41(5):1519-1525.

[12] 王守鹏,赵冬梅.电网故障诊断的研究综述与前景展望[J].电力系统自动化, 2017, 41(19):164-175.

[13] 王耀南,霍百林,王辉,等.基于小波包的小电流接地系统故障选线的新判据[J].中国电机工程学报, 2004, 24(6):54-58.

[14] 逯鹏,牛新,刘素杰,等.运动准备电位单次检测技术研究[J].郑州大学学报(工学版), 2018, 39(4):70-74.

Fault Line Selection Based on Wavelet Packet Transform and Support Vector Machine

GAO Jinfeng1, QIN Yurui1, YIN Hongde2

(1.School of Electrical Engineering, Zhengzhou University, Zhengzhou 450001, China; 2.Pingdingshan Power Supply Company, State Grid Company, Pingdingshan 467000, China)

Abstract: When single-phase grounding fault occured in distribution network, the non-power frequency components of zero-sequence current between fault line and normal line were obviously different.In order to solve the problem that the success rate of line selection is not high when the modulus maxima polarity was used as criterion in high resistance grounding, a method of line selection based on zero sequence current non-power frequency component and support vector machine was presented in this paper.This method decomposed the zero sequence current of each line by wavelet packet transform, and chose the characteristic frequency band according to the principle of maximum energy.It took the energy and modulus maxima of different lines in the characteristic frequency band as the characteristic vector, and took the fault line label as the classification target, transformed the fault line selection into multi-classification, and used support vector machine to predict the fault line.A large number of training samples were obtained through simulation.K-fold cross-validation and grid search were used to optimize the parameters of support vector machine.The results on the test dataset showed that the method was accurate and reliable.The correct line selection could be achieved at different grounding distances, grounding resistances and initial phase angles of faults.

Key words: fault line selection; wavelet packet transform; multi-classification; support vector machine

中图分类号:TU582.1

文献标志码:A

doi:10.13705.j.issn.1671-6833.2020.01.003

收稿日期: 2019-06-28;修订日期:2019-10-21

基金项目:国家自然科学基金资助项目(51307152);河南省科技攻关项目(182102210004)

作者简介:高金峰(1963—)男,河南郑州人,郑州大学教授,博士,主要从事非线性理论研究,E-mail:jfgao@zzu.edu.cn。

文章编号:1671-6833.2020.01-0063-07