基于区间样本和回声状态网络的风电功率不确定性预测

孙晓燕,时良振,徐瑞东,张 勇

(中国矿业大学 信息与电气工程学院,江苏 徐州 221116)

摘 要:风电功率预测对并网运行的稳定性控制、市场经济调度等具有重要意义.但受风力波动性等影响,风电功率具有极大的不确定性,如何在功率预测中有效反映该不确定性对提高预测可靠性至关重要.针对当前大多采用点预测方法存在的不足,提出一种量化不确定性的区间预测模型.基于区间相似准则和相似日理论,首先给出反映风电功率不确定性的区间样本选择策略;针对选择的时序区间样本,给出基于回声状态网络的区间预测方法;最后利用区间覆盖率、区间平均宽度等指标评价预测结果.实验结果表明了所提方法的有效性.

关键词:风电功率预测;不确定性; 区间样本; 回声状态网络

0 引言

清洁、成本低廉的风能一直是新能源中应用广泛、极具开发前景的可再生能源.然而,由于风能的随机性、间歇性、波动性等特点,风力发电具有很强的不确定性,大规模的风电并网将会对电力系统的稳定性、电能质量及动态经济调度等造成极大的影响[1],给风能的有效利用带来了严峻的挑战.对风电功率进行准确、可靠的预测是解决上述问题可行和有效的方法之一[2].在不同时间尺度的风电功率预测中,短期与超短期预测对优化旋转备用容量、机组组合、经济调度等具有重要作用,进行短期或超短期风电功率预测更具管理和经济价值.与长期和中长期风电功率预测相比,短期与超短期预测要求更高的精度和可靠性,且针对风电功率的不确定性,进行可靠有效的短期预测成为亟待解决的问题.

目前风电功率短期预测方法主要有物理方法和统计机器学习方法.物理方法主要基于数值天气预报和风机周围的物理、地理信息计算风电机组轮毂高度的风速风向等信息,再依据风速-功率曲线预测风电功率.物理方法因可对每个大气过程进行分析并根据分析结果优化预测模型,因此预测精度较高.但物理方法一般需要建立大气或风速模型,过程较复杂,难以适应大规模风场的应用,且其对初始风场信息非常敏感,较难适应风电输出功率的不确定特性[3].统计机器学习方法一般是建立天气信息与风电输出功率历史序列之间的关系模型,再基于未来时间段的数值天气预报信息预测风电功率[4].常用的方法主要有卡尔曼滤波、神经网络和支持向量机[5]等,其中以神经网络及其混合方法的应用最为广泛[6-7].与物理方法相比,统计机器学习方法无需对大气运动、风速信息进行细致刻画,在数据充分时可使预测误差尽量达到最小,实现较准确的预测.

然而,上述研究较少考虑风电输出功率的不确定性.针对风电功率预测的不确定性,有学者提出了区间预测方法,即给出风电输出功率可能的变化范围.文献[8]基于模糊区间对微网系统中的可再生能源及用电负荷进行预测,为电网系统的经济调度提供了可靠参考.文献[9]提出了基于神经网络的区间上下限预测模型对风电功率时序序列进行预测,并利用粒子群优化算法(PSO)确定神经网络权值.文献[10-11]利用极限学习机将风电功率历史数据作为网络输入,实现了对风电功率区间上下限的预测.

相对于在风电功率预测中广泛应用的前馈神经网络,回声状态网络(echo state network, ESN)的训练过程简便迅速,在时序预测中已得到广泛关注和应用[12],但在风电功率预测中的应用却较少.Ronaldo等[13]利用历史功率数据作为回声状态网络的输入,训练多个网络分别预测各子时间段的功率输出,但该研究没有考虑输出功率的不确定性.若能从大量的风电功率历史数据中找出输出功率在对应时刻点上的变化区间,利用该区间作为预测模型的训练样本,并结合预测时段的风速、温度等气象信息,则既在训练过程中直接体现功率变化的不确定性,又为决策者提供了更有实际意义的预测区间.鉴于此,笔者研究基于回声状态网络对风电功率不确定性区间预测.

风电功率预测的实质是对时序数据的回归,当考虑预测模型输入为区间时,则问题转化为对区间时序数据的拟合,此时面临如下关键问题:① 基于历史数据的风电输出功率区间时序数据的获取;② 用于处理区间时序数据的神经网络模型的选择和设计;③ 区间预测模型的衡量指标.

本文组织结构如下:第1节给出基于相似日理论的区间时序数据的获取;基于回声状态网络的风电输出功率区间预测模型将在第2节提出;第3节详细说明算法在实际系统中的应用;第4节给出结论.

1 风电功率预测区间时序数据的获取

本节给出以区间形式反映风电功率不确定性的样本选择方法,采用相似日理论,考虑季节相似性、天气相似性及风速相似性,给出含不确定性的区间样本选择机制.

1.1 相似日的定义

设拟进行风电功率预测的时段为MiDm日的(tk,tk+t)时段,则与之相关的相似日定义如下:

1) 季节相似性S1:由气象知识可知,越临近预测日Dm,其季节相似性越大,因此以Dm为起点,分别向两侧顺向和逆向取相似日,共计m2天.

2) 天气相似性S2:在季节相似性确定的m2天内,进一步考虑具体天气状况的相似性.以温度和气压为例,设预测当天预报温度气压其中分别为温度和气压的上下限.为找到与上述温度和气压变化区间相似的日期,这里利用式(1)定义的比较区间数大小的μ[14]指标衡量区间的相似性.

μ(A,B)=

(1)

其中则两区间数的大小关系为:

(2)

由式(2)可知值越小,区间AB的共同元素越多,即AB的相似度越高,反之亦然.由此分别计算剔除与预测时段温度、气压等变化区间差异较大(即的相似日,则剩余相似日个数记为m1(m1m2).

(3) 风速相似性S3:设预测时段(tk,tk+t)风速的变化范围为基于上述季节和天气相似性共得到的m1个相似日记为d1,d2,…,dm1,第日(tk,tk+t)时段内风速变化范围为利用式(1)计算μ(v,vj),剔除与预测时段风速变化区间差异较大(即的相似日,则剩余相似日个数记为m(mm1),从而得到m个相似风速区间.

1.2 含区间不确定性的样本选择

考虑风速的时序性和突变性,给出如下含区间不确定性的时序样本选择方法.

首先考虑时序特性,设预测时段(tk,tk+t)前H小时共记录风电输出功率时序样本C组,记为}.其中,X(i)为i时刻影响风电输出功率的主要影响因素,这里考虑风速v(i)、温度T(i)和桨距角w(i)[15],P(i)为上述因素对应的风电输出功率.不失一般性,记tk时刻的样本为(X(tk),P(tk)),设待预测时段(tk,tk+t)前H小时内,按时序点(tk-h,tk-h+1,…,tk-2,tk-1)共记录h组风电数据,将h组原始样本按时间间隔Δt平均分成g1组,每组含有个原始时序样本,如l=3时(X(tk-h),表示输出功率的影响因素,P代表输出功率值.由于短时间Δt内风速、温度等变化较小,因此这里可对S(i)中的影响因素X(i,j)进行加权平均,则处理后的影响因素X(i)为:

(3)

接着选出每一分组中的最大、最小功率值作为每个Δt时间段内各影响因素所对应的输出功率的上下限:

(4)

由式(3)和式(4)可获得如式(5)所示含有不确定性的区间时序样本:

(5)

其含义是:当i时刻影响因素值约为X(i)时,风电输出功率变化范围为这反映了当影响因素不确定时风电功率可能的变化范围,特别是待预测时段风速、温度等不能精确可知时,利用该不确定性具有较高的可信度.

当风速突变时,预测时段(tk,tk+t)前H小时的数据样本显然不能完全刻画(tk,tk+t)时间段内的数据变化信息,即前H小时的风速变化范围可能与(tk,tk+t)的预报风速变化范围相差较大.下面进一步考虑风速的突变性,丰富并获取上述含不确定性的区间时序样本.首先利用上一节中的风速相似性选择方法,选取相似日dj天(不含待预测日)中时段(tk,tk+t)记录的风电输出功率时序样本共t组,按时序点(tk,tk+1,...,tk+t-1)排列,按照处理前H小时数据样本得到新时序样本的方法,共可得到g2组新样本.由于m个相似日中共有m个相似风速区间,则共有m·g2组相似风速区间的样本.综合(tk,tk+t)前H小时与m个相似风速区间的样本,共可获得组新时序样本.

2 基于回声状态网络的风电功率不确定性区间预测

2.1 算法框架

算法框架如图1所示,包括样本选择、模型构建和性能评价.其中,样本选择采用第1节所述方法.以下给出基于回声状态网络的风电输出功率不确定性的区间预测模型的设计.

图1 基于回声状态网络的风电功率区间预测模型
Fig.1 Flowchart of interval prediction for wind power based on echo state network

图1“模型构建”部分给出了笔者所提区间预测的策略,具体包括网络输入输出节点的确定和网络连接权值的训练.

首先确定输入输出节点,由前面的分析可知,训练模型的输入为风速v、温度T和桨距角w[15],输出为功率P.其中训练样本中风速、温度、桨距角记为v(i)、T(i)、w(i),预测样本中3者分别为v(t)、T(t)、w(t).因预测时段的风速v(t)和温度T(t)可由预报信息获得,而桨距角w(t)却未知.为此这里采用BP神经网络对w(t)进行估计,在预测风电功率时直接调用该网络,利用BP网络估计值作为预测时段的桨距角输入信息.w(t)的估计可利用新时序样本集TN进行训练,BP网络输入为v(i),输出为w(i).

由于回声状态网络的输出结果为区间数].为尽可能减少回声状态网络对区间拟合的干扰,这里分别利用训练两个回声状态网络,分别拟合功率的上下限.以预测为例,回声状态网络的具体结构如图2所示.预测类似,不再赘述.

图2 预测区间下限的ESN结构
Fig.2 ESN model for lower bound of prediction interval generation

回声状态网络的网络连结权由3大部分组成,分别为输入层至储备池之间的Win,储备池各神经元之间的连结权W,储备池和输出层之间的连结权Wout及输出反馈矩阵Wback.

t时刻ESN网络的输入、储备池内部状态和输出向量分别为u(t)、x(t)、y(t),则该网络各状态的变化为[15]:

,

(6)

式中表示输出偏置项或代表噪声;f(·)、fout(·)分别表示储备池内部单元的激励函数和输出节点的激励函数,在实际运用中一般将f(·)设为双曲正切函数,fout(·)取线性函数或符号函数.

利用回声状态网络进行时序预测需确定储备池大小和输出连接权值矩阵.储备池参数包括储备池内部神经元之间连结权的谱半径(spectral radius, SR)、储备池内部神经元数N、输入单元尺度(input scaling,IS)和储备池稀疏度(sparse degree, SD)[16],具体参数设置在仿真实验中给出.

连接权值矩阵Wout的确定本质上可看作是线性回归问题的求解,其优化求解方法众多,如粒子群算法、烟花算法[17]等.笔者采用文献[18]递归最小二乘(recursive least-squares,RLS)作为确定ESN输出权值矩阵的策略,这里不再赘述.

2.2 预测结果评价指标

区间预测的结果主要从预测可靠性和区间宽度两个方面考虑,设检验样本共有n组.引入区间覆盖率(prediction interval coverage probability, PICP)表示预测区间的可靠性,定义为:

(7)

式中:Pd为功率期望值分别为功率预测值的上、下限.显然,PICP值越接近于1,拟合区间覆盖率越高.

平均宽度(mean prediction interval width, MPIW)定义为:

(8)

平均宽度越小,预测区间不确定性越小,实用价值越大.

3 仿真实验

为验证笔者所提方法的有效性,以某公开风电数据集中2013年风电功率历史时序数据进行实验.其中,风机的切入和额定风速分别为4 m/s和12 m/s,机组额定功率1 500 kW.数据记录时间间隔为5 min,选取3~4月份的实际记录数据共61×24×12=17 568组数据,每组数据记录的信息有风速、风向、温度、桨距角和风电输出功率.与已有风电功率预测算法相比,本文算法主要研究含不确定性的区间样本的选择以及基于所选样本和回声状态网络的输出功率区间预测模型的构建,分3组实验说明上述方法的性能:①参数对模型性能的影响;②在不同风速区间条件下,将笔者所提方法与其他方法作对比;③检验不同预测时长下所建模型的预测性能,说明笔者所提模型的鲁棒性.其中,前两组实验预测时长为6 h,即预测时段(tk,tk+6)/h的风电功率.回声状态网络参数通过交叉检验设置:K=3,N=100,L=1,谱半径SR=0.8,输入单元尺度IS=[0.2;0.5;0.1],递归最小二乘法(RLS)的遗忘因子λ=0.999 995,调整参数γ=10-6.所有实验均在MATLAB7.0环境下通过编程实现,计算机处理器2.8 GHz,运行内存2 GB.

3.1 参数对模型性能的影响

3.1.1 相似指标对预测结果的影响

首先基于传统的点预测,依次将每个相似风速区间内的样本(不含预测时段前H小时的样本)作为模型输入进行预测,以均方根误差为评价指标,观察相似度μ(v,vj)的不同取值对输出功率预测精度的影响,结果如图3所示.

图3 相似风速区间指标μ(v,vj)与预测精度的关系
Fig.3 Relationship between the similar wind speed interval indicator μ(v,vj) and the forecast accuracy

由图3可以看出,随着μ(v,vj)的不断增大,预测误差逐渐增大,即相似风速区间与预测时段风速区间的相似度越大(μ(v,vj)越小),预测精度越高.由此可见,以μ指标判断相似时段风速区间的相似性大小进行样本选择是合理的.

相似风速区间个数m直接影响样本数量,将m个风速区间按相似度从大到小,逐次增大m的取值,即增加样本数量,观察比较不同m取值下点预测均方根误差的变化,结果如图4所示.

图4 相似风速区间个数m对预测精度的影响
Fig.4 Effect of the number of similar wind speed intervalsmon the prediction accuracy

由图4可知,随着m的增大,预测精度变化不大,其主要原因是按相似度从大到小排列的风速区间,相似度较大的区间包含的样本信息已基本可反映预测时段内影响因素的变化,过多地引入相似度较低的样本本质上已难以提高预测精度.为保证样本的信息量同时避免引入过多的冗余样本,这里m取2.

3.1.2 H值对预测结果的影响

首先以2个相似度最高的风速区间内的数据作为历史输入样本,逐渐改变H的大小,观察比较不同H取值下基于点预测的均方根误差变化,结果如图5所示.

图5 预测时段前H小时的样本对预测精度的影响
Fig.5 The influence on the prediction accuracy of the sample of H hours of the forecast period

由图5可知,随着H值的不断增大,预测误差在一定范围内波动,可见在引入相似风速区间样本的基础上,预测时段(tk,tk+6)/hH小时的数据样本对提高预测模型的准确性作用不明显,但从丰富样本信息方面考虑,适当引入前H小时的样本数据可提供较多的不确定信息,综合考虑,H设为6.

3.2 算法有效性

3.2.1 与已有算法比较

针对不同风速区间,将笔者所提算法与广泛应用的BP神经网络、广义回归神经网络(general regression neural network, GRNN)和径向基网络(radial basis function, RBF)进行比较.各算法在不同风速区间的预测性能如表1所示.

由表1可以看出,在相同的训练样本和测试样本条件下,4种方法对不同风速区间的预测结果有共同的趋势:随着风速的不断增大,预测区间的平均宽度逐渐增大,说明大风速区间对功率输出产生更大的不确定性影响.在保证预测区间满足一定可靠性的基础上(PICP>90%),与RBF方法相比,ESN具有较小的区间宽度,因此具有更高的可靠性和实用价值.

3.2.2 不同预测时长下模型的预测结果

为进一步说明笔者所建模型的鲁棒性,考虑不同时长短期风电功率的预测性能,结果如表2所示.

表1 不同方法对风电功率预测的结果
Tab.1 Results of different methods for wind power prediction

风速区间/(m·s-1)方法PICP/%MPIW/%3.40~11.87ESN91.6712.64BP84.7211.47GRNN87.5017.41RBF90.2813.894.30~12.74ESN91.6720.15BP86.1121.28GRNN76.3920.77RBF91.6727.706.94~14.53ESN91.6720.92BP83.3320.03GRNN80.5621.50RBF87.5019.658.31~12.21ESN94.4422.68BP95.8321.85GRNN86.1127.06RBF88.8923.23

表2 不同预测时长的预测结果
Table.2 Prediction results of different forecasting time scales of the proposed model

预测时长/h参数lPICP/%MPIW/%12387.5013.44490.2818.4924381.2512.48484.7217.34

图6和图7为表2中预测时长12 h的预测区间结果,预测时长24 h的结果与之类似,这里不再赘述.图中实线表示输出功率预测区间的上下限,圆圈为测试样本的真实输出功率.

从表2及图6~7中可以看出,预测区间基本覆盖了真实值,较传统的点预测能更好地量化预测的不确定性.

图6 l=3, 预测时长12 h
Fig.6 Prediction interval of 12 hours with l=3

图7 l=4, 预测时长12 h
Fig.7 Prediction interval of 12 hours with l=4

4 结论

针对目前风电功率预测大都基于点预测或在点预测的基础上进行误差分布的研究,笔者提出了一种基于新的区间样本和回声状态网络的风电功率不确定性区间预测模型,给出了一种基于相似日的含不确定性的区间样本选择策略,根据各影响因素选择预测时段前H小时和相似风速区间的样本.基于回声状态网络构建区间预测模型,计算风电输出功率的上下限;最后通过仿真实验验证了所提方法的有效性.结果表明,预测区间不仅能描述预测时段内风电功率的波动范围,而且可靠性较高的预测区间有利于经济调度,降低系统运行的风险.相比于传统的神经网络,ESN模型计算量小、训练速度快,利用ESN的在线学习算法能有效提高模型输出的稳定性,使预测区间具有更好的性能.

参考文献:

[1] 薛禹胜, 雷兴, 薛峰, 等.关于风电不确定性对电力系统影响的评述[J]. 中国电机工程学报, 2014, 34(29): 5029-5040.

[2] 薛禹胜, 郁琛, 赵俊华, 等. 关于短期及超短期风电功率预测的评述[J]. 电力系统自动化, 2015, 39(6): 141-150.

[3] 冯双磊, 王伟胜, 刘纯, 等. 风电场功率预测物理方法研究[J]. 中国电机工程学报, 2010, 30(2): 1-6.

[4] FOLEY A M, LEAHY P G, MARVUGLIA A, et al. Current methods and advances in forecasting of wind power generation[J]. Renewable energy, 2012, 37(1): 1-8.

[5] 徐敏, 袁建洲, 刘四新, 等. 基于改进粒子群优化算法的短期风电功率预测[J].郑州大学学报(工学版), 2012, 33(6): 32-35.

[6] CHITSAZ H, AMJADY N, ZAREIPOUR H. Wind power forecast using wavelet neural network trained byimproved clonal selection algorithm[J]. Energy conversion and management, 2015, 89: 588-598.

[7] HUANG D Z, GONG R X, GONG S. Prediction of wind power by chaos and BP artificial neural networks approach based on genetic algorithm[J]. Journal of electrical engineering & technology, 2015, 10(1): 41-46.

[8] SAEZ D, AVILA F, OLIVARES D, et al. Fuzzy prediction interval models for forecasting renewable resources and loads in microgrids[J]. IEEE transactions on smart grid, 2015, 6(2): 548-556.

[9] HAO D, SRINIVASAN D, KHOSRAVI A. Short-term load and wind power forecasting using neural network-based prediction intervals[J]. IEEE trainsactions on neural networks and learning systems, 2014, 25(2): 303-315.

[10]WAN C, XU Z, PINSON P, et al. Probabilistic forecasting of wind power generation using extreme learning machine[J]. IEEE transactions on power systems, 2014, 29(3): 1033-1044.

[11]章国勇, 伍永刚, 张洋, 等. 一种风电功率混沌时间序列概率区间简易预测模型[J]. 物理学报, 2014, 63(13):430-438.

[12]罗熊, 黎江, 孙增圻. 回声状态网络的研究进展[J]. 北京科技大学学报, 2012, 34(2): 217-222.

[13]RONALDO R B, OTONI N N, RAMON B, et al. Investigating the use of echo state networks for prediction of wind power generation[C]∥Computational intelligence for engineering solutions (CIES). Orlando:IEEE, 2014:148-154.

[14]ALOLYANI. Algorithm for interval linear programming involving interval constraints[C]∥World congress on engineering and computer science (WCECS). Francisco: CA, 2013: 145-149.

[15]范高锋, 王伟胜, 刘纯, 等. 基于人工神经网络的风电功率预测[J]. 中国电机工程学报, 2008, 28(34): 118-123.

[16]MACIEL L, GOMIDE F, SANTOSD, et al. Exchange rate forecasting using echo state networks for trading strategies[C]∥ IEEE conference on computational intelligence for financial engineering and economics (CIFEr). London, England:IEEE, 2014: 40-47.

[17]王杰, 苌群康, 彭金柱. 极限学习机优化及其拟合性分析[J]. 郑州大学学报(工学版), 2016, 37(2):20-24.

[18]ZHANG L, SUGANTHAN P N. A survey of randomized algorithms for training neural networks[J]. Information sciences, 2016,364:146-155.

Forecast of wind power generation with uncertainty based on
interval sample and echo state network

SUN Xiaoyan, SHI Liangzhen, XU Ruidong, ZHANG Yong

(School of Information and Electrical Engineering, China University of Mining and Technology, Xuzhou 221116, China)

Abstract:The wind power forecasting was essential to the stability control of the grid connected operation, the economical dispatch, and so on. However, due to the variety of nature of wind, wind power had great uncertainties. Effectively expressing the uncertainties in wind power forecasting is crucial for improving the reliability of the forecast. Most existing methods focued on point forecasting, which can hardly quantify the uncertainties. To overcome the weekness, this paper proposed a novel interval-based forecasting model to quantify the uncertainties. A new interval sample selection method was firstly presented to reflect the uncertainties of wind power based on similar days and interval similar metric. Secondly, the echo state network were designed to predict the interval-based wind power in a short time due to its merits in time series predictions. The outstanding stability of the forecasting model was guaranteed by employing the recursive least squares algorithm to adjust the output weights of the echo state network. The prediction interval coverage probability (PICP) and mean prediction interval width (MPIW) were applied to evaluate the performance of our interval forecast on wind power. The experiments empirically demonstrated the feasibility and effectiveness of the proposed algorithm.

Key words:wind power forecasting; uncertainty; interval sample; echo state network

文章编号:1671-6833(2017)01-0056-07

收稿日期:2016-10-12;

修订日期:2016-12-03

基金项目:国家自然科学基金资助项目(61473298);江苏省六大人才高峰资助项目(ZNDW-004)

作者简介:孙晓燕(1978— ),女,江苏丰县人,中国矿业大学教授,博士,主要从事智能优化与计算,个性化信息处理和智能电网研究,E-mail:xysun78@126.com.

中图分类号:TM614

文献标志码:A

doi:10.13705/j.issn.1671-6833.2017.01.003