img

官方微信

高级检索

中国沙漠, 2021, 41(2): 38-50 doi: 10.7522/j.issn.1000-694X.2020.00124

小波包分解与多个机器学习模型耦合在风速预报中的对比

王同亮,1,3, 马绍休,1, 高扬1,3, 宫毓来1,3, 安志山2

1.中国科学院西北生态环境资源研究院,沙漠与沙漠化重点实验室,甘肃 兰州 730000

2.中国科学院西北生态环境资源研究院,公共技术服务中心,甘肃 兰州 730000

3.中国科学院大学,北京 100049

The hybrid of wavelet packet decomposition and machine learning models in wind speed forecasting

Wang Tongliang,1,3, Ma Shaoxiu,1, Gao Yang1,3, Gong Yulai1,3, An Zhishan2

1.Key Laboratory of Desert and Desertification /, Northwest Institute of Eco-Environment and Resources,Chinese Academy of Sciences,Lanzhou 730000,China

2.Public Technical Service Center, Northwest Institute of Eco-Environment and Resources,Chinese Academy of Sciences,Lanzhou 730000,China

3.University of Chinese Academy of Sciences,Beijing 100049,China

通讯作者: 马绍休(E-mail: shaoxiuma586@163.com

收稿日期: 2020-10-08   修回日期: 2020-12-04   网络出版日期: 2021-03-26

基金资助: 中国科学院“百人计划”项目.  Y729G01001
国家重点研发计划项目.  2017YFE0119100

Received: 2020-10-08   Revised: 2020-12-04   Online: 2021-03-26

作者简介 About authors

王同亮(1995—),男,河南驻马店人,硕士研究生,主要从事深度学习模型在风速预报中应用的研究E-mail:wangtongliang@nieer.ac.cn , E-mail:wangtongliang@nieer.ac.cn

摘要

准确预报风速是提高风电利用率以及电力系统稳定性的有效方法。学者们提出了大量风速预报模型,但针对不同下垫面不同风速预报模型的对比研究较少。该研究主要探究小波包分解和12个机器学习模型耦合对3种下垫面(戈壁、绿洲和沙漠)风速预报能力,探索风速预报的优化耦合模型。设置3组模型实验进行对比:单一机器学习模型、小波包分解-机器学习混合模型和小波包分解-机器学习-卷积神经网络混合模型。结果表明:具有特征选择和记忆功能的深度学习模型(如卷积长短时记忆网络)以及极限学习机对风速具有较好的预报能力,小波包分解可以显著提高模型精度。小波包分解与卷积长短时记忆网络、卷积门控循环单元和极限学习机的耦合模型在风速预报中具有较好的表现。这表明信号分解和深度学习的耦合模型,能有效提高预报精度,值得推广。

关键词: 风速预报 ; 小波包分解 ; 深度学习模型 ; 干旱半干旱区 ; 耦合模型

Abstract

Wind speed forecasting is an effective method to improve wind power utilization and power system stability. Previous studies proposed a amount of wind speed forecast models, but there are few comparative studies on wind speed forecast models for different underlying land cover. This study mainly explores the ability of wavelet packet decomposition, 12 machine learning models and their coupled models to forecast the wind speed for three different underlying land cover and landforms (gobi, oasis and desert), and explores the optimized coupled model for wind speed forecast. Three sets of model experiments were set up for comparison in the article: single XXX model, WPD-XXX hybrid model and WPD-XXX-CNN hybrid model. We found that the deep learning models with feature selection, memory functions (such as convolutional long short-term memory networks) and extreme learning machine have better forecast capabilities for wind speed forecast. The wavelet packet decomposition significantly improves model accuracy. The coupled modesl of wavelet packet decomposition and convolutional long short-term memory network, convolutional gated recurrent unit network has better performance. This shows that the use of signal decomposition and the coupling of deep learning models can effectively improve the forecast accuracy of the models. It could be widely used in industry practices.

Keywords: wind speed forecast ; wavelet packet decomposition ; deep learning model ; arid and semi-arid area ; hybrid model

PDF (3172KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王同亮, 马绍休, 高扬, 宫毓来, 安志山. 小波包分解与多个机器学习模型耦合在风速预报中的对比. 中国沙漠[J], 2021, 41(2): 38-50 doi:10.7522/j.issn.1000-694X.2020.00124

Wang Tongliang, Ma Shaoxiu, Gao Yang, Gong Yulai, An Zhishan. The hybrid of wavelet packet decomposition and machine learning models in wind speed forecasting. Journal of Desert Research[J], 2021, 41(2): 38-50 doi:10.7522/j.issn.1000-694X.2020.00124

0 引言

随着能源需求的增加,清洁且丰富的风能得到广泛关注1。但是风具有间歇性和变异性,导致风电呈现出不稳定性2。风电的不稳定性给风能管理和电力系统稳定运行提出了巨大挑战,这是造成风电并网困难、利用率低的主要原因之一3。风电规划和风电预测预报能有效减小这一问题影响4,准确的风速预报是提高风电利用率的最有效方式之一5

国内外学者提出了多种模型进行风速预测预报,主要分为物理模型和统计模型。物理模型基于物质、能量平衡和空气动力学机理,考虑温度、气压、地形等物理参数进行大空间、长时间风速预测,代表方法有数值天气预报等6。但物理过程复杂,物理模型所需参数多,且需要长期稳定的气象资料作为驱动数据7,不适用于风电场所需要的短期小区域风速预报8。统计模型主要使用历史风速,通过建立数据间的映射关系实现风速预报。统计模型原理简单,计算量小,适应范围广,具有强大的非线性映射、泛化和自我学习能力。统计模型包括自回归时间序列模型,支持向量机、人工神经网络、极限学习机、卷积神经网络、长短时记忆网络等机器及深度学习模型。这些方法已经被应用于风速预报9-14

但单独使用上述模型时预报精度并不理想,需要结合信号分解方法形成混合模型以提高预报精度15。信号分解方法包括小波分解(Wavelet Decomposition,WD)、小波包分解(Wavelet Packet Decomposition,WPD)、经验模式分解(Empirical Mode Decomposition,EMD)及其改进方法等16。小波分解可将复杂的原始信号分解为高频信号和低频信号,但该方法仅对信号低频部分详细分解,忽略了信号的高频部分,所以小波分解不适用于包含大量高频信息的信号(如风速)17;经验模式分解及其改进方法虽然计算简单,但数学解释不明确18,且有残余子信号(噪声);小波包分解数学解释明确,能够自行设定分解层数和分解使用的小波函数,已被广泛应用在风速预报中19-21

目前,大量研究通过改进已有模型1、应用新方法22以及耦合不同信号分解方法23等来提高模型预报精度。随着深度学习方法快速发展,在混合模型中加入深度学习模型进行风速预报的研究日益增多。但这些模型预报机理差异大,多种单一模型或与信号分解方法耦合形成的混合模型之间的差异性对比研究不足。

鉴于此,本研究通过对比多种统计模型以及这些模型与小波包分解耦合模型在预报3种下垫面风速的表现,探索较好的风速预报模型。研究结果可为不同下垫面风速预报模型的选择与优化提供参考,为风电场准确预报风速,保证稳定供电提供理论支持。

1 研究方法与数据

1.1 基础预报模型

基于最新文献研究,本研究选取广泛应用的12种机器学习和深度学习模型。

1.1.1 支持向量回归

支持向量回归属于支持向量机,主要应用于回归问题。其核心思想是寻找一条最佳拟合曲线,在容忍偏差范围内,曲线包含尽可能多的数据点。回归方程的数学描述为24

f(x)=wTφ(x)+b

式中:φ为非线性映射函数;w为权重;b为偏差。

支持向量回归的优化问题描述为24

minw,b,ξ,ξ* 12wTw+Ci=1n(ξi+ξi*)
s.t.yi-<w,xi>+bε+ξi<w,xi>+b-yiε+ξi*(i=1,2,,l)ξi,ξi*0

式中:l为样本数;xiyi分别为训练集的输入和输出数据;n为总样本数;ξξ*分别为训练误差上界和下界;ε为不敏感损失因子;C为正则常量。

支持向量回归的预报可以定义为24

fx,ai,ai*=i=1nai-ai*Kx,xi+b

式中:fx,ai,ai*)为预报值;a为拉格朗日乘数;a*为拉尔朗日乘数;Kx,xi)为核函数。

1.1.2 梯度提升回归

梯度提升回归是一种集成学习算法25,该算法基于分类回归树(Classification and regression tree, CART)和序列提升算法构建。算法目的是最小化损失函数,减小残差。为实现此目的,首先计算初始模型残差,在梯度下降方向使用残差拟合基础学习器,再使用拟合后的基础学习器更新模型,不断重复上述过程获得目标模型。

1.1.3 随机森林

随机森林也是一种基于分类回归树构建的集成学习算法,它基于装袋算法实现。随机森林在训练时,先从原始数据中有放回、平均地抽取多个子数据集,在子数据集上拟合分类回归树,最终结果由所有树结果的平均值决定,所有分类回归树构成随机森林模型。装袋算法和分类回归树构建过程中都存在随机性,可有效避免随机森林过拟合。

1.1.4 人工神经网络

人工神经网络受人类大脑结构启发得到,由一系列相互连接的神经元构成。网络内部不同神经元之间通过权重相连,神经元内设有激活函数和偏差。根据激活函数和学习算法的不同,人工神经网络可以分为不同类别。其数学描述为25

yi(n)=fj=1Nwij(n,n-1)yjn-1+θin

式中:i为第n层的神经元;wij为第n-1层神经元j和第n层神经元i之间的权重;θin为第n-t层神经元i的偏差。

1.1.5 极限学习机

极限学习机是一类包含单个隐藏层的前馈神经网络26,该算法的最大特点是保证学习精度的前提下训练速度更快。极限学习机在训练模型前,首先随机初始化输入权重和偏差,同时确定输出矩阵。不同于传统神经网络,极限学习机在迭代时不需要更新全部参数,仅通过输出矩阵求解相应方程组就能快速训练模型。其损失函数描述为27

E=j=1Ni=1Lβigwixj+bi-tj2

式中:N为输入神经元数量;L为隐藏层神经元数量;βi为隐藏层和输出层之间权重;g·为激活函数;wi为输入层和隐藏层之间权重;xj为输入数据;bi为偏差;tj为输出数据。

1.1.6 卷积神经网络

卷积神经网络能够提取数据特征,在处理时间序列数据方面有良好表现。相较于支持向量机和人工神经网络等浅层模型,卷积神经网络模型特有的卷积层可以实现自动特征选取,其全连接层处理有短期依赖的高频子集能力强28。卷积层内,各个神经元间无相互联系,只共享卷积核权重。相较于人工神经网络,该模型训练更有效。每个卷积层的数学描述为29

hijk=f((wkx)ij+bk)

式中:f为激活函数;wk为卷积核连接到第k个特征图的权重。

1.1.7 循环神经网络

循环神经网络是一种处理时间序列数据的方法,但传统循环神经网络训练过程中常出现梯度消失或梯度爆炸问题。为解决此问题,提出了长短时记忆网络30,该方法能有效处理长短期依赖问题。长短时记忆网络的核心组件为输入门、遗忘门和输出门。输入门决定细胞状态中存储的信息,遗忘门决定被遗忘的信息,输出门决定最终输出。单个神经元计算过程为:①输入数据,输入门激活,计算输入细胞信息;②如果遗忘门激活,遗忘部分细胞中保留的历史状态;③输出门激活,计算输出信息。神经元内计算过程可以描述为28

it=σ(wixxt+wimmt-1+wicct-1+bi)
ft=σ(wfxxt+wfmmt-1+wfcct-1+bf)
ct=f °ct-1+it°tanh(wcxxt+wcmmt-1+bc)
ot=σ(woxxt+wommt-1+wocct-1+bo)
mt=ot°tanh(ct)
yt=wymmt+by

式中:x=(x1x2x3,…,xT)为展开层数据;it为输入门;ft为遗忘门;ct为记忆细胞的激活矢量;ot为输出门;mt为每个记忆块的激活矢量;w为权重矩阵;b为偏差矢量;°为点积;σ和tanh为激活函数,激活函数数学描述为28

σ(x)=1/(1+e-x)
tanh(x)=(ex-e-x)/(ex+e-x)

在长短时记忆网络发展中出现了许多变种模型,如双向长短时记忆网络、门控循环单元等。其中,双向长短时记忆网络利用历史信息和未来信息进行预报,门控循环单元减少了门的数量,模型原理与长短时记忆网络相似。此外,还有堆叠式长短时记忆网络、卷积长短时记忆网络和卷积门控循环单元等模型。

1.2 小波包分解

小波包分解源于小波分解,它在分解信号低频子集同时,对高频子集继续分解。因此,该方法适用于分解含有大量高频信息的风速信号,以获取更加准确的信息。小波包分解使用时仅需要设置小波函数和分解层数。根据分解的信号类别,小波包分解可分为离散小波转换和连续小波转换。由于风速的连续性,本研究使用连续小波转换,数学描述为31

CWTa,b=1a-x(t)Ψ*t-badt

式中:xt)为原始信号;Ψ*为母小波函数;a为比例因子;b为转换参数;*为共轭复数;t为原始信号对应的时间点。

1.3 信号分解与基础预报模型耦合设计

根据已有文献,常用混合模型大多为信号分解方法和基础预报模型组成。由于信号分解子集各有特点,一些混合模型仅使用一种基础预报模型预报所有子集30,另一些模型针对不同频率子集使用不同模型进行预报28。本实验方案为:①选择应用广泛的机器学习和最新的深度学习模型共12个作为基础预报模型(简称单一XXX模型,表1),研究各种单一模型在风速预报中的表现;②小波包分解与12个基础预报模型耦合(简称WPD-XXX混合模型),探索小波包分解在提高模型预报精度中的作用;③小波包分解与12个基础预报模型和卷积神经网络(CNN)耦合(简称WPD-XXX-CNN混合模型),这里CNN用于预报小波包分解子集中的高频子集,而12个单一XXX模型用于预报低频子集。单一XXX模型作为对照组,WPD-XXX混合模型和WPD-XXX-CNN混合模型为实验组。单一XXX模型对照组中,使用12个基础预报模型直接预报风速;WPD-XXX实验组中,先将风速分解为低频和高频子集,再由XXX模型分别预报所有子集,最后将子集预报结果相加得出最终预报结果;WPD-XXX-CNN实验组中,利用卷积神经网络模型预报高频子集,XXX模型预报低频子集,最后将子集预报结果相加,得到最终结果。算法流程见图1

表1   基础预报模型

Table 1  The name of the basic forecast model

模型英文名称(缩写)
支持向量回归Support Vector Regression(SVR)
梯度提升回归Gradient Boosting Regression(GBR)
随机森林Random Forest(RF)
人工神经网络Artificial Neural Network(ANN)
极限学习机Extreme Learning Machine(ELM)
卷积神经网络Convolutional Neural Network(CNN)
长短时记忆网络Long Short-term Memory(LSTM)
堆叠式长短时记忆网络Stacked Long Short-term Memory(SLSTM)
双向长短时记忆网络Bidirectional Long Short-term Memory(BLSTM)
门控循环单元Gated Recurrent Unit(GRU)
卷积长短时记忆网络Convolutional Long Short-term Memory(CLSTM)
卷积门控循环单元Convolutional Gated Recurrent Unit(CGRU)

新窗口打开| 下载CSV


图1

图1   算法流程图(A为3种下垫面,B为3种模型结构,C为较好模型)

Fig.1   Algorithm flowchart (A indicates the dataset, B indicates three kinds of models, C indicates the optimized models)


1.4 数据应用和评价指标
1.4.1 原始数据与重构

数据源于中国西北地区3个野外试验观测点,下垫面分别为戈壁、绿洲和沙漠(表2)。风速时间序列见图2

表2   数据描述

Table 2  Data description

观测点时间范围时间分辨率/min高度/m
戈壁(40.5593°N、93.1117°E)2019年4月21日20:40—26日17:101010
绿洲(40.2581°N、94.7551°E)2018年12月1日21:20—6日17:501010
沙漠(40.0082°N、94.5940°E)2019年5月21日00:40—25日21:101010

新窗口打开| 下载CSV


图2

图2   3种下垫面风速时间序列

Fig.2   Wind speed time series


基于现有研究的数据组织方式32,本研究风速数据重构过程如图3。选择6个历史数据作为输入数据,数据重构时,每次选取7个数据为一组样本,平移1个位置选取下一组样本。因此,前后两组样本数据中有6个相同数据。最终得到694组样本数据,并以594∶100的比例划分为训练集和测试集。数据重构前进行最大最小值标准化,公式为:

x2=(x1-xmin)/(xmax-xmin)

式中:x1x2分别为标准化前和标准化后风速;xmaxxmin分别为标准化前最大和最小风速。

图3

图3   数据重构示意图

Fig.3   Schematic diagram of data reconstruction


1.4.2 精度指标

为了对比分析模型预报精度,本研究使用3种精度指标:平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、平均绝对误差(Mean Absolute Error, MAE)和均方根误差(Root Mean Square Error, RMSE)33

MAPE=t=1nxt-x̂txt/N
MAE=t=1nxt-x̂t/N
RMSE=t=1n(x(t)-x̂(t))2/N

式中:xt)为原始风速;x̂t为预报风速;n为样本数。

2 结果

为了对比分析信号分解方法与不同基础预报模型耦合之间的差异,首先将原始风速数据分解为1个低频子集(图4 A)和3个高频子集(图4 B—D)。在对模型进行对比分析时,加入多模型平均方法,探讨其对模型结果的影响,多模型平均方法采用12个模型平均(简称A12)和3个较好模型平均(简称A3)。

图4

图4   数据集分解子集(以戈壁下垫面为例,A为低频子集,B、C、D为高频子集)

Fig.4   The sub-layers of the gobi dataset (A is the low-frequency sub-layer; B, C, D are the high-frequency sub-layers,perspectively)


2.1 3种模型在不同下垫面的预报精度

模型预报能力在3个下垫面相似(图57),下面以戈壁下垫面的预报结果为例说明。

图5

图5   戈壁下垫面3种模型预报精度

A3为3个较好模型平均值,A12为12个模型平均值

Fig.5   The forecast accuracy of three kinds of models in gobi (A3 is the average of three better models, and A12 is the average of all the 12 models)


图6

图6   绿洲下垫面3种模型预报精度

A3为3个较好模型平均值,A12为12个模型平均值

Fig.6   The forecast accuracy of three kinds of models in oasis (A3 is the average of three better models, and A12 is the average of all the 12 models)


图7

图7   沙漠下垫面3种模型预报精度

A3为3个较好模型平均值,A12为12个模型平均值

Fig.7   The forecast accuracy of three kinds of models in desert (A3 is the average of three better models, and A12 is the average of all the12 models)


小波包分解显著提高了单一模型精度。以SVR模型为例,WPD-SVR模型误差(MAPE为3.81%,MAE为0.40 m·s-1,RMSE为0.52 m·s-1)远低于SVR模型的误差(MAPE为6.13%,MAE为0.64 m·s-1,RMSE为0.93 m·s-1),WPD-SVR模型相较于SVR模型精度显著提高。其余11个模型规律相同。该结果证明小波包分解能够显著提高单一XXX模型的预报精度。

利用卷积神经网络模型来预报高频子集,对多数WPD-XXX混合模型的预报精度影响不明显。以WPD-SVR模型为例,WPD-SVR-CNN模型误差(MAPE为3.40%,MAE为0.36 m·s-1,RMSE为0.47 m·s-1)低于WPD-SVR模型误差(MAPE为3.81%,MAE为0.40 m·s-1,RMSE为0.52 m·s-1),WPD-SVR-CNN模型精度较好,卷积神经网络小幅度提高了WPD-SVR模型精度。但是对于WPD-SLSTM模型,WPD-SLSTM-CNN模型误差值(MAPE为3.78%,MAE为0.40 m·s-1,RMSE为0.44 m·s-1)全都大于WPD-SLSTM模型(MAPE为3.59%,MAE为0.38 m·s-1,RMSE为0.41 m·s-1),WPD-SLSTM模型精度好,卷积神经网络没有提高WPD-SLSTM模型精度。戈壁数据集WPD-ELM-CNN模型精度略微高于WPD-ELM模型。加入卷积神经网络模型后,总计8个模型精度小幅度提高,3个模型精度未提高。该结果说明,卷积神经网络对提高WPD-XXX混合模型的精度有限。

这些模型中,小波包分解和极限学习机的耦合(WPD-ELM)、小波包分解和集特征提取和记忆功能的卷积长短时记忆网络(CLSTM)和卷积门控循环单元(CGRU)模型耦合具有较好的预报能力。其中,WPD-ELM模型误差值(MAPE为1.33%,MAE为0.13 m·s-1,RMSE为0.21 m·s-1)、WPD-CLSTM模型误差值(MAPE为1.40%,MAE为0.13 m·s-1,RMSE为0.20 m·s-1)和WPD-CGRU模型误差值(MAPE为1.39%,MAE为0.13 m·s-1,RMSE为0.19 m·s-1)相对较低,在3组模型中精度较好。

WPD-XXX混合模型中3个较好模型平均值精度较好。在WPD-XXX混合模型实验组中,3个较好模型误差值(MAPE为1.23%,MAE为0.12 m·s-1,RMSE为0.16 m·s-1)小于WPD-ELM模型误差值(MAPE为1.33%,MAE为0.13 m·s-1,RMSE为0.21 m·s-1),3个较好模型平均值精度优于WPD-ELM模型精度。在其他WPD-XXX模型中,WPD-ELM模型精度相对较好,故而,在WPD-XXX混合模型中,3个较好模型精度较好,能够提高模型精度。

绿洲和沙漠下垫面也有相似结果,见图6图7

2.2 3种模型预报结果拟合程度

对于3种下垫面,3种模型预报结果的拟合程度相似(表3),在此仅以戈壁下垫面进行说明。

表3   模型预报结果拟合程度(R2

Table 3  Fitting degree of model forecast results (R2)

模型戈壁绿洲沙漠
单一XXX模型WPD-XXX混合模型WPD-XXX-CNN模型单一XXX模型WPD-XXX混合模型WPD-XXX-CNN模型单一XXX模型WPD-XXX混合模型WPD-XXX-CNN模型
SVR0.84680.95200.96070.86820.93220.94590.15320.55060.5952
RF0.83560.97060.98030.84600.97630.98460.37400.88270.8989
GBR0.83110.96740.97260.82210.98240.98660.32430.87980.8935
ANN0.84910.97000.97140.86920.98410.98340.53600.93720.9261
ELM0.83290.99220.99430.87620.99670.99530.52760.97920.9754
CNN0.82870.95710.95710.88640.99190.99190.49160.93490.9349
LSTM0.86940.97250.97530.88520.97990.97880.56780.93690.9345
SLSTM0.85330.96980.96600.87970.98620.98580.43600.97190.9588
BLSTM0.86550.96410.96230.89240.98490.98730.53900.89500.9105
GRU0.86270.98700.98880.89020.99180.99110.56740.94960.9449
CLCTM0.85680.99310.99420.87190.99210.99230.45570.93080.9315
CGRU0.85790.99330.99310.87960.99220.99140.45340.94610.9433
A30.87040.99530.99420.89230.99530.99450.58370.97140.9633
A120.86930.98960.98910.88910.99370.99320.50470.93110.9289

A3为3个较好模型平均值,A12为12个模型平均值。

新窗口打开| 下载CSV


小波包分解显著提高单一模型预报结果的拟合程度。以SVR模型为例,单一XXX模型中SVR模型R2值为0.8468,WPD-XXX混合模型中WPD-SVR模型R2值为0.9520,WPD-SVR模型R2值更大,模型预报结果拟合程度较好,小波包分解能够提高SVR模型的预报结果拟合程度。其余模型有相同规律。

卷积神经网络模型对所有WPD-XXX混合模型预报拟合程度提高不显著。以WPD-SVR模型为例, WPD-SVR模型R2值为0.9520, WPD-SVR-CNN模型R2值为0.9607,WPD-SVR-CNN模型R2值更大,模型预报结果拟合程度较好,卷积神经网络对提高WPD-SVR模型预报结果的拟合程度显著。以WPD-SLSTM模型为例,WPD-SLSTM模型R2值为0.9698,WPD-SLSTM-CNN模型R2值为0.9660,WPD-SLSTM模型R2值更大,模型预报结果拟合程度较好,卷积神经网络对提高WPD-SLSTM模型的预报结果拟合程度不显著。其余模型规律为以上两种情况的一种,卷积神经网络对提高所有模型预报结果拟合程度没有显著的提高。

这3组实验中,小波包分解和卷积长短时记忆网络以及卷积门控循环单元的耦合模型拟合程度相对较好。WPD-ELM模型R2值为0.9922,WPD-CLSTM模型R2值为0.9931,WPD-CGRU模型R2值为0.9933,大于其余模型,预报结果拟合程度较好。从WPD-XXX-CNN模型可以发现同样规律。虽然卷积神经网络的使用使3组较好模型的R2值有上下浮动,但3组较好模型依旧未变。

对于戈壁下垫面,单一XXX模型和WPD-XXX混合模型实验组中,3个较好模型拟合程度优于其余模型拟合程度。单一XXX模型中,3个较好模型R2值为0.8704,值最大,模型预报结果拟合程度最好。WPD-XXX混合模型规律相似。3个较好模型的加入,能够提高模型预报结果的拟合程度。

2.3 多模型预报结果不稳定性

图8可见:3个较好模型平均的预报曲线与实际观测值接近,多模型平均避免了单个模型在某些点上具有较大误差,如局部极值点处。模型预报范围(即阴影范围)较大,平均值的使用使预报结果更接近实际观测值。同时,图8也体现了小波包分解对模型整体精度的提高(图8中阴影范围明显减小)。值得注意的是,沙漠下垫面模型预报结果很不稳定。

图8

图8   3种下垫面3种模型预报结果

Fig.8   The forecast results of three kinds of models in three datasets


3 讨论

本研究中,小波包分解和卷积长短时记忆网络以及卷积门控循环单元的耦合模型在不同数据集上都表现较好。对于戈壁下垫面,WPD-ELM模型MAPE值为1.33%,WPD-CLSTM模型MAPE值为1.40%,WPD-CGRU模型MAPE值为1.39%。相较于文献[2](5.638%)和文献[9](8.92%),本研究中模型MAPE值较小,模型预报精度更好。其余下垫面预报结果相似。这表明本研究采用的小波包分解与深度学习模型的耦合模型对风速有较好的预报能力。

主要原因如下:

(1) 信号分解能有效降低数据复杂性,机器学习模型对分解后的风速信号预报能力更强。原始风速具有间歇性和不稳定性,信号复杂,机器学习模型对其预报能力差。但信号分解方法可将复杂的原始信号转换为更加稳定的分量,降低了原始风速内在特性的影响,机器学习模型对各稳定分量的预报精度更高,因此,单一XXX模型与小波包分解组成的混合模型对风速的预报能力大大增强。这与Zhang等33的研究结果一致。

(2) 深度学习模型对复杂时间序列预报能力更强。卷积长短时记忆网络和卷积门控循环单元既具有卷积神经网络的自动特征选择功能,又具有循环神经网络的记忆功能。ELM为单个隐藏层前馈神经网络,模型结构简单,训练速度快,不需要复杂的参数选择就能快速学习数据的内部规律。Hao等34使用极限学习机预报风速分量以及风速误差序列,Ghimire等35在深度太阳辐射预报中使用卷积长短时记忆网络,Liu等36使用卷积门控循环单元预报风速序列子集,都有着相似发现。

(3) 不同模型具有不同学习能力,本研究中主要体现在极值预报上。在极值点处单一模型预报误差较大,而多模型平均使得预报结果更加平滑,预报值更接近实际观测值。多模型平均能有效利用不同模型特点,在极值预报上实现互补。Feng等25使用深度特征选择和多模型预报风速,模型预报精度明显优于单一模型。

4 结论

小波包分解可有效降低时间序列数据的复杂性,提高模型预报精度。

小波包分解与具有特征学习和记忆功能的深度学习模型(如卷积长短时记忆网络、卷积门控循环单元)的耦合具有较好的预报能力。

不同模型在时间序列风速不同时间点上预报能力不同,多个模型的集合预报(特别是较好模型集合如3个较好模型集合)可以取长补短,因此多个模型的集合预报有更好的结果。

参考文献

Liu M SCao Z MZhang Jet al.

Short-term wind speed forecasting based on the Jaya-SVM model

[J].International Journal of Electrical Power & Energy Systems,2020121106056.

[本文引用: 2]

王俊李霞周昔东.

基于VMD和LSTM的超短期风速预测

[J].电力系统保护与控制,20204811):45-52.

[本文引用: 2]

张丽英叶廷路辛耀中.

大规模风电接入电网的相关问题及措施

[J].中国电机工程学报,20103025):1-9.

[本文引用: 1]

Liu HMi X WLi Y F.

Comparison of two new intelligent wind speed forecasting approaches based on wavelet packet decomposition,complete ensemble empirical mode decomposition with adaptive noise and artificial neural networks

[J].Energy Conversion and Management,2018155188-200.

[本文引用: 1]

Dong Q LSun Y HLi P Z.

A novel forecasting model based on a hybrid processing strategy and an optimized local linear fuzzy neural network to make wind power forecasting:a case study of wind farms in China

[J].Renewable Energy,2017102241-257.

[本文引用: 1]

Howard TClark P.

Correction and downscaling of NWP wind speed forecasts

[J].Meteorological Applications,2007142):105-116.

[本文引用: 1]

黄彦辉王龙杰杨薛明.

基于混沌时间序列的支持向量机短期风速预测模型研究

[J].电测与仪表,20155217):32-37.

[本文引用: 1]

李应求安勃李恒通.

基于NARX及混沌支持向量机的短期风速预测

[J].电力系统保护与控制,20194723):65-73.

[本文引用: 1]

梁智孙国强俞娜燕.

基于高斯过程回归和粒子滤波的短期风速预测

[J].太阳能学报,2020413):45-51.

[本文引用: 2]

喻敏常毓婵袁浩.

基于HP-EMD和ARMA的短期风速预测

[J].中国科技论文,2016115):566-570.

孙驷洲陈亮郭兴众.

基于EEMD与极限学习机的短期风速组合预测模型

[J].安徽工程大学学报,2018334):56-63.

王晨寇鹏.

基于卷积神经网络和简单循环单元集成模型的风电场内多风机风速预测

[J].电工技术学报,20201-14.

Yu C JLi Y LXiang H Yet al.

Data mining-assisted short-term wind speed forecasting by wavelet packet decomposition and elman neural network

[J].Journal of Wind Engineering and Industrial Aerodynamics,2018175136-143.

Harbola SCoors V.

One dimensional convolutional neural network architectures for wind prediction

[J].Energy Conversion and Management,201919570-75.

[本文引用: 1]

Liu HTian H QLi Y F.

Four wind speed multi-step forecasting models using extreme learning machines and signal decomposing algorithms

[J].Energy Conversion and Management,201510016-22.

[本文引用: 1]

Hao YTian C S.

A novel two-stage forecasting model based on error factor and ensemble method for multi-step wind power forecasting

[J].Applied Energy,2019238368-383.

[本文引用: 1]

Liu HTian H QLiang X Fet al.

Wind speed forecasting approach using secondary decomposition algorithmn and elman neural networks

[J].Applied Energy,2015157183-194.

[本文引用: 1]

Pei S QQin HZhang Zet al.

Wind speed prediction method based on empirical wavelet transform and new cell update long short-term memory network

[J].Energy Conversion and Management,2019196779-792.

[本文引用: 1]

叶瑞丽郭志忠刘瑞叶.

基于小波包分解和改进Elman神经网络的风电场风速和风电功率预测

[J].电工技术学报,20173221):103-111.

[本文引用: 1]

王宁罗汝斌廖俊.

基于小波包分解的BP神经网络的短期风速预测

[J].控制与信息技术,20194):44-49.

Mi X WLiu HLi Y F.

Wind speed forecasting method using wavelet,extreme learning machine and outlier correction algorithm

[J].Energy Conversion and Management,2017151709-722.

[本文引用: 1]

Liu HYu C QWu H Pet al.

A new hybrid ensemble deep reinforcement learning model for wind speed short term forecasting

[J].Energy,20202021-36.

[本文引用: 1]

Moreno S RSilva R G DMariani V Cet al.

Multi-step wind speed forecasting based on hybrid multi-stage decomposition model and long short-term memory neural network

[J].Energy Conversion and Management,2020213112869.

[本文引用: 1]

Mi X WLiu HLi Y F.

Wind speed prediction model using singular spectrum analysis,empirical mode decomposition and convolutional support vector machine

[J].Energy Conversion and Management,2019180196-205.

[本文引用: 3]

Feng CCui M JHodge B Met al.

A data-driven multi-model methodology with deep feature selection for short-term wind forecasting

[J].Applied Energy,20171901245-1257.

[本文引用: 3]

Liu HMi X WLi Y F.

An experimental investigation of three new hybrid wind speed forecasting models using multi-decomposing strategy and ELM algorithm

[J].Renewable Energy,2018123694-705.

[本文引用: 1]

Liu HMi X WLi Y F.

Smart multi-step deep learning model for wind speed forecasting based on variational mode decomposition,singular spectrum analysis,LSTM network and ELM

[J].Energy Conversion and Management,201815954-64.

[本文引用: 1]

Liu HMi X WLi Y F.

Smart deep learning based wind speed prediction model using wavelet packet decomposition,convolutional neural network and convolutional long short term memory network

[J].Energy Conversion and Management,2018166120-131.

[本文引用: 4]

Ding L YFang W LLuo H Bet al.

A deep hybrid learning model to detect unsafe behavior:integrating convolution neural networks and long short-term memory

[J].Automation in Construction,201886118-124.

[本文引用: 1]

Memarzadeh GKeynia F.

A new short-term wind speed forecasting method based on fine-tuned LSTM neural network and optimal input sets

[J].Energy Conversion and Management,2020213112824.

[本文引用: 2]

Li Y FShi H PHan F Zet al.

Smart wind speed forecasting approach using various boosting algorithms,big multi-step forecasting strategy

[J].Renewable Energy,2019135540-553.

[本文引用: 1]

Zhang Y GPan G FChen Bet al.

Short-term wind speed prediction model based on GA-ANN improved by VMD

[J].Renewable Energy,20201561373-1388.

[本文引用: 1]

Zhang J LWei Y MTan Z F.

An adaptive hybrid model for short term wind speed forecasting

[J].Energy,2019190115615.

[本文引用: 2]

Hao YTian C.

A novel two-stage forecasting model based on error factor and ensemble method for multi-step wind power forecasting

[J].Applied Energy,2019238368-383.

[本文引用: 1]

Ghimire SDeo R CRaj Net al.

Deep solar radiation forecasting with convolutional neural network and long short-term memory network algorithms

[J].Applied Energy,2019253113541.

[本文引用: 1]

Liu HMi X WLi Y Fet al.

Smart wind speed deep learning based multi-step forecasting model using singular spectrum analysis,convolutional gated recurrent unit network and support vector regression

[J].Renewable Energy,2019143842-854.

[本文引用: 1]

/