img

官方微信

高级检索

中国沙漠, 2025, 45(2): 294-304 doi: 10.7522/j.issn.1000-694X.2025.00010

基于能见度和相对湿度估算沙尘浓度的模型构建与检验

海登科,1, 焦瑞莉1, 吴成来,2, 邹杰2, 许永芳3, 段赛男1

1.北京信息科技大学 信息与通信工程学院,北京 100101

2.中国科学院大气物理研究所,北京 100029

3.国家气象信息中心,北京 100081

Development and validation of a regression model for estimating dust concentration from visibility and relative humidity

Hai Dengke,1, Jiao Ruili1, Wu Chenglai,2, Zou Jie2, Xu Yongfang3, Duan Sainan1

1.College of Information and Communication Engineering,Beijing Information Science and Technology University,Beijing 100101,China

2.Institute of Atmospheric Physics,Chinese Academy of Sciences,Beijing 100029,China

3.National Meteorological Information Center,Beijing 100081,China

通讯作者: 吴成来(E-mail: wuchenglai@mail.iap.ac.cn

收稿日期: 2024-10-29   修回日期: 2025-01-17  

基金资助: 国家自然科学基金项目.  42075166
北京信息科技大学项目.  S2226080.  S2326220

Received: 2024-10-29   Revised: 2025-01-17  

作者简介 About authors

海登科(2000-),男,黑龙江齐齐哈尔人,硕士研究生,主要研究方向为气象环境数据智能分析与应用E-mail:2022020516@bistu.edu.cn , E-mail:2022020516@bistu.edu.cn

摘要

利用北京地区2021年沙尘天气期间PM10浓度、能见度和相对湿度地面站点观测资料,在详细分析了PM10浓度与能见度、相对湿度关系的基础上,构建了一个基于能见度和相对湿度估算沙尘天气下PM10浓度(即沙尘浓度)的模型。结果表明:沙尘浓度与能见度显著负相关,与相对湿度存在弱的相关性。基于能见度拟合可得到较好的拟合效果(R2>0.9),其中采用幂函数、指数函数组合的分段函数拟合效果更优(R2=0.935,RMSE=231.96 μg·m-3ME=3.22 μg·m-3);进一步引入相对湿度,拟合效果有所提升(R2=0.939,RMSE=224.57 μg·m-3ME=-3.8 μg·m-3)。

关键词: 沙尘天气 ; PM10浓度 ; 能见度 ; 相对湿度 ; 相关系数

Abstract

In this study, we develop a regression model for dust concentrations based on the ground station observation data of PM10 concentration, visibility and relative humidity during dust events in Beijing in 2021. After a detailed analysis of the relationship among the three elements (i.e., PM10 concentration, visibility, and relative humidity), we found that dust concentration has a significant negative correlation with visibility and a weak correlation with relative humidity. When only visibility was used for fitting, dust concentration can be estimated reasonably with the determination coefficient R2 greater than 0.9, and the piecewise function combining power function and exponential function has the better fitting results, with a R2 of 0.935, a root mean square error (RMSE) of 231.96 μg·m-3, and a mean error (ME) of 3.22 μg·m-3. Introducing relative humidity further improves the fitting performance, with R2 increased to 0.939, RMSE reduced to 224.57 μg·m-3, and ME being -3.8 μg·m-3.

Keywords: dust events ; PM10 concentration ; visibility ; relative humidity ; correlation coefficient

PDF (1618KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

海登科, 焦瑞莉, 吴成来, 邹杰, 许永芳, 段赛男. 基于能见度和相对湿度估算沙尘浓度的模型构建与检验. 中国沙漠[J], 2025, 45(2): 294-304 doi:10.7522/j.issn.1000-694X.2025.00010

Hai Dengke, Jiao Ruili, Wu Chenglai, Zou Jie, Xu Yongfang, Duan Sainan. Development and validation of a regression model for estimating dust concentration from visibility and relative humidity. Journal of Desert Research[J], 2025, 45(2): 294-304 doi:10.7522/j.issn.1000-694X.2025.00010

0 引言

沙尘天气是影响中国北方的主要灾害性天气。沙尘天气期间,颗粒物浓度急剧增高,对人体健康危害极大。沙尘天气还会导致能见度降低,影响交通出行,严重时可导致航班停飞、铁路停运、高速封闭等。沙尘天气一般起源于干旱、裸露或植被覆盖较少的地区。这些地区表层土壤粒子被强风卷起进入大气,并且随气流进行输送,影响到下游的地区 。尽管20世纪60年代以来中国北方沙尘天气总体上呈递减的趋势1-4,但2021—2023年沙尘天气频次有所增加,给社会经济活动、国民生活和身体健康带来了极大的影响5-9。故加强沙尘天气的监测、预报预警及影响评估具有重要的科学和现实意义10

传统的气象观测通常利用能见度来判断沙尘天气11。由于沙尘粒子对大气具有消光作用12,因此通过监测能见度的变化,可以有效识别出沙尘天气。从1949年至今,中国已经建立了较完善的气象观测站网413-15。随着遥感观测技术的发展,卫星观测也成为沙尘天气监测的主要手段。特别是对于大范围以及人迹罕至的区域(如沙漠腹地等),卫星观测具有不可替代的作用16-19。然而不管是传统的气象观测抑或是卫星观测,都很难直接得到沙尘浓度。由于沙尘浓度能直接关联污染强度以及对人类健康的影响,因此沙尘浓度的监测越来越受到重视。2000年前后,中国开始在部分气象台站增加大气颗粒物(PM10、PM2.5)浓度的观测,建立了包含19个站点的中国北方沙尘天气监测网20。2010年以来,中国生态环境监测总站也逐渐建立了中国城市大气环境监测网,实现了在全国300多个城市、2000多个站点观测大气颗粒物(PM10、PM2.5)浓度,所获取资料已被广泛用于沙尘天气的实时监测和过程分析中68-921-23

尽管地面台站已能实时监测沙尘浓度(为了简化,本文中将沙尘天气期间PM10浓度称为沙尘浓度),然而受限于观测仪器稳定性等因素,沙尘浓度监测时有缺失24-26,因此,能见度监测仍然是识别沙尘天气的常用手段。不过由于能见度与沙尘浓度之间存在关联性,即在假设沙尘粒子具有特定的粒径分布的前提下,可通过沙尘浓度计算其消光系数,从而推导出能见度12。因此能见度与沙尘浓度可以互相转化,从而弥补沙尘浓度缺测的不足。对此,已有不少学者基于沙尘浓度与能见度的观测资料构建了两者的关系模型182027-28。利用构建的模型,基于气象站点观测的能见度资料可估算得到沙尘浓度,并用于确定不同沙尘天气等级下的沙尘浓度2029和评估验证数值模式的模拟预报结果1829

尽管上述构建的模型已得到了很好的应用,但也存在不足之处。特别是,这些模型多只是考虑能见度的影响182028。事实上,能见度还受到相对湿度的影响,相对湿度升高会导致能见度降低30-31。因此,如果不考虑相对湿度对能见度的作用,只是基于能见度和沙尘浓度的关系估算沙尘浓度,将导致结果产生误差。尽管也有一些研究关注了除能见度外的其他气象要素(如相对湿度等)对大气污染物浓度(即PM2.5、PM10浓度)的影响,并构建了大气污染物浓度的估算模型32-35,但目前缺少针对沙尘浓度的研究。

鉴于此,本文将基于北京地区气象台站能见度、相对湿度等气象资料与环境监测站PM10浓度,在分析这些要素之间关联性的基础上,构建基于能见度和相对湿度估算沙尘浓度的回归模型,并对比考虑相对湿度前后对沙尘浓度估算结果的改进。本文选用多种常用的函数形式如幂函数、指数、对数、分段函数等,并通过拟合效果的对比,得到一个较优的模型。相比前人研究182028,本文提出了一套基于各个要素间相关性、并通过多种函数对比优选的方法,该方法可得到更好的拟合效果,而且本文还引入相对湿度以提升沙尘浓度的拟合效果。另外,本文还对比了白天和夜间沙尘浓度的拟合效果的差异,并分析了原因。

1 数据与方法

1.1 数据来源

采用数据包括北京地区气象站观测的能见度、相对湿度等气象要素以及中国环境观测总站观测的PM10、PM2.5浓度资料。时间范围为2021年全年,时间分辨率为1 h。北京气象站点观测数据来自54511站,该站位于39°48′N、116°28′E,观测海拔31.3 m。根据中国气象局《地面气象自动观测规范》(2020年),能见度观测采用前向散射能见度仪进行自动观测,观测范围为0.01~30 km,分辨率为0.001 km(即1 m),准确度为±10%(≤1.5 km)、±20%(>1.5 km);相对湿度采用进行自动观测,观测范围为0~100% (即0~1),分辨率为1%,准确度为±3%(≤80%)、±5%(>80%)。需要说明的是,由于2013—2014年气象站点能见度观测由人工观测逐步转换为自动观测,2015年之后全部为自动观测,而人工观测能见度和自动观测能见度存在一定的差别36,因此本文基于自动观测能见度得到的拟合公式不能直接用于人工观测能见度估算沙尘浓度。

PM10、PM2.5浓度数据来源于中国环境监测总站的全国城市空气质量实时发布平台,选择站点为距离54511站最近的大兴旧宫站。该站点位于39°87′N、116°35′E,观测海拔37.5 m,距离54511站2 km。

1.2 沙尘天气的识别

本文重点分析沙尘天气期间大气颗粒物浓度与气象要素的关联性。沙尘天气下,PM10浓度明显增加,与PM2.5浓度的比值会显著增加。故综合考虑PM10浓度以及PM10与PM2.5比值两个要素作为沙尘天气的判断条件。具体来讲,沙尘天气的判断标准为PM10浓度大于250 μg·m-3且PM10浓度与PM2.5浓度的比值大于2.1。对2021年全年有效观测数据进行判断,得到所有沙尘天气发生时段共计182 h,非沙尘天气共7 795 h。进一步分析发现,182 h沙尘天气数据主要在春季,共有141 h(占总数的77%);另外,冬季、秋季分别有38、3 h,夏季无沙尘天气记录。

另一方面,从昼夜分布来看(定义06:00—18:00为白天,其余时间为夜间)。182 h沙尘天气中,白天、夜间分别有83、99 h,分别占54%、46%。白天沙尘天气期间的PM10浓度为251~7 468 μg·m-3(平均值为824 μg·m-3),而夜间沙尘天气期间的浓度为250~2 272 μg·m3(平均值为433 μg·m-3)。总体上看前者高于后者,这可能是由于白天风速较高、相对湿度较低,导致白天沙尘天气期间的PM10浓度较高。

需要说明的是,本文中PM2.5浓度只是用于识别沙尘天气中;当识别出沙尘天气后,将重点分析沙尘天气期间PM10浓度与气象要素的关联性并据此构建基于气象要素估算沙尘浓度的模型。

在图和表中使用CPM10代表沙尘浓度(沙尘天气期间PM10浓度),单位为μg·m-3V代表能见度,单位为km。RH代表相对湿度,r代表相关系数。

1.3 要素间的关联性分析方法

采用皮尔逊相关系数r(以下简称相关系数)衡量不同要素间的关联性:

r=i=1n(xi-x¯)i=1n(yi-y¯)i=1n(xi-x¯)2i=1n(yi-y¯)2

式中:xiyi分别是两个变量的序列;x¯y¯分别是对应的均值。相关系数的绝对值越大,变量之间的相关性越强。

考虑到沙尘浓度与能见度(V)、相关湿度(RH)等各个气象要素间并非为简单的线性关系,因此将沙尘浓度、能见度、相对湿度等各个变量采用常用的函数如幂函数、对数进行变换并计算变换后的相关系数。

1.4 拟合公式的构建与评估方法

在计算各个要素(原始数据或转换后数据)间的相关系数基础上,构建沙尘浓度与能见度、相关湿度等各个气象要素间的非线性拟合公式。选用的变量组合主要根据相关系数进行选择。

对于设定的拟合函数,使用最小二乘法拟合参数。其主要思想是通过寻求最合适的系数以最小化模型估计值和实际值之间残差平方和。假设有一个由参数θ=(θ1,θ2,θ3,θn)定义的函数 fx,θ。其中x是自变量,θ是模型参数。最小二乘法旨在找到参数θ的最优值,以最小化损失函数Lθ),其中损失函数L为所有观测点的残差平方和:

L(θ)=i=1n[yi-f(xi,θ)]2

式中:n是数据点总数;yi是每个点的实际值;fxi,θ是模型对每个点的估算值。通过求解损失函数L(θ)对每个参数θj的偏导数等于零的方程组,找到这些方程的解,即可得到参数的最优估计值。

然而这些方程组往往无法直接求解,常用方法是Levenberg-Marquardt算法。Levenberg-Marquardt算法将梯度下降法与高斯-牛顿法的优点融合在一起,具有快速收敛函数、高效以及对设置的初始参数不敏感等特点37-38。本文采用Python程序提供的curve_fit得到拟合函数的参数(https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.curve_ fit.html)。

本文首先选择对沙尘浓度关联度最高的要素进行拟合,然后依次添加关联度次高的要素,最终构建包含多个气象要素的沙尘浓度拟合模型。另外,为了使构建的拟合公式符合物理含义,拟合值的变化范围需满足以下条件:能见度趋于0时,对应的PM10浓度趋于正无穷;能见度趋于正无穷时,对应的PM10浓度应趋于0。

为评估拟合公式的效果,采用决定系数(R2)、均方根误差(RMSE)、平均误差(ME39-41对公式进行评估。

决定系数(R2)是统计学中用于评估回归模型解释变量变异能力的重要指标。其通过比较观测值与拟合值之间的相关性来衡量模型的拟合效果。取值范围在0到1之间。

均方根误差(RMSE)用于量化模型拟合值与实际观测值之间的偏差。RMSE能够直观地表示误差的平均大小,但其对较大的误差具有较高的敏感性。

平均误差(ME),也称为偏差,用于量化模型拟合值与实际观测值之间的平均差别。

R2=i=1N(yi-yi¯)(yi^-yi^¯)i=1N(yi-yi¯)2i=1N(yi^-yi^¯)22
RMSE=i=1N(yi-yi^)2N
ME=1Ni=1Nyi-yi^=yi¯-yi^¯

式中:yi表示观测值;yi¯表示观测值的均值;yi^表示拟合值;yi^¯表示拟合值的均值;N表示观测数据的数量。需要注意的是,根据损失函数(即参数平方和)和RMSE的定义,可得

L(θ)=N×RMSE2

即对应给定的函数,采用非线性最小二乘法拟合时,L(θ)最小时对应的RMSE也最小。

2 结果与分析

2.1 沙尘浓度与能见度、相对湿度的关联性

图1可以看出,沙尘浓度与能见度呈明显的负相关;随着能见度的升高,沙尘浓度从7 468 μg·m-3逐渐减小到250~300 μg·m-3。相比而言,沙尘浓度与相对湿度呈弱反相关关系(r为-0.26),主要是由于沙尘浓度大于500 μg·m-3时相对湿度较小(小于0.25),而沙尘浓度小于500 μg·m-3对应的相对湿度在0.05~0.7变化,表明强沙尘天气期间空气更为干燥,体现了上游的干冷空气对沙尘的输送作用。相比而言,沙尘天气期间,能见度和相对湿度间无明显相关关系。

图1

图1   沙尘浓度与能见度、相对湿度散点图

Fig. 1   Scatter plot of PM10 concentration vs. visibility and relative humidity


沙尘浓度(CPM10)与能见度呈一定的曲线关系(图1A)。进一步对沙尘浓度、能见度分别进行指数、对数和幂函数变换,分析变换后的相关性。由于CPM10进行指数变换后将得到无穷大的值,因此将CPM10除以1 000,再进行变换从而计算变换后的相关系数。对于幂函数变换后结果(即CPM10V nCPM10nV),将n从-5至5之间以0.01间隔增加,分别计算相关系数,对比得到最大的相关系数(对应的n值为-1)。为了对照,同时给出n为-2时的结果。

CPM10采取对数、幂函数变化后的相关系数明显高于未变换前,其中CPM10V -1间的相关系数最高,为0.95(图2)。从图2C可以看出,大部分数据点近似分布在一条直线上。另外lg(CPM10)与lg(V)的相关系数为-0.92,而CPM10V经指数变化后的相关系数较低,绝对值不超过0.2。

图2

图2   沙尘浓度和能见度经对数、指数和幂函数变换后的散点图

注:CPM10单位为μg·m-3,V单位为km

Fig.2   Scatter plots of dust concentration vs. visibility transformed by logarithmic, exponential, and power functions


CPM10进行对数、幂函数(n=-0.95)变换后,其与相对湿度RH的相关性相比于未变换前,有明显的提高,分别可达-0.34、-0.36。但对CPM10进行指数变换后,其与RH的相关系数仅为-0.09;分别对CPM10RH进行对数变换后,两者也有较高的相关系数(为-0.32)。对RH分别进行对数、指数、幂函数(n=0.71)变换后,其与CPM10的相关系数与未变换前变化不大。

总体上看,通过对CPM10VRH进行对数、幂函数变换后,相比未变换前显著提高了要素间的相关性。

2.2 基于能见度估算沙尘浓度的拟合模型

沙尘浓度(CPM10)和能见度V具有较强的相关性,二者间可能存在线性关系。据此可以构建拟合函数CPM10=a/V、lg(CPM10)=a·lg(V)+b、lg(CPM10)=aV+b。后两个函数可重新写为CPM10=cV a (其中c=e b )、CPM10=ce aV,(其中c=e b )。考虑到CPM10V的取值范围,故在CPM10=a/V中没有引入b参数(即CPM10=a/V+b)。利用Python提供的curve_fit函数应用Levenberg-Marquardt算法分别计算各个函数对应的最优拟合参数,得到拟合函数,即为图3的拟合结果,拟合结果与原始数据对比的评估指标见表1

图3

图3   单要素拟合效果对比

Fig. 3   Comparison of single factor fitting effect


表1   基于能见度构建的沙尘浓度拟合公式及其评估指标结果

Table 1  Regression function for the dust concentration from visibility and its evaluation

拟合公 式序号拟合公式R2RMSEME
1CPM10=3195V-1.000.909285.29-57.31
2CPM10=3223V-1.070.908278.06-14.94
3CPM10=8522e-0.78V0.915364.99233.34
4CPM10=3390V-0.94V2.074423V-1.30V>2.070.913269.7610.34
5CPM10=3213V-1.08V8.87368e-0.02VV>8.870.909276.19-23.34
6CPM10=10159e-0.96VV2.831336V-0.66V>2.830.935231.963.22
7CPM10=10074e-0.95VV3.16636e-0.07VV>3.160.934234.133.90

新窗口打开| 下载CSV


基于幂函数和指数函数得到的拟合公式均能抓住沙尘浓度随能见度递减的变化特征,且拟合值与实际值的量值也相当(图3)。表1中拟合公式1、2、3的决定系数均高于0.9,但这3个公式的拟合值与实际值的偏差存在差异,特别是指数函数和幂函数的拟合效果存在明显差别。

对比表1中两组幂函数拟合公式,拟合公式1的R2略高于拟合公式2,但拟合公式2的RMSEME更小,尤其是ME为-14.94 μg·m-3,优于拟合公式1的-57.31 μg·m-3。在高沙尘浓度下(CPM10=7 468 μg·m-3),拟合公式2的拟合值为6 357 μg·m-3,更接近实际值。从图3A可以看出,在V为3.5~6.5 km时,拟合公式1和2的拟合值整体高于实际值,拟合公式2的偏差较小;而V >12 km时,拟合公式1和2的拟合值整体低于实际值,拟合公式1的偏差较小。

相比之下,基于指数函数的拟合公式3的R2虽然略高,但RMSEME绝对值较大,偏差显著。在1 km<V<2.5 km时,拟合公式3的拟合值明显偏高,而V>3.5 km时,拟合值普遍偏低。对于V<1 km的高沙尘浓度期间,拟合公式3的拟合值接近实际值,但对最高沙尘浓度点的拟合值较低。综合来看,拟合公式1、2的拟合效果略优于拟合公式3。

由于单一函数难以在各能见度期间均取得良好效果,故本文在上述公式的基础上构建2个分段的分段函数。2个分段的函数分别使用幂函数(CPM10=cV a )和指数函数(CPM10=e aV )进行拟合,共包含4种组合形式。

为确保分段函数每段有足够的数据点进行拟合,故每段至少有10%的数据点(即至少有18个数据点)。将分界点V0设置在2~12,以0.001的步长递增,并分别采用幂函数或指数函数对区间(0,V0]和[V0,16]进行拟合,同时确保在V0处的连续性。选取每个区间内残差平方和最小的拟合公式作为该区间的最优公式,并将各段最优公式组合,构建出最佳分段函数。得到的4组分段函数公式如表1中拟合公式4~所列。

表1看出,采用分段函数进行拟合后,分段函数拟合效果相比单一函数(拟合公式1、2、3)均有提升,特别是拟合公式6、相比于拟合公式1、2、3在各项指标上都有明显的改进,其中R2分别增加到0.935、0.934,RMSE分别减少到231.96、234.13 μg·m-3ME绝对值分别减小到3.22、3.90 μg·m-3。选取提升效果最大的拟合公式6,与拟合公式1、2、3进行拟合效果比对,结果如图4所示。

图4

图4   引入分段函数前后拟合效果对比

Fig.4   Comparison of fitting performance before and after introducing piecewise functions


在大部分点,拟合公式6相比于拟合公式1、2、3均有明显的改进。在V<2 km和V>3.5 km,拟合公式6的结果与实际值总体较为接近。但在2 km<V<3.5 km时,拟合公式6的拟合值偏低。总体上看,拟合公式6相比于拟合公式1、2、3在R2RMSEME上均有明显的改进,表明选用合适的分段函数可提升拟合效果。

尽管单要素拟合可得到不错的拟合结果,但仍然存在一定的偏差。

2.3 考虑相对湿度校正的沙尘浓度估算模型

进一步引入相对湿度以提升拟合效果。根据图1C,北京沙尘天气期间相对湿度与能见度间的相关性很弱,可认为彼此独立。因此,考虑在拟合公式1、2、3中进一步引入相对湿度的校正因子。由于该校正因子与能见度应彼此独立,故将其累加或累乘到拟合公式1、2、3中。不过考虑能见度与沙尘浓度量值的约束关系,故采用累乘方法,得到基于能见度和相对湿度的沙尘浓度拟合公式。为确定校正因子,同样分析沙尘浓度比例因子与RH的相关性。沙尘浓度比例因子定义为实际值与拟合公式1、2、3拟合值的比值,记为f。首先分别计算fRH以及两者经对数、指数、幂函数变换后的相关系数(表2)。

表2   沙尘浓度比例因子 f 与相对湿度 RH 间的相关系数

Table 2  Correlation coefficient between dust concentration ratio f and relative humidityRH

相对 湿度基于拟合公式1得到的f
flg( f )exp( f )( f ) n
RH-0.52-0.50-0.51-0.52 (n=1.25)
lg(RH)-0.54-0.51
exp(RH)-0.50
RHn-0.54 (n=-0.08)
相对 湿度基于拟合公式2得到的f
flg( f )exp( f )( f ) n
RH-0.48-0.46-0.47-0.48 (n=1.17)
lg(RH)-0.50-0.48
exp(RH)-0.46
RHn-0.50 (n=-0.09)
相对 湿度基于拟合公式3得到的f
flg( f )exp( f )( f ) n
RH-0.18-0.1-0.25-0.21(n=-1.9)
lg(RH)-0.21-0.13
exp(RH)-0.17
RHn0.21(n=-0.01)
相对 湿度基于拟合公式6得到的f
flg( f )exp( f )( f ) n
RH-0.42-0.42-0.42-0.43 (n=0.82)
lg(RH)-0.44-0.42
exp(RH)-0.42
RHn0.44 (n=-0.01)

新窗口打开| 下载CSV


表2显示,拟合公式1的fRH两者或任意要素经幂函数、指数变换后的相关系数绝对值在0.46~0.54,拟合公式2对应的结果则在0.42~0.50,表明fRH间均具有明显的相关性。对于拟合公式3,fRH相应的相关系数绝对值在0.1~0.25,低于拟合公式1、2的结果。

根据表2的结果,除拟合公式3外,fRH、lg(RH)、RH n 之间的相关系数普遍高于其他变换形式之间的相关系数。因此,选取f=aRH+bf =alg(RH)+bf=aRH n+b作为RH校正函数并分别与拟合公式1、2、3结合,构建考虑能见度和相对湿度的沙尘浓度拟合公式。对于拟合公式3,尽管fRH、lg(RH)、RH n 间的相关系数也相对较高,但exp(f)与RH间的相关系数相比更高(为0.25),故可假定exp(f)=aRH+b,即f=lg(aRH+b)作为RH校正函数并与拟合公式3结合,得到拟合公式3-4的结果。

对于分段函数,采用同样的方法将基于f得到的拟合公式与拟合公式6结合,得到拟合公式6-1、6-2、6-3,并基于拟合公式6-1,通过优化模型参数以最小化残差平方和,得到拟合公式6-4(表3)。

表3   基于能见度 V 和相对湿度 RH 构建的沙尘浓度拟合公式及其评估指标结果

Table 3  Regression function for the dust concentration from visibility and relative humidity as well as its evaluation

拟合公式序号拟合公式R²RMSEME
1-1CPM10=3195V-1(-1.36RH+1.24)0.918261.53-5.61
1-2CPM10=3195V-1(-0.35lg RH+0.38)0.919260.26-7.04
1-3CPM10=3195V-1(-4.88RH0.08+5.23)0.919260.18-6.50
2-1CPM10=3223V-1.07(-1.04RH+1.18)0.916266.4622.95
2-2CPM10=3223V-1.07(-0.27lg RH+0.51)0.916265.2522.55
2-3CPM10=3223V-1.07(2.61RH-0.09-2.08)0.916265.2322.12
3-1CPM10=8522e-0.78V(-0.72RH+0.48)0.888331.53-95.77
3-2CPM10=8522e-0.78V(-0.18lg RH+0.02)0.890331.09-98.76
3-3CPM10=8522e-0.78V(0.17RH-0.49-0.07)0.889337.63-107.22
3-4CPM10=8522e-0.78Vlg (-0.9RH+1.58)0.888334.36-99.86
6-1CPM10=10159e-0.96V(-0.74RH+1.22)V2.831336V-0.66(-0.74RH+1.22)V>2.830.940248.32-29.89
6-2CPM10=10159e-0.96V(-0.19lg RH+0.73)V2.831336V-0.66(-0.19lg RH+0.73)V>2.830.941238.51-19.63
6-3CPM10=10159e-0.96V(19.12RH-0.01-18.36)V2.831336V-0.66(19.12RH-0.01-18.36)V>2.830.941244.8-28.56
6-4CPM10=182e-0.9V(-42.38RH+59.32)V2.8329V-0.67(-42.38RH+59.32)V>2.830.939224.57-3.8

新窗口打开| 下载CSV


表3可见,拟合公式1-1、1-2、1-3相比于拟合公式1在3项指标上均有明显的改进。拟合公式2-1、2-2、2-3相比于拟合公式2在R2RMSE有明显的改进,尽管ME略有增加,整体效果仍优于拟合公式2。拟合公式3加入RH校正因子后在RMSEME上有所改善,但R2下降明显,整体改进不明显。引入RH校正因子后,拟合公式1-1、1-2、1-3间的拟合效果差别不大,同时拟合公式2-1、2-2、2-3的拟合效果差别也不大,表明不同RH校正因子对总体拟合效果影响不大。引入校正因子后,拟合公式1和拟合公式2的拟合结果均优于拟合公式3。具体的拟合效果对比如图5所示。

图5

图5   基于能见度V和相对湿度RH构建的沙尘浓度拟合公式效果对比

Fig. 5   Comparison of fitting results for dust concentration models based on visibility (V) and relative humidity (RH


图5A中,由于拟合公式1-3与1-2的拟合效果较为接近(即在图中所示的点几乎重合),故仅给出拟合公式1-2的拟合效果。同理,由于拟合公式6-3的拟合效果与拟合公式6-2较为接近(即在图中所示的点几乎重合),故图5B仅给出拟合公式6-2的拟合效果。图5C展示拟合公式6-4与6-1的拟合效果。

图5A显示,引入RH校正因子(拟合公式1-1、1-2)的拟合结果相比于未考虑校正因子(拟合公式1),更接近实际值,表明引入RH校正因子对沙尘浓度拟合结果的改进。表3中的拟合公式表明,CPM10RH增加而减少,这样的变化趋势与图4及实际情况相符。图5B和表3显示,拟合公式6引入RH校正函数后,R2从0.935提升到0.940~0.941,但偏差有所增加,RMSE升至238.51~248.32 μg·m-3ME绝对值增加到19.63~29.89 μg·m-3。事实上,由于拟合公式6已经实现了较低的ME值(3.22 μg·m-3),引入RH函数后很难实现对其ME的进一步优化。从表3可见,相比于拟合公式6-1,拟合公式6-4的R2几乎不变,但RMSEME分别改善至 224.57 μg·m-3、-3.8 μg·m-3。与拟合公式6的相比,拟合公式6-4的R2更高,RMSE更低,ME绝对值略有增加,表明其总体拟合效果更佳。

图5C显示,尽管在个别点上拟合公式6-4偏差更大,但总体上与实际更接近。选取合适的拟合函数并引入相对湿度,有助于提升沙尘浓度的拟合效果。表4对比了各拟合公式在白天和夜间时段下沙尘浓度的拟合效果。白天沙尘浓度拟合的R2更大,而夜间的RMSE更小。这可能是由于白天沙尘浓度的变化区间更大,会出现更高的沙尘浓度,使得拟合值与原始值的绝对偏差更大,导致RMSE更高。从平均误差ME来看,部分拟合公式中白天的ME更小,而其他公式则在夜间更小。综上,沙尘浓度的拟合效果需综合考虑时段、浓度变化范围以及评估指标。

表4   白天及夜间沙尘浓度拟合效果的对比

Table 4  Comparison of performance in each regression function between daytime and nighttime. Bold fonts denote the better performance between them for each index

拟合公式 序号白天夜间
R2RMSEMER2RMSEME
10.915390.1722.790.895148.3286.26
20.917389.3811.960.901122.62-37.51
30.921412.75215.760.905309.51248.12
40.915373.1123.120.915131.23-5.04
50.911388.921.060.914115.84-43.83
60.939310.1515.220.882135.22-8.92
70.939310.788.120.871141.55-18.85
1-10.920375.1321.410.91388.146.53
1-20.912374.99-28.650.91482.84-1.06
1-30.921374.81-22.710.91281.862.42
2-10.917383.5216.670.91288.7529.83
2-20.918382.5417.940.91385.5229.02
2-30.918382.5322.530.91085.7330.87
3-10.901410.1760.140.872218.3637.35
3-20.902422.8960.730.836422.1437.52
3-40.891422.2560.740.836421.5534.76
6-10.901422.2760.540.876421.5434.76
6-20.942331.0658.210.905146.23-8.23
6-30.943318.2443.420.906139.91-1.74
6-40.943339.1272.070.906149.81-16.61

注:加粗代表各个指标对比中更优的时段。

新窗口打开| 下载CSV


3 结论

本文利用北京地区2021年沙尘天气期间PM10浓度(即沙尘浓度)、能见度和相对湿度的逐小时观测资料,在分析三者间相关性的基础上,构建基于能见度和相对湿度估算沙尘浓度的拟合模型,并对拟合效果进行评估。结果表明,沙尘浓度(CPM10)与能见度V存在显著负相关,与相对湿度RH的相关性较弱。进一步分析显示,CPM10V存在非线性关系,其中CPM10V的倒数(V-1)、lg(CPM10)和lg(V)间的相关系数分别可达-0.95、-0.92;相比而言,CPM10RH的关系较复杂,采用指数、对数、幂函数变换后的相关系数绝对值不超过0.36。基于能见度对沙尘浓度进行拟合,采用幂函数和指数函数以及两者组合的分段函数构建了多个拟合公式,其中拟合公式6的拟合效果最优(R2=0.935,RMSE=231.96 μg·m-3ME=3.22 μg·m-3)。在此基础上,引入相对湿度RH校正因子,优化后的拟合公式6-4显示,总体拟合效果得到改进(R2=0.939,RMSE=224.57 μg·m-3ME=-3.8 μg·m-3)。另外,白天和夜间沙尘浓度拟合结果对比显示,白天R2相对较高,而夜间RMSE则较低。

与此前相关研究相比,本文方法通过分析各要素间的相关性并优选多种函数,得到更好的拟合效果,R2更高。此外,本文进一步引入相对湿度RH以提升沙尘浓度的拟合精度。本文的拟合方法具有一定的借鉴意义和推广应用价值。

然而,本文仅基于北京地区2021年观测数据构建拟合模型,数据点较少,因此模型的适用性有待提升。未来可通过采用更多站点和长期观测数据进行拟合以提高模型适用性。此外,本文针对相对湿度的拟合函数相对简单,未来可采用更复杂的函数形式进行改进。同时,结合机器学习等先进算法构建沙尘浓度拟合模型,有望提高拟合准确度。

参考文献

颜明王彩侠王随继.

1958-2007年黄土高原沙尘暴和降雨的时空变化研究

[J].中国沙漠,2013333):850-856.

[本文引用: 1]

刘洪兰张强张俊国.

1960-2012年河西走廊中部沙尘暴空间分布特征和变化规律

[J].中国沙漠,2014344):1102-1108.

Wu CLin ZLiu Xet al.

Can climate models reproduce the decadal change of dust aerosol in East Asia?

[J].Geophysical Research Letters,20184518):9953-9962.

Wu CLin ZShao Yet al.

Drivers of recent decline in dust activity over East Asia

[J].Nature Communications,2022131):7105.

[本文引用: 2]

杨晓军张强叶培龙.

中国北方2021年3月中旬持续性沙尘天气的特征及其成因

[J].中国沙漠,2021413):245-255.

[本文引用: 1]

Yin ZWan YZhang Yet al.

Why super sandstorm 2021 in North China?

[J].National Science Review,202293):nwab165.

[本文引用: 1]

Gui KYao WChe Het al.

Record-breaking dust loading during two mega dust storm events over northern China in March 2021:aerosol optical and radiative properties and meteorological drivers

[J].Atmospheric Chemistry and Physics,20222212):7905-7932.

Chen SZhao DHuang Jet al.

Mongolia contributed more than 42% of the dust concentrations in Northern China in March and April 2023

[J].Advances in Atmospheric Sciences,2023406):1549-1557.

[本文引用: 1]

尹志聪霍芊伊麻晓晴.

触发2023年春季中国北方沙尘暴的沙源累积和天气扰动机制

[J].大气科学学报,2023463):321-331.

[本文引用: 2]

陈思宇杜世康毕鸿儒.

沙尘天气识别和预报方法研究综述

[J].中国沙漠,2024441):11-21.

[本文引用: 1]

中国气象局.地面气象观测规范[M].北京气象出版社2003151.

[本文引用: 1]

陈静赵春生.

大气低能见度的影响因子分析及计算方法综述

[J].气象科技进展,201444):44-51.

[本文引用: 2]

李彬卢士庆孙小龙.

可见光波段灰度熵和热红外亮温差的沙尘遥感判识

[J].遥感学报,2018224):647-657.

[本文引用: 1]

张鹏王春姣陈林.

沙尘气溶胶卫星遥感现状与需要关注的若干问题

[J].气象,2018446):725-736.

高泽田胡秀清张小曳.

基于FY-4A卫星遥感数据分析2021年3次沙尘暴特征

[J].气象科技,2022504):536-544.

[本文引用: 1]

Borjigin ABueh CYong Met al.

Cross-border sand and dust storms between Mongolia and northern china in spring and their driving weather systems

[J].Remote Sensing,20241612):2164.

[本文引用: 1]

周自江王锡稳牛若芸.

近47年中国沙尘暴气候特征研究

[J].应用气象学报,20022):193-200.

Shao YYang YWang Jet al.

Northeast Asian dust storms:real-time numerical prediction and validation

[J].Journal of Geophysical Research:Atmospheres,2003108D22):4691.

[本文引用: 4]

钱正安蔡英刘景涛.

中蒙地区沙尘暴研究的若干进展

[J].地球物理学报,20061):83-92.

[本文引用: 1]

Wang Y QZhang X YGong S Let al.

Surface observation of sand and dust storm in East Asia and its application in CUACE/Dust

[J].Atmospheric Chemistry and Physics,200883):545-553.

[本文引用: 5]

郑淏薛惠锋李养养.

基于K-means聚类的沙尘天气快速识别技术研究

[J].中国环境监测,2020365):130-137.

[本文引用: 1]

王蕾蒙瑞丽曹磊.

2016-2020年沙尘天气对陕西省空气质量的影响特征

[J].中国沙漠,2022424):130-138.

段赛男焦瑞莉吴成来.

一种基于K-means聚类算法的沙尘天气客观识别方法

[J].气候与环境研究,2024292):178-192.

[本文引用: 1]

王建华于鹏孙俊.

相似分析在空气连续监测缺测资料插补处理中的应用

[J].中国环境监测,20003):32-34.

[本文引用: 1]

Chen MZhu HChen Yet al.

A novel missing data imputation approach for time series air quality data based on logistic regression

[J].Atmosphere,2022137):1044.

Zhang HNie YDeng Qet al.

Spatio-temporal changes in air quality of the urban area of Chongqing from 2015 to 2021 based on a missing-data-filled dataset

[J].Atmosphere,2022139):1473.

[本文引用: 1]

Zhang XGui KZeng Zet al.

Mapping the seamless hourly surface visibility in China:a real-time retrieval framework using a machine-learning-based stacked ensemble model

[J].NPJ Climate and Atmospheric Science,202471):68.

[本文引用: 1]

Song ZWang JWang S.

Quantitative classification of northeast Asian dust events

[J].Journal of Geophysical Research:Atmospheres,2007112D4):4211.

[本文引用: 3]

Wu CLin ZLiu Xet al.

Description of dust emission parameterization in CAS‐ESM2 and its simulation of global dust cycle and East Asian dust events

[J].Journal of Advances in Modeling Earth Systems,20211310):e2020MS002456.

[本文引用: 2]

Wang XZhang RYu W.

The effects of PM2.5 concentrations and relative humidity on atmospheric visibility in Beijing

[J].Journal of Geophysical Research:Atmospheres,20191244):2235-2259.

[本文引用: 1]

樊高峰马浩张小伟.

相对湿度和PM2.5浓度对大气能见度的影响研究:基于小时资料的多站对比分析

[J].气象学报,2016746):959-973.

[本文引用: 1]

Ji DDeng ZSun Xet al.

Estimation of PM2.5 mass concentration from visibility

[J].Advances in Atmospheric Sciences,202037671-678.

[本文引用: 1]

Gui KChe HZeng Zet al.

Construction of a virtual PM2.5 observation network in China based on high-density surface meteorological observations using the Extreme Gradient Boosting model

[J].Environment International,2020141105801.

Zeng ZGui KWang Zet al.

Estimating hourly surface PM2.5 concentrations across China from high-density meteorological observations by machine learning

[J].Atmospheric Research,2021254105516.

Zhong JZhang XGui Ket al.

Robust prediction of hourly PM2.5 from meteorological data using LightGBM

[J].National Science Review,2021810):nwaa307.

[本文引用: 1]

王继康张恒德桂海林.

能见度与PM2.5浓度关系及其分布特征

[J].环境科学,2019407):2985-2993.

[本文引用: 1]

Levenberg K.

A method for the solution of certain non-linear problems in least squares

[J].Quarterly of Applied Mathematics,194422):164-168.

[本文引用: 1]

Marquardt D W.

An algorithm for least-squares estimation of nonlinear parameters

[J].Journal of the Society for Industrial and Applied Mathematics,1963112):431-441.

[本文引用: 1]

Krause PBoyle D PBäse F.

Comparison of different efficiency criteria for hydrological model assessment

[J].Advances in Geosciences,2005589-97.

[本文引用: 1]

Liu FWu HZhao Yet al.

Mapping high resolution national soil information grids of China

[J].Science Bulletin,2022673):328-340.

Tong P FChen S XTang C Y.

Detecting and evaluating dust‐events in north china with ground air quality data

[J].Earth and Space Science,202291):e2021EA001849.

[本文引用: 1]

/