基于能见度和相对湿度估算沙尘浓度的模型构建与检验
1.
2.
3.
Development and validation of a regression model for estimating dust concentration from visibility and relative humidity
1.
2.
3.
通讯作者:
收稿日期: 2024-10-29 修回日期: 2025-01-17
基金资助: |
|
Received: 2024-10-29 Revised: 2025-01-17
作者简介 About authors
海登科(2000-),男,黑龙江齐齐哈尔人,硕士研究生,主要研究方向为气象环境数据智能分析与应用E-mail:
关键词:
Keywords:
本文引用格式
海登科, 焦瑞莉, 吴成来, 邹杰, 许永芳, 段赛男.
Hai Dengke, Jiao Ruili, Wu Chenglai, Zou Jie, Xu Yongfang, Duan Sainan.
0 引言
传统的气象观测通常利用能见度来判断沙尘天气[11]。由于沙尘粒子对大气具有消光作用[12],因此通过监测能见度的变化,可以有效识别出沙尘天气。从1949年至今,中国已经建立了较完善的气象观测站网[4,13-15]。随着遥感观测技术的发展,卫星观测也成为沙尘天气监测的主要手段。特别是对于大范围以及人迹罕至的区域(如沙漠腹地等),卫星观测具有不可替代的作用[16-19]。然而不管是传统的气象观测抑或是卫星观测,都很难直接得到沙尘浓度。由于沙尘浓度能直接关联污染强度以及对人类健康的影响,因此沙尘浓度的监测越来越受到重视。2000年前后,中国开始在部分气象台站增加大气颗粒物(PM10、PM2.5)浓度的观测,建立了包含19个站点的中国北方沙尘天气监测网[20]。2010年以来,中国生态环境监测总站也逐渐建立了中国城市大气环境监测网,实现了在全国300多个城市、2000多个站点观测大气颗粒物(PM10、PM2.5)浓度,所获取资料已被广泛用于沙尘天气的实时监测和过程分析中[6,8-9,21-23]。
尽管地面台站已能实时监测沙尘浓度(为了简化,本文中将沙尘天气期间PM10浓度称为沙尘浓度),然而受限于观测仪器稳定性等因素,沙尘浓度监测时有缺失[24-26],因此,能见度监测仍然是识别沙尘天气的常用手段。不过由于能见度与沙尘浓度之间存在关联性,即在假设沙尘粒子具有特定的粒径分布的前提下,可通过沙尘浓度计算其消光系数,从而推导出能见度[12]。因此能见度与沙尘浓度可以互相转化,从而弥补沙尘浓度缺测的不足。对此,已有不少学者基于沙尘浓度与能见度的观测资料构建了两者的关系模型[18,20,27-28]。利用构建的模型,基于气象站点观测的能见度资料可估算得到沙尘浓度,并用于确定不同沙尘天气等级下的沙尘浓度[20,29]和评估验证数值模式的模拟预报结果[18,29]。
1 数据与方法
1.1 数据来源
采用数据包括北京地区气象站观测的能见度、相对湿度等气象要素以及中国环境观测总站观测的PM10、PM2.5浓度资料。时间范围为2021年全年,时间分辨率为1 h。北京气象站点观测数据来自54511站,该站位于39°48′N、116°28′E,观测海拔31.3 m。根据中国气象局《地面气象自动观测规范》(2020年),能见度观测采用前向散射能见度仪进行自动观测,观测范围为0.01~30 km,分辨率为0.001 km(即1 m),准确度为±10%(≤1.5 km)、±20%(>1.5 km);相对湿度采用进行自动观测,观测范围为0~100% (即0~1),分辨率为1%,准确度为±3%(≤80%)、±5%(>80%)。需要说明的是,由于2013—2014年气象站点能见度观测由人工观测逐步转换为自动观测,2015年之后全部为自动观测,而人工观测能见度和自动观测能见度存在一定的差别[36],因此本文基于自动观测能见度得到的拟合公式不能直接用于人工观测能见度估算沙尘浓度。
PM10、PM2.5浓度数据来源于中国环境监测总站的全国城市空气质量实时发布平台,选择站点为距离54511站最近的大兴旧宫站。该站点位于39°87′N、116°35′E,观测海拔37.5 m,距离54511站2 km。
1.2 沙尘天气的识别
本文重点分析沙尘天气期间大气颗粒物浓度与气象要素的关联性。沙尘天气下,PM10浓度明显增加,与PM2.5浓度的比值会显著增加。故综合考虑PM10浓度以及PM10与PM2.5比值两个要素作为沙尘天气的判断条件。具体来讲,沙尘天气的判断标准为PM10浓度大于250 μg·m-3且PM10浓度与PM2.5浓度的比值大于2.1。对2021年全年有效观测数据进行判断,得到所有沙尘天气发生时段共计182 h,非沙尘天气共7 795 h。进一步分析发现,182 h沙尘天气数据主要在春季,共有141 h(占总数的77%);另外,冬季、秋季分别有38、3 h,夏季无沙尘天气记录。
另一方面,从昼夜分布来看(定义06:00—18:00为白天,其余时间为夜间)。182 h沙尘天气中,白天、夜间分别有83、99 h,分别占54%、46%。白天沙尘天气期间的PM10浓度为251~7 468 μg·m-3(平均值为824 μg·m-3),而夜间沙尘天气期间的浓度为250~2 272 μg·m3(平均值为433 μg·m-3)。总体上看前者高于后者,这可能是由于白天风速较高、相对湿度较低,导致白天沙尘天气期间的PM10浓度较高。
需要说明的是,本文中PM2.5浓度只是用于识别沙尘天气中;当识别出沙尘天气后,将重点分析沙尘天气期间PM10浓度与气象要素的关联性并据此构建基于气象要素估算沙尘浓度的模型。
在图和表中使用
1.3 要素间的关联性分析方法
采用皮尔逊相关系数r(以下简称相关系数)衡量不同要素间的关联性:
式中:
考虑到沙尘浓度与能见度(V)、相关湿度(RH)等各个气象要素间并非为简单的线性关系,因此将沙尘浓度、能见度、相对湿度等各个变量采用常用的函数如幂函数、对数进行变换并计算变换后的相关系数。
1.4 拟合公式的构建与评估方法
在计算各个要素(原始数据或转换后数据)间的相关系数基础上,构建沙尘浓度与能见度、相关湿度等各个气象要素间的非线性拟合公式。选用的变量组合主要根据相关系数进行选择。
对于设定的拟合函数,使用最小二乘法拟合参数。其主要思想是通过寻求最合适的系数以最小化模型估计值和实际值之间残差平方和。假设有一个由参数
式中:n是数据点总数;
本文首先选择对沙尘浓度关联度最高的要素进行拟合,然后依次添加关联度次高的要素,最终构建包含多个气象要素的沙尘浓度拟合模型。另外,为了使构建的拟合公式符合物理含义,拟合值的变化范围需满足以下条件:能见度趋于0时,对应的PM10浓度趋于正无穷;能见度趋于正无穷时,对应的PM10浓度应趋于0。
决定系数(R2)是统计学中用于评估回归模型解释变量变异能力的重要指标。其通过比较观测值与拟合值之间的相关性来衡量模型的拟合效果。取值范围在0到1之间。
均方根误差(RMSE)用于量化模型拟合值与实际观测值之间的偏差。RMSE能够直观地表示误差的平均大小,但其对较大的误差具有较高的敏感性。
平均误差(ME),也称为偏差,用于量化模型拟合值与实际观测值之间的平均差别。
式中:
即对应给定的函数,采用非线性最小二乘法拟合时,
2 结果与分析
2.1 沙尘浓度与能见度、相对湿度的关联性
从图1可以看出,沙尘浓度与能见度呈明显的负相关;随着能见度的升高,沙尘浓度从7 468 μg·m-3逐渐减小到250~300 μg·m-3。相比而言,沙尘浓度与相对湿度呈弱反相关关系(r为-0.26),主要是由于沙尘浓度大于500 μg·m-3时相对湿度较小(小于0.25),而沙尘浓度小于500 μg·m-3对应的相对湿度在0.05~0.7变化,表明强沙尘天气期间空气更为干燥,体现了上游的干冷空气对沙尘的输送作用。相比而言,沙尘天气期间,能见度和相对湿度间无明显相关关系。
图1
图1
沙尘浓度与能见度、相对湿度散点图
Fig. 1
Scatter plot of PM10 concentration vs. visibility and relative humidity
沙尘浓度(
图2
图2
沙尘浓度和能见度经对数、指数和幂函数变换后的散点图
Fig.2
Scatter plots of dust concentration vs. visibility transformed by logarithmic, exponential, and power functions
对
总体上看,通过对
2.2 基于能见度估算沙尘浓度的拟合模型
图3
表1 基于能见度构建的沙尘浓度拟合公式及其评估指标结果
Table 1
拟合公 式序号 | 拟合公式 | R2 | RMSE | ME |
---|---|---|---|---|
1 | 0.909 | 285.29 | -57.31 | |
2 | 0.908 | 278.06 | -14.94 | |
3 | 0.915 | 364.99 | 233.34 | |
4 | 0.913 | 269.76 | 10.34 | |
5 | 0.909 | 276.19 | -23.34 | |
6 | 0.935 | 231.96 | 3.22 | |
7 | 0.934 | 234.13 | 3.90 |
相比之下,基于指数函数的拟合
由于单一函数难以在各能见度期间均取得良好效果,故本文在上述公式的基础上构建2个分段的分段函数。2个分段的函数分别使用幂函数(
为确保分段函数每段有足够的数据点进行拟合,故每段至少有10%的数据点(即至少有18个数据点)。将分界点V0设置在2~12,以0.001的步长递增,并分别采用幂函数或指数函数对区间(0,V0]和[V0,16]进行拟合,同时确保在V0处的连续性。选取每个区间内残差平方和最小的拟合公式作为该区间的最优公式,并将各段最优公式组合,构建出最佳分段函数。得到的4组分段函数公式如表1中拟合公式
图4
图4
引入分段函数前后拟合效果对比
Fig.4
Comparison of fitting performance before and after introducing piecewise functions
在大部分点,拟合
尽管单要素拟合可得到不错的拟合结果,但仍然存在一定的偏差。
2.3 考虑相对湿度校正的沙尘浓度估算模型
表2 沙尘浓度比例因子 f 与相对湿度 RH 间的相关系数
Table 2
相对 湿度 | 基于拟合公式1得到的f | |||
---|---|---|---|---|
lg( f ) | exp( f ) | ( f ) n | ||
RH | -0.52 | -0.50 | -0.51 | -0.52 (n=1.25) |
lg(RH) | -0.54 | -0.51 | — | — |
exp(RH) | -0.50 | — | — | — |
RHn | -0.54 (n=-0.08) | — | — | — |
相对 湿度 | 基于拟合 | |||
lg( f ) | exp( f ) | ( f ) n | ||
RH | -0.48 | -0.46 | -0.47 | -0.48 (n=1.17) |
lg(RH) | -0.50 | -0.48 | — | — |
exp(RH) | -0.46 | — | — | — |
RHn | -0.50 (n=-0.09) | — | — | — |
相对 湿度 | 基于拟合 | |||
lg( f ) | exp( f ) | ( f ) n | ||
RH | -0.18 | -0.1 | -0.25 | -0.21(n=-1.9) |
lg(RH) | -0.21 | -0.13 | — | — |
exp(RH) | -0.17 | — | — | — |
RHn | 0.21(n=-0.01) | — | — | — |
相对 湿度 | 基于拟合 | |||
lg( f ) | exp( f ) | ( f ) n | ||
RH | -0.42 | -0.42 | -0.42 | -0.43 (n=0.82) |
lg(RH) | -0.44 | -0.42 | — | — |
exp(RH) | -0.42 | — | — | — |
RHn | 0.44 (n=-0.01) | — | — | — |
表2显示,拟合
根据表2的结果,除拟合
对于分段函数,采用同样的方法将基于f得到的拟合公式与拟合
表3 基于能见度 V 和相对湿度 RH 构建的沙尘浓度拟合公式及其评估指标结果
Table 3
拟合公式序号 | 拟合公式 | R² | RMSE | ME |
---|---|---|---|---|
1-1 | 0.918 | 261.53 | -5.61 | |
1-2 | 0.919 | 260.26 | -7.04 | |
1-3 | 0.919 | 260.18 | -6.50 | |
2-1 | 0.916 | 266.46 | 22.95 | |
2-2 | 0.916 | 265.25 | 22.55 | |
2-3 | 0.916 | 265.23 | 22.12 | |
3-1 | 0.888 | 331.53 | -95.77 | |
3-2 | 0.890 | 331.09 | -98.76 | |
3-3 | 0.889 | 337.63 | -107.22 | |
3-4 | 0.888 | 334.36 | -99.86 | |
6-1 | 0.940 | 248.32 | -29.89 | |
6-2 | 0.941 | 238.51 | -19.63 | |
6-3 | 0.941 | 244.8 | -28.56 | |
6-4 | 0.939 | 224.57 | -3.8 |
图5
图5
基于能见度V和相对湿度RH构建的沙尘浓度拟合公式效果对比
Fig. 5
Comparison of fitting results for dust concentration models based on visibility (V) and relative humidity (RH)
图5A显示,引入RH校正因子(拟合公式
表4 白天及夜间沙尘浓度拟合效果的对比
Table 4
拟合公式 序号 | 白天 | 夜间 | |||||
---|---|---|---|---|---|---|---|
R2 | RMSE | ME | R2 | RMSE | ME | ||
1 | 0.915 | 390.17 | 22.79 | 0.895 | 148.32 | 86.26 | |
2 | 0.917 | 389.38 | 11.96 | 0.901 | 122.62 | -37.51 | |
3 | 0.921 | 412.75 | 215.76 | 0.905 | 309.51 | 248.12 | |
4 | 0.915 | 373.11 | 23.12 | 0.915 | 131.23 | -5.04 | |
5 | 0.911 | 388.92 | 1.06 | 0.914 | 115.84 | -43.83 | |
6 | 0.939 | 310.15 | 15.22 | 0.882 | 135.22 | -8.92 | |
7 | 0.939 | 310.78 | 8.12 | 0.871 | 141.55 | -18.85 | |
1-1 | 0.920 | 375.13 | 21.41 | 0.913 | 88.14 | 6.53 | |
1-2 | 0.912 | 374.99 | -28.65 | 0.914 | 82.84 | -1.06 | |
1-3 | 0.921 | 374.81 | -22.71 | 0.912 | 81.86 | 2.42 | |
2-1 | 0.917 | 383.52 | 16.67 | 0.912 | 88.75 | 29.83 | |
2-2 | 0.918 | 382.54 | 17.94 | 0.913 | 85.52 | 29.02 | |
2-3 | 0.918 | 382.53 | 22.53 | 0.910 | 85.73 | 30.87 | |
3-1 | 0.901 | 410.17 | 60.14 | 0.872 | 218.36 | 37.35 | |
3-2 | 0.902 | 422.89 | 60.73 | 0.836 | 422.14 | 37.52 | |
3-4 | 0.891 | 422.25 | 60.74 | 0.836 | 421.55 | 34.76 | |
6-1 | 0.901 | 422.27 | 60.54 | 0.876 | 421.54 | 34.76 | |
6-2 | 0.942 | 331.06 | 58.21 | 0.905 | 146.23 | -8.23 | |
6-3 | 0.943 | 318.24 | 43.42 | 0.906 | 139.91 | -1.74 | |
6-4 | 0.943 | 339.12 | 72.07 | 0.906 | 149.81 | -16.61 |
3 结论
本文利用北京地区2021年沙尘天气期间PM10浓度(即沙尘浓度)、能见度和相对湿度的逐小时观测资料,在分析三者间相关性的基础上,构建基于能见度和相对湿度估算沙尘浓度的拟合模型,并对拟合效果进行评估。结果表明,沙尘浓度(
与此前相关研究相比,本文方法通过分析各要素间的相关性并优选多种函数,得到更好的拟合效果,R2更高。此外,本文进一步引入相对湿度RH以提升沙尘浓度的拟合精度。本文的拟合方法具有一定的借鉴意义和推广应用价值。
然而,本文仅基于北京地区2021年观测数据构建拟合模型,数据点较少,因此模型的适用性有待提升。未来可通过采用更多站点和长期观测数据进行拟合以提高模型适用性。此外,本文针对相对湿度的拟合函数相对简单,未来可采用更复杂的函数形式进行改进。同时,结合机器学习等先进算法构建沙尘浓度拟合模型,有望提高拟合准确度。
参考文献
1960-2012年河西走廊中部沙尘暴空间分布特征和变化规律
[J].
Can climate models reproduce the decadal change of dust aerosol in East Asia?
[J].
Drivers of recent decline in dust activity over East Asia
[J].
Why super sandstorm 2021 in North China?
[J].
Record-breaking dust loading during two mega dust storm events over northern China in March 2021:aerosol optical and radiative properties and meteorological drivers
[J].
Mongolia contributed more than 42% of the dust concentrations in Northern China in March and April 2023
[J].
沙尘气溶胶卫星遥感现状与需要关注的若干问题
[J].
Cross-border sand and dust storms between Mongolia and northern china in spring and their driving weather systems
[J].
近47年中国沙尘暴气候特征研究
[J].
Northeast Asian dust storms:real-time numerical prediction and validation
[J].
Surface observation of sand and dust storm in East Asia and its application in CUACE/Dust
[J].
2016-2020年沙尘天气对陕西省空气质量的影响特征
[J].
A novel missing data imputation approach for time series air quality data based on logistic regression
[J].
Spatio-temporal changes in air quality of the urban area of Chongqing from 2015 to 2021 based on a missing-data-filled dataset
[J].
Mapping the seamless hourly surface visibility in China:a real-time retrieval framework using a machine-learning-based stacked ensemble model
[J].
Quantitative classification of northeast Asian dust events
[J].
Description of dust emission parameterization in CAS‐ESM2 and its simulation of global dust cycle and East Asian dust events
[J].
The effects of PM2.5 concentrations and relative humidity on atmospheric visibility in Beijing
[J].
Estimation of PM2.5 mass concentration from visibility
[J].
Construction of a virtual PM2.5 observation network in China based on high-density surface meteorological observations using the Extreme Gradient Boosting model
[J].
Estimating hourly surface PM2.5 concentrations across China from high-density meteorological observations by machine learning
[J].
Robust prediction of hourly PM2.5 from meteorological data using LightGBM
[J].
A method for the solution of certain non-linear problems in least squares
[J].
An algorithm for least-squares estimation of nonlinear parameters
[J].
Comparison of different efficiency criteria for hydrological model assessment
[J].
Mapping high resolution national soil information grids of China
[J].
Detecting and evaluating dust‐events in north china with ground air quality data
[J].
/
〈 |
|
〉 |
