img

官方微信

高级检索

中国沙漠, 2021, 41(5): 21-32 doi: 10.7522/j.issn.1000-694X.2021.00042

U-Net深度卷积神经网络在沙脊线提取中的应用

高博钰,, 杨波,, 张德国

浙江大学 地球科学学院,浙江 杭州 310027

Extracting the sand dune crest lines from satellite images using U-Net deep convolutional neural network

Gao Boyu,, Yang Bo,, Zhang Deguo

School of Earth Sciences,Zhejiang University,Hangzhou 310027,China

通讯作者: 杨波(E-mail: 0016220@zju.edu.cn

收稿日期: 2021-01-25   修回日期: 2021-04-13  

基金资助: 国家自然科学基金项目.  41771022
国家重点研发计划项目.  2018YFC0603604

Received: 2021-01-25   Revised: 2021-04-13  

作者简介 About authors

高博钰(1995—),男,河南洛阳人,硕士研究生,主要从事人工智能地球物理反演研究E-mail:21838031@zju.edu.cn , E-mail:21838031@zju.edu.cn

摘要

沙丘形态演变过程记录着近地表风况与环境演化的历史,然而对其特征研究一直受限于大范围沙脊线提取效率低和成本高等问题。本文基于深度卷积神经网络搭建U-Net模型,实现批量、高精度沙脊线的提取。将数据增强技术、随机失活神经元、批标准化以及迁移学习技术应用于模型训练和参数更新,使得模型的精度更高。结果表明:U-Net模型以及各种策略能够高效、精确地识别遥感影像中的沙脊线;沙脊线走向的偏移与近地表风况变化有着很好的对应关系, U-Net模型可以有效地用于区域性的沙脊线走向分析。

关键词: 深度卷积神经网络 ; U-Net ; 沙脊线 ; 近地表风况

Abstract

The evolution process of dune morphology records the history of near-surface wind conditions and environmental evolution, but its characteristic research has been limited by the inefficient and high cost of extracting large-scale dune crest lines. For this reason, this paper builds a U-Net model based on the deep convolutional neural network for batch and high-precision extraction. In order to obtain the best extraction results, the enhancement technology in data preprocessing, random neurons inactivation, batch normalization and transfer learning technology have been applied to the training and parameters updating, making the prediction accuracy of the model higher. The results show that the model and various strategies used in this paper can efficiently and accurately identify the dune crest lines in remote sensing images. In addition, through the application study of the orientation of the dune crest lines extracted from the trained model, we can find the shift of the dune crest lines orientation has a good correspondence with the change of near-surface wind regime, and it is confirmed that the U-Net model can be effectively used in regional dune orientation analysis.

Keywords: deep convolutional neural network ; U-Net ; dune crest lines ; near-surface wind regime

PDF (16175KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

高博钰, 杨波, 张德国. U-Net深度卷积神经网络在沙脊线提取中的应用. 中国沙漠[J], 2021, 41(5): 21-32 doi:10.7522/j.issn.1000-694X.2021.00042

Gao Boyu, Yang Bo, Zhang Deguo. Extracting the sand dune crest lines from satellite images using U-Net deep convolutional neural network. Journal of Desert Research[J], 2021, 41(5): 21-32 doi:10.7522/j.issn.1000-694X.2021.00042

0 引言

风成沙丘的形态是近地表风况与沙质地表相互作用的结果,其形成发育过程受地形(地面起伏)、地面物质组成(沙源供应情况)和地表植被覆盖等外界因素的影响1。风是塑造沙丘形态的动力因素。换言之,沙丘的形态记录了近地表合成风况的演变历史。因此,量化沙丘形态与近地表风况之间的关系成为研究沙漠地区近地表风场变化历史的关键。随着卫星遥感影像与地面风况资料的完善与公开,沙丘形态与近地表风况之间关系的半定量和定量研究成为了可能2。在早期的研究中,沙丘主要依据其形态与落沙坡面的个数分为5种形态:新月形、线性、反向形、抛物线形和星形3-4。这种主要局限于沙丘形态的分类,无法真正地实现两者关系的定量重建。Hunter等5依据沙脊线走向与起沙风合成风向之间的关系,将沙丘形态依次分为横向型、斜向型和纵向型,解决了沙丘形态量化的问题。基于这些认识,Rubin等6对沙脊线走向与起沙风合成方向之间的关系进行了数学方法提升,提出了最大总输沙量(Gross Bedform-normal Transport)数学模型,实现了沙脊线走向与近地表主导风向之间的量化研究。随后,Werner等7在沙脊线走向方面的工作优化了Rubin数学模型中斜向沙丘与横向沙丘的过渡区域。在数学模型研究的基础上,Fenton等8以人工肉眼识别的方式大量统计了美国Great Sand Dune沙漠中不同形态沙脊线的平均走向,并将其与数学方法模型估算的近地表主导风向进行了比对研究,深入探讨了这一区域的近地表风场与不同形态沙脊线走向之间的对应关系。尽管沙脊线走向的统计研究已成功应用到沙丘场的近地表风况重建研究中,但是人工识别方法的低效率和高成本问题限制了该类方法的广泛应用和发展。

随着遥感卫星影像数据量的激增和图像分析方法的提高,沙丘形态特征的提取方法逐渐由原来的肉眼识别和手工绘制转变为半自动大规模的提取分析方式,为研究风积地貌形态的演化过程及其环境驱动因素提供了大量的数据支持并深化了科学认识。例如:Telfer等9通过中高分辨率光学卫星遥感影像的沙脊线目标识别方法,成功提取了大范围的纵向沙丘的脊线走向;Scuderi10将澳大利亚纵向沙脊线考虑为人类指纹,并利用指纹识别系统成功提取和分析了纵向沙脊线的走向、Y型链接和缺陷密度。蒋缠文等11基于MATLAB平台的图像处理算法,利用遥感影像图中沙脊线两侧的迎风坡和落沙坡在灰度图像中存在明暗差异,识别提取沙脊线。该方法在沙脊线两侧明暗对比明显、无植被干扰的区域有较好的效果。这些沙脊线的提取方法通常是基于某个阈值的图形分析,在植被分布较多的沙地景观中提取效果不佳。为此,本文试图将近年来快速发展的深度学习方法应用于沙脊线的识别和提取,为从卫星遥感影像中大范围、自动化获取沙脊线数据提供新的思路和方法。

深度学习是人工智能领域有监督学习方法的一个分支。它基于人工神经网络,从数据中发现规律、学习规律,并将规律应用到同类型的新数据中。传统的人工神经网络通常只有输入层、中间层和输出层,且每层神经元数量较少,因而其学习能力十分有限,只能用于解决具有线性规律的简单问题。近年来,随着计算机硬件的快速发展,复杂的大规模、非线性人工神经网络模型应运而生。新一代的人工神经网络模型不仅层数增多、每层神经元个数也大量增加,而且在模型结构设计上也更为复杂。因此,LeCun等12将这种网络层数更多(即深度更深)、模型复杂度更高的神经网络称作深度神经网络,相应的机器学习算法称为“深度学习(Deep Learning)”。目前,深度学习方法应用最广的方向是监督学习,其中最具代表性的领域是图像处理和自然语言处理。前者主要使用深度卷积神经网络(Deep Convolutional Neural Networks,DCNN),后者主要使用循环神经网络(Recurrent Neural Network, RNN)。本文待处理的数据为卫星遥感影像,故使用深度卷积神经网络是合适的。

目前深度卷积神经网络在遥感科学、地球物理学等领域已有不少成功的应用:柳潜13基于深度卷积神经网络实现了遥感图像的场景分类;Ma等14利用全卷积神经网络完成遥感影像云的定量检测;陈冠宇等15利用深度卷积神经网络实现对各种地质体的识别与分类;张玉玺等16基于卷积神经网络搭建编码-解码器框架进行目标定位,成功在二维、三维盐丘数据中定位了盐丘对象。此外,深度卷积神经网络还在断层识别17-19、区域构造识别20、考古目标检测21等原本依赖大量人力投入的领域取得极有前景的进展。

本文利用深度卷积神经网络批量提取卫星遥感影像中的沙脊线,并将提取结果用于进一步分析研究区沙漠的近地表风况。为达到沙脊线自动提取的目标,本文在Tensorflow2.2平台(简称为TF2.2)下搭建并训练了具有“像素级”图像特征提取能力的U-Net模型,通过数据增强、随机失活神经元、批标准化及迁移学习等策略优化模型,最终实现高精度的沙脊线自动提取。本文所指的沙脊线为沙脊线及其背风区域。该区域不仅与沙脊线走向一致,且为后期进一步提取沙丘高度、背风坡长度等信息做好了铺垫。

1 研究方法与数据

基于深度卷积神经网络识别并提取沙脊线的基本步骤是:①选取研究区部分分块卫星影像图,人工识别沙脊线并制作带标签(人工标注的沙脊线)的训练和验证样本集;②设计合适的网络结构和参数,搭建U-Net模型;③在训练集上训练网络模型,在验证集上评估训练结果并根据反馈来调整网络参数以获取更高的提取精度;④将研究区剩余待识别的卫星影像图输入训练好的U-Net模型,批量输出沙脊线提取结果。

1.1 样本集建立

选取的研究区位于腾格里沙漠西南缘,经纬度范围为37.647°—37.958°N、103.197°—103.714°E(图1A)。使用Google Earth Engine平台下载了研究区2018年10月Landsat-7卫星拍摄的17级精度卫星影像,空间分辨率为2.39 m,为24 064×14 463像素的RGB三通道彩色图像。为了标准化神经网络的输入图像尺寸并有利于后续深度卷积神经网络进行卷积操作,将原始图像划分成256×256像素的一系列子图,总计5 358张。从中随机抽取500张(约10%)作为训练和验证样本集,余下部分作为网络的测试样本集。

图1

图1   研究区及样本集标签示例(A为研究区地理位置;B—G为研究区内3种典型沙脊线样本及对应的人工标注情况)

Fig.1   Study area and examples of dataset


在人工标注沙脊线过程中需要获得所有训练和验证样本集图像中沙脊线所在的像素点位置(即样本的标签)。为此,可利用Photoshop软件或类似工具,对训练和验证集的图像进行人工、逐张、像素级的标签制作(肉眼识别并标记卫星影像图中的沙脊线像素点)。如图1所示:B、D、F为分块后的卫星影像子图样本;C、E、G分别为手工标记的相应的沙脊线标签:黄绿色像素点数值为1,表示为沙脊线;白色为背景,其数值为0。在实际手工制作标签的过程,部分样本可能存在沙脊线边界模糊而难以准确识别的情况。对此,在进行标签制作时,人工识别图像中的沙脊线应尽可能遵循同样的判断标准,以保证标签的判别准则对于整个研究区是一致的。高质量的标签样本集是提高神经网络模型识别精度的关键因素之一。

除了人工目视并手工标注沙脊线方法外,还可借助已有的传统基于图像处理的方法(如蒋缠文等11),对选定的测试集和验证集进行初步处理。对于沙脊线图像特征明显的样本,图像处理的方法即可自动化获得可用的标注;对于受到干扰因素影响的样本,则可进一步人工目视处理。这样,仅需要人工标注少量包含干扰因素的样本,即可建立训练样本集。

1.2 U-Net模型结构

从计算机视觉领域来看,沙脊线识别提取任务属于图像的语义分割。Long等22提出的全卷积神经网络(Fully Convolutional Network,FCN)是近年来能实现较高精度像素级图像语义分割的重要进展。之后,Ronneberger等23基于全卷积神经网络,在卷积部分和对称的上采样部分之间新加入了“跳跃连接(Skip Connection)”操作,提出了U-Net模型,进一步提高了图像语义分割的精确度。目前,在医学影像语义分割领域,U-Net的识别精度甚至超过了人类24-25。因此,本文选用U-Net模型作为沙脊线提取的深度学习方案。

图2为本文基于深度卷积神经网络搭建的U-Net模型,该网络结构因类似对称的“U”形而得名。该网络共有23层:第1层和最后1层为输入和输出层;中间层包括5次最大值池化操作、5次上采样操作以及5次跳跃连接操作(黑色虚线);12次的“卷积层 + 神经元随机失活 + 批标准化”操作。整个网络模型的结构及操作都高度对称。输入层的输入数据大小与待识别的卫星影像子图的大小一致,均为256×256像素,深度为3,即为图像各像素的R、G、B值。输出层的输出数据大小也是256×256像素,但深度为1,即每个像素点值代表该点是沙脊线的概率。网络整体可分为左、右两个部分:①左半部分为“卷积部分”,负责对图像进行特征提取;②右半部分为“上采样部分”,负责根据卷积部分提供的特征数据进行图像的尺寸恢复和标签预测。在左、右两部分对称的各层之间,还加入了“跳跃连接”操作,目的是为右半部分的恢复和标签预测提供更多有效的参考信息。

图2

图2   U-Net模型结构

Fig.2   The structure of the U-net


卷积计算是深度卷积神经网络的基本组成部分。如图3所示:卷积计算首先对原始数据进行0值扩边,以保证卷积计算后的尺寸不变;之后,卷积核与扩边后的数据进行从左到右、从上到下的滑动点乘求和,滑动步长为1,即可得到卷积结果。由此可见,卷积结果由卷积核内的数值决定,不同的卷积核数值会得到不同的卷积结果。

图3

图3   卷积、最大值池化与上池化操作举例

Fig.3   An example of Convolution, Max-pooling, and Up-pooling operations


网络中,很多卷积计算结合在一起构成一个卷积层。卷积层利用其内部不同数值的卷积计算提取图像中不同的特征信息。实际上,卷积计算是一种滤波,不同的卷积核可以理解为不同的滤波器。滤波器可以滤除其输入数据中的无关干扰信息(即背景),输出与标签(即沙脊线)相关的有效信息。网络在训练前,所有滤波器的系数(各个卷积核内的数值)是随机初始化的。经过训练之后,滤波器的系数即被赋予了可提取由样本及其标签所描述的特定特征的能力。图4表明,不同特征反映在图像中的相同像素点位置的像素值(颜色)不同;部分卷积核对于沙脊线弯曲信息很敏感,部分卷积核更关注沙脊线宽度信息。由于这些特征图都经历过归一化操作,故看起来在“色域”上跨度不大。卷积层提取出的不同特征会被“平行”地堆放在一起,使得图像的“厚度”不断叠加。如图2中左半部分,输入图像的最初厚度为3,经过卷积部分后厚度变为2 048。

图4

图4   训练好的U-Net模型中第一个卷积层中64个卷积核对一张输入图像的特征提取结果(提取到的不同的特征表现为图中不同的颜色)

Fig.4   An input image's feature extraction results of the 64 convolution kernels in the first layer of the trained U-net


在训练过程中,为了网络可以更稳定地收敛,加入了神经元随机失活(Dropout)和批标准化(Batch Normalization)操作。神经元随机失活操作是防止卷积层过分提取特征的一种常见操作:它设定每次随机冻结卷积层中固定比例的卷积核,使得其不参与本轮训练的特征提取。批标准化操作是一种加快网络模型收敛的常用策略:它要求每个卷积层提取到的特征数据都要被归一化,即不同特征间的数值不会出现大范围的跳变,从而保证模型的参数更新是在一个小数值范围内稳定地进行。

为进一步过滤掉图像中的非特征信息,U-Net模型中还引入了池化层(pooling):在每个卷积层后都紧跟一次最大值池化(Max-pooling)操作(图3),处理后的结果为图像尺寸减半。随着最大值池化操作的进行,图像尺寸由输入时的256×256,变为8×8。综上,整个卷积部分的核心操作就是“卷积层特征提取”和“最大值池化层信息过滤”。

跳跃连接操作将卷积和上采样两个部分串联起来(图2)。该操作直接将卷积部分的特征数据并入上采样部分对称的、具有相同尺寸的图像数据中,共同作为下一阶图像恢复的输入数据。“并入”的操作实质上就是特征堆叠,即增加图像数据的“厚度”。

网络模型的右半部分主要由叠加的上采样层构成。本文选择的具体的上采样操作为“上池化(Up-pooling)”。上池化操作可认为是最大值池化的逆过程:最大值池化操作缩小图像尺寸,是一个信息丢弃的过程;上池化操作恢复图像尺寸,是一个信息填补的过程(图3)。经过上采样部分,图像的厚度(特征堆叠)从2 048逐渐减小到1,图像尺寸由输入的8×8恢复到初始的256×256。值得注意的是:网络右半部分也引入了卷积层,其作用是为了让模型右半部分有更精确的图像恢复能力:每进行一次上池化操作,图像尺寸虽然翻倍,但仅为上一层有效信息简单重复,并未增加有效信息;此外,跳跃连接操作又补充了部分有效信息。因此,为综合、充分利用来自上一层和跳跃连接的有效信息,这里再次引入卷积层来完成信息的汇总与提炼。

上采样部分的输出也是整个网络模型的输出,其通道数为1,即一张图中每个像素点的值是该点属于“沙脊线类”的概率值。

1.3 数据预处理与数据增强

训练样本集与验证样本集的比例取为8∶2,即400张用来训练,100张用来验证每轮训练后的网络精度情况。原始图像为R、G、B三通道的彩色图像,每个像素点的数值范围为[0,255]。由于神经网络对于“小数值”的特征学习更加敏感,且收敛更稳定,故图像预处理时将所有像素点的值归一化到[0,1]。

手工标注一张高质量的标签样本图像通常需要10 min左右。大量制作标签样本所耗费的人力成本很高,但训练样本量过小会导致网络拟合能力很差。为此,本文对样本集采用数据增强技术26,对已有的带标签的样本通过图像变换生成新的样本。具体操作为:400张带标签的训练样本在每一轮训练开始前,都会被随机地旋转或上下、左右翻转。由于目标沙脊线只与其所在图像中的相对位置有关,图像变换不会破坏图像中的有效信息;但随机翻转或转动后的样本对于网络模型来说是新的数据。因此,数据增强技术可以在不增加人力成本的条件下,大量增加训练样本。但需要注意的是:利用数据增强技术创造出来的样本与原始样本间具有较大的相似性,其价值较一张全新的、手工制作的高质量样本要低很多。因此,数据增强技术必须在已拥有一定数量的手工制作的高质量样本条件下才有效。

1.4 网络训练

神经网络训练可分为前向计算和反向传播两大部分12:将训练样本集输入到网络中进行前向计算,获得模型提取与真实标签间的损失值;然后将损失值反向传播,并利用优化算法更新网络中的各个待训练参数;不断迭代前向计算和反向传播直到损失值降到误差允许范围内12。损失值的计算方式以及优化算法有多种选择27-28,对于本文的图像二分类问题,损失值的计算方式选择二元交叉熵(Binary Crossentropy),优化算法选择Adam29。以上内容均已集成在TF2.2平台中,直接调用相关内置函数或模块即可快速实现。

为了获得稳步提高的学习效果,经测试发现可采用回调函数来动态调整Adam的学习率,即在训练过程中设定:若经过20轮训练均未提高网络对验证样本集的提取精度,则自动将学习速率减半后继续训练。此外,虽然在数据预处理阶段已对每张输入图像的像素值进行了归一化,但数据每经过一个卷积层,都会被ReLU激活函数进行非线性激活30,使数值范围有可能超出[0,1]。为此,在每个卷积层后都配置了批标准化(Batch Normalization)操作31。批标准化的加入可以有效避免网络训练过程出现“梯度消失”和“梯度爆炸”现象31-32。此外,批标准化操作还可提高网络的训练速度,因为ReLU激活函数在[0,1]变化率最大,网络权重参数的调整速度最快。

1.5 网络泛化能力提高

神经网络的泛化能力是指训练完成的网络模型对未知数据的预测精度。预测精度越高,表示该网络模型的泛化能力越强。对于深度神经网络来说,理论上它可以拟合出一个复杂的复合函数来无限逼近训练样本集和其标签之间的非线性映射关系。但网络模型的泛化能力却常常与其对已知样本的拟合能力呈近似的“负相关”,即网络模型“过拟合”训练样本集中的规律,但这些规律无法应用到新的数据中。特别是在小训练样本集条件下,网络很容易出现过拟合现象。为提高网络的泛化能力,本文采取神经元随机失活操作(Dropout)。

神经元随机失活(Dropout)是深度学习应对过拟合现象的常用手段33。其策略如下:每个卷积层后都紧跟一个Dropout层,该层将随机“冻结”前一卷积层中的一定比例的卷积核,使其在本轮训练中无法参与特征提取(即为失活),并且不更新这些卷积核的参数。神经元随机失活操作虽大幅度削弱网络对训练集的拟合能力和权重参数的更新速率,但可以有效地提高网络的泛化能力。经尝试发现:越靠近输入层的、用来提取细节特征的卷积层,越可使用具有较大冻结率的Dropout层(如50%);越靠近输出层的、用来提取抽象特征的卷积层,越应使用具有较小冻结率的Dropout层(如5%)或不使用。经验表明:深度神经网络对于细节的把握能力远强于其对抽象特征的把握能力,故越到高阶、抽象特征提取部分,越不可丢弃卷积核所提取的特征信息。

1.6 网络参数微调

参数微调是对已经获得较好提取结果的网络模型进行权重参数的略微调整,以获得更好的模型。参数微调常作为整个训练流程的最后一步。本文使用了迁移学习策略来完成最后阶段的参数微调34。网络训练过程中,在用回调函数监控网络的“验证集精度”指标时发现:模型在验证集精度提升达到瓶颈前,常出现一定程度的精度值波动。在波动过程中,回调函数能够及时保存到一个“临时最佳模型”。然后使用迁移学习策略:导入保存的模型,冻结前面所有层的权重参数,使其不可在之后的训练中改变;仅保留靠近输出层的最后一个上池化层和卷积层,并在更小的学习速率下重启训练。经测试,该策略总是有效的,可再次小幅提升模型在验证集上的提取精度。如图5所示:模型在第20到40轮训练过程中,精度提高出现瓶颈;在第42轮训练引入迁移学习策略之后,模型提取精度可再提升约0.3%后停滞。需要说明的是:网络模型的提取精度是指对验证集样本中每张卫星影像图的每个像素点识别结果的平均正确率。对于无标签样本来说,可以将模型的提取精度看作该样本每个像素点识别为正确结果的概率值。

图5

图5   训练过程中模型精度和损失值变化(第42轮训练引入迁移学习策略)

Fig.5   The variations of model accuracy and loss values during the training process


综上所述,应用U-Net神经网络模型来识别提取沙脊线的流程可分为3个步骤(图6):①数据准备;②网络训练与优化;③识别结果检验与应用。值得注意的是:①在网络的训练与优化阶段,需要从获取研究区卫星影像图开始,建立样本集,再应用多种网络训练与优化的手段,获得最佳网络模型(图6中蓝色流程);②在网络的使用阶段,将数据准备好之后,即可直接输入已训练好的网络模型,快速获得沙脊线的提取结果,并进行应用分析研究(图6中的绿色流程);③若要将本文的方法应用于新的研究区,可直接按照图6中的绿色流程进行。由于不需要重新训练网络,使得提取的过程计算代价极小,甚至可以部署在云端,通过网络接口调用;④若新研究区的沙脊线存在新的特征,可以仅标注少量包含新特征的训练样本,对网络进行快速的微调训练,即可增强网络对新特征沙脊线或者干扰因素的识别能力。

图6

图6   方法流程图

Fig.6   The flowchart


2 结果与分析

2.1 提取结果评价

经过多次训练和参数微调后得到一个效果最佳的网络模型,使用该网络模型对研究区测试样本集进行沙脊线提取。图7是研究区内3种典型沙脊线图和网络提取结果:A列为沙脊线受草地严重破坏实例,沙脊线边界较为模糊;B列为沙脊线受草地中等破坏实例,边界较为清晰,只在部分破坏区域较为模糊;C列为沙脊线未受草地破坏的实例,边界非常清晰。沙脊线的连贯性和宽度从左往右依次提高,特征提取难度依次降低。

图7

图7   模型对3种典型沙脊线区域提取结果(A列为后期受草场严重破坏的沙脊线类型;B列为后期受草场中等破坏的沙脊线类型;C列为后期未受草场破坏的沙脊线类型;红圈为提取不准确的模糊区域)

Fig.7   The extraction results of the trained model for 3 kinds of typical dune crest lines


图7可见,U-Net模型能够很好地识别出研究区内不同类型的沙脊线。虽然对于受草地破坏的区域,网络提取的沙脊线存在短小的不连续“条带”(红圈);但对于这种边界模糊的沙脊线区域,人眼也难以判断准确。对于后续的风场分析来说,更关注的是沙脊线的统计特征,U-Net模型提取的沙脊线完全可以满足后续研究的需求。如图5所示:经过70轮训练后,网络模型的最终提取精度稳定在94.6%左右,即对于一张输入的卫星影像图中94.6%的像素点的标签提取都是正确的。

2.2 沙脊线走向与近地表风况

在沙丘的移动过程中,风是控制沙颗粒运动乃至沙丘形态演变的动力条件。基于Fryberger35提出的方法,估算了腾格里沙漠西南缘多年平均月合成潜在输沙势(RDP图8A)与风向变率(RDP/DP图8B)。图8C中潜在输沙势玫瑰图显示了研究区内多年平均近地表输沙状况。根据Fryberger35对风能环境和风况的划分标准,腾格里沙漠西南缘附近气象站地区风况条件各不相同:民勤地区属于低风能(130VU)低风向变率(RDP/DP=0.7),锐双峰型风况(图8C);中宁地区属于低风能(115VU)高风向变率(RDP/DP=0.2),钝双峰型风况(图8C);多年平均月输沙势呈双峰型,夏季为东南风、南风,春季为西北风,交替出现;月输沙势具有较大的季节变化,春、冬季输沙活动最大,夏季(7—9月)输沙量最低(图8A、B)。研究区由于受西北季风和东南季风两个相反风向的作用,区内的沙丘多为横向型沙丘、新月形沙丘及沙丘链形态,呈NW-SE走向,典型地发育在单峰型风场中。这与冬季的主要风向部分一致,表明沙丘的形状和排列主要受强劲西北风的控制(图8C)。

图8

图8   腾格里沙漠内沙脊线走向分析(A—B为腾格里沙漠西南缘气象站点多年平均月输沙势与风向变率;C为腾格里沙漠西南缘沙脊线提取结果与气象站点多年平均年输沙势玫瑰图;D—G为东西部沙脊线提取结果;H和J为沙脊线走向玫瑰图;I和K为沙脊线提取走向图)

Fig.8   The results of dune crest lines orientation analysis in the Tengger Desert


高精度的遥感卫星影像与深度学习方法为分析大范围小尺度的沙丘形态特征提供了支持,也为量化研究现代近地表风况与沙丘形态特征之间的关系提供了可能。继Rubin等6工作以来,学者逐渐重视沙脊线走向与近地合成输沙方向的量化关系36-37。例如,Fenton等8通过美国Great Sand Dune沙漠中不同形体和形态沙脊线走向的统计分析结果,反推了该区域的近地表风况,发现与现代近地表风况资料计算所得主导风况结果一致。我们统计分析了研究区东西两个区块的沙脊线走向。研究区西部沙脊线主轴向是EN-WS(图8H),近似垂直于附近民勤气象站矢量合成输沙势NW-SE(图8C);东部沙脊线主轴向为NNE-SSW(图8J),近似垂直于附近中宁气象站矢量合成输沙势WWN-EES(图8C)。这表明:研究区西部沙丘走向受控于低风向变率、风能较高的风况;东部沙丘走向受控于中风向变率、风能较低的风况;沙脊线走向与合成输沙势在空间上呈现一致变化。

尽管Fryberger35计算的潜在合成输沙势与沙脊线走向有较好的近似垂直对应关系,然而该方法并未考虑沙丘形成后沙丘形态对近地表输沙过程的加速作用,继而造成输沙预测量的低估。Courrech du Pont等38提出的数学模型考虑了沙丘形态对近地表输沙过程的加速作用,验证了模型提取的沙脊线走向与实际沙脊线走向一致,发现了沙漠中两种沙丘发育模式(不稳定床形与延伸模式)的共存现象主要受控于潜在沙源供应量的变化。当潜在沙源充足的情况下,沙脊线走向一般遵循不稳定床形发育模式(Bed Instability mode);相反的,在潜在沙源匮乏的情况下,沙脊线走向遵循延伸发育模式(Fingering mode)。基于以上考虑,我们预估了研究区内东西两个区域的沙脊线走向,通过与实际统计的沙脊线走向比对发现,二者的结果完全一致(图8I、K)。从以上两种数学模型预估的合成潜在输沙势方向与沙脊线延伸方向结果来看,潜在沙源充足的情况下,尽管沙丘形成发育过程遵循不稳定床形发育模式(Bed Instability mode),然而其脊线走向的偏转仍受控于近地表风况在空间上的变化(图8H-K)。这表明,深度学习技术以及高精度遥感卫星影像在较小沙丘尺度上的应用分析,为量化分析现代近地表风况与沙脊线走向的关系提供了可能。

尽管现代近地表风况与小型沙脊线走向存在较好的对应关系,但是仍无法较好地量化分析与大型复杂/复合沙脊线走向之间的关系39,来自沙漠内部复合型沙丘形态学与年代学证据揭示其形成过程具有复杂性、非线性与多因素驱动性40。例如,西撒哈拉沙漠在距今2.5—1.5万年、1.3—1万年、0.5万年3个不同的时期,近地表主导风向发生了显著的变化,从而造成了沙丘形体大小不一、形态不同和脊线走向不同的沙丘共存现象41

U-Net模型方法能有效地用于区域性沙脊线提取,基于近地表风况计算的合成输沙势方向与沙脊线走向的估算模型能较好地解译腾格里沙漠西南缘形体较小的横向形沙丘形态特征的空间变化。然而在解译形体较大、形成时间较长的复合、复杂型沙丘的形成发育过程仍值得商榷41,需结合地质地貌证据辅助研究。因此,以上数学方法的应用研究应当针对不同区域的地貌环境和气候背景进行适当变化和调整。

3 结论

本文使用基于深度卷积神经网络的U-Net模型完成沙脊线自动提取。该方法仅需少量训练样本即可获得较高精度的提取效果。此外,为增加训练样本,使用数据增强技术;为优化模型参数,使用迁移学习技术;为提高网络的收敛速度并抑制过拟合,引入批标准化和神经元随机失活操作。U-Net模型在400张小样本训练集下仅需迭代训练70次即可收敛到最佳状态。虽最终结果在细节部分存在误差,但这并非是模型问题导致,而是因为后期草地作用对目标沙脊线的破坏,使得人为制作标签数据集时对于模糊边界的判断存在不准确性导致的。大范围沙脊线的提取,为对比研究沙脊线走向与输沙矢量合成方向的关系提供了可能:沙丘的移动方向受控于近地表合成输沙过程,并与合成输沙方向呈近似垂直的关系;另外,沙脊线走向在东西部呈现的差异与合成输沙方向在东西部的差异是相对应的。综上所述,基于深度卷积神经网络的U-Net模型完全可以胜任简单、高重复性的沙脊线提取工作。

参考文献

朱震达吴正刘恕.中国沙漠概论[M].北京科学出版社198010-65.

[本文引用: 1]

董治宝吕萍.

70年来中国风沙地貌学的发展

[J].地理学报,2020753):509-528.

[本文引用: 1]

Pye KTsoar H.Aeolian Sand and Sand Dunes[M].Berlin,GermanySpringer200925-35.

[本文引用: 1]

Wasson R JHyde R.

Factors determining desert dune type

[J].Nature,1983304337-339.

[本文引用: 1]

Hunter R ERichmond B MAlpha T R.

Storm-controlled oblique dunes of the Oregon Coast

[J].Geological Society of America Bulletin,19839412):1450-1465.

[本文引用: 1]

Rubin D MHunter R E.

Bedform alignment in directionally varying flows

[J].Science,1987237276-278.

[本文引用: 2]

Werner B TKocurek G.

Bed-form dynamics:does the tail wag the dog?

[J].Geology,1997259):771-774.

[本文引用: 1]

Fenton L KMichaels T IBeyer A Ret al.

Inverse maximum gross bedform-normal transport 1:how to determine a dune-constructing wind regime using only imagery

[J].Icarus,20142305-14.

[本文引用: 2]

Telfer M WFyfe R MLewin S.

Automated mapping of linear dunefield morphometric parameters from remotely-sensed data

[J].Aeolian Research,201519215-224.

[本文引用: 1]

Scuderi L.

The fingerprint of linear dunes

[J].Aeolian Research,2019391-12.

[本文引用: 1]

蒋缠文董治宝文青.

基于MATLAB平台的遥感影像沙丘脊线提取与地貌格局表征参数计算

[J].中国沙漠,2013336):1636-1642.

[本文引用: 2]

LeCun YBengio YHinton G.

Deep learning

[J].Nature,2015521436-444.

[本文引用: 3]

柳潜.

基于深度学习的遥感图像场景分类研究

[D].北京北京邮电大学2019.

[本文引用: 1]

Ma NWang C XSun Let al.

Cloud detection based on convolutional neural network using different bands information for Landsat 8 OLI

[J].Journal of Remote Sening & GIS,201981):259.

[本文引用: 1]

陈冠宇安凯李向.

基于卷积神经网络的不良地质体识别与分类

[J].地质科技情报,2016351):205-211.

[本文引用: 1]

张玉玺刘洋张浩然.

基于深度学习的多属性盐丘自动识别方法

[J].石油地球物理勘探,2020553):475-483.

[本文引用: 1]

段艳廷郑晓东胡莲莲.

基于3D半密度卷积神经网络的断裂检测

[J].地球物理学进展,2019346):2256-2261.

[本文引用: 1]

Wu X MGeng Z CShi Y Zet al.

Building realistic structure models to train convolutional neural networks for seismic structural interpretation

[J].Geophysics,2019854):1-48.

Wu X MShi Y ZFomel Set al.

FaultNet3D:predicting fault probabilities,strikes,and dips with a single convolutional neural network

[J].IEEE Transactions on Geoscience and Remote Sensing,20195711):1-18.

[本文引用: 1]

Zhang YWang GLi M Cet al.

Automated classification analysis of geological structures based on images data and deep learning model

[J].Applied Sciences,2018812):2493.

[本文引用: 1]

Soroush MMehrtash AKhazraee Eet al.

Deep learning in archaeological remote sensing:automated qanat detection in the Kurdistan region of Iraq

[J].Remote Sensing,2020123):500.

[本文引用: 1]

Long JShelhamer EDarrell T.

Fully convolutional networks for semantic segmentation

[EB/OL].arXiv:1411.4038v22014.

[本文引用: 1]

Ronneberger OFischer PBrox T.

U-Net:convolutional networks for biomedical image segmentation

[EB/OL].arXiv:,2015.

[本文引用: 1]

Dolz JAyed I BDesrosiers C.

Dense multi-path U-Net for Ischemic Stroke Lesion segmentation in multiple image modalities

[EB/OL].arXiv:,2018.

[本文引用: 1]

Li X MChen HQi X Jet al.

H-DenseU-Net:Hybrid densely connected U-Net for Liver and Tumor segmentation from CT volumes

[J].IEEE Transactions on Medical Imaging,20173712):2663-2674.

[本文引用: 1]

Inoue H.

Data augmentation by pairing samples for images classification

[EB/OL].arXiv:1801.02929v22018.

[本文引用: 1]

Ma J.

Segmentation Loss Odyssey

[EB/OL].arXiv:,2020.

[本文引用: 1]

Roder S.

An overview of gradient descent optimization algorithms

[EB/OL].arXiv:1609.04747v22016.

[本文引用: 1]

Kingma D PBa J.

Adam:a method for stochastic optimization

[EB/OL].arXiv:1412.6980v92014.

[本文引用: 1]

Nwankpa CLjomah WGachagan Aet al.

Activation functions:comparison of trends in practice and research for deep learning

[EB/OL].arXiv:,2018.

[本文引用: 1]

Loffe SSzegedy C.

Batch normalization:accelerating deep network training by reducing internal covariate shift

[EB/OL].arXiv:1502.03167v32015.

[本文引用: 2]

Glorot XBengio Y.

Understanding the difficulty of training deep feedforward neural networks

[J].Journal of Machine Learning Research,20109249-256.

[本文引用: 1]

Srivastava NHinton GKrizhevsky Aet al.

Dropout:a simple way to prevent neural networks from overfitting

[J].Journal of Machine Learning Research,2014151929-1958.

[本文引用: 1]

Tan C QSun F CTao Ket al.

A survey on deep transfer learning

[EB/OL].arXiv:,2018.

[本文引用: 1]

Fryberger S G.

Dune forms and wind regimes,a study of global sand seas

[J].United States Geological Survey Professional Paper,19791052137-140.

[本文引用: 3]

Gao XNarteau CRozier Oet al.

Phase diagrams of dune shape and orientation depending on sand availability

[J].Scientific Reports,201551):14677.

[本文引用: 1]

Lucas ARodriguez SNarteau Cet al.

Growth mechanisms and dune orientation on Titan

[J].Geophysical Research Letters,20154117):6093-6100.

[本文引用: 1]

Courrech du Pont SNarteau CGao X.

Two modes for dune orientation

[J].Geology,2014429):743-746.

[本文引用: 1]

许炯心李炳元杨小平.

中国地貌与第四纪研究的近今进展与未来展望

[J].地理学报,20096411):1375-1393.

[本文引用: 1]

杨小平梁鹏张德国.

中国东部沙漠/沙地全新世地层序列及其古环境

[J].中国科学:地球科学,2019498):129-143.

[本文引用: 1]

Lancaster NKocurek GSinghvi A Ket al.

Late Pleistocene and Holocene dune activity and wind regimes in the western Sahara Desert of Mauritania

[J].Geology,20023011):991-994.

[本文引用: 2]

/