笔记|2022年热带气旋强度估计论文


目录

  • Tropical Cyclone Intensity Estimation Using Himawari-8 Satellite Cloud Products and Deep Learning
  • 1. 介绍
  • 2. 数据和方法
    • 2.1 Himawari-8 地球同步卫星云产品
    • 2.2 TC 数据
    • 2.3. 数据增强
    • 2.4. 卷积神经网络 (CNN)
    • 2.5. 残差学习
    • 2.6. 注意力机制
    • 2.7. TC强度估计模型的框架
  • 3. 结果
    • 3.1. 交叉验证数据的评估
    • 3.2. 独立测试数据的表现
  • 4. 讨论
    • 4.1. 模型的可解释性
    • 4.2. 不同TC强度下的初始云产品
    • 4.3. 关于高估和低估的云产品组合
    • 4.4. 模型架构的进一步讨论
    • 4.5. 案例分析
  • 5. 结论
  • A Conformal Regressor With Random Forests for Tropical Cyclone Intensity Estimation
  • 3. 方法
  • 4. 讨论
    • A.特征重要性分析

Tropical Cyclone Intensity Estimation Using Himawari-8 Satellite Cloud Products and Deep Learning 题目:Tropical Cyclone Intensity Estimation Using Himawari-8 Satellite Cloud Products and Deep Learning
期刊:Remote Sensing 中科院二区
作者:
笔记|2022年热带气旋强度估计论文
文章图片

摘要:
本研究开发了一个基于客观深度学习的热带气旋强度估计模型。该模型的基本结构是卷积神经网络(CNN),它是计算机视觉任务中广泛使用的技术。为了优化模型结构,提高特征提取能力,在模型中嵌入了残差学习和注意机制。5个云产品,包括云光学厚度、云顶温度、云顶高度、云有效半径和云类型,均为地球静止卫星Himawari-8的二级产品,用作模型训练输入。我们在每个TC的13个旋转角度下采样云产品,以增强训练数据集。对于独立测试数据,该模型显示出改善,相对较低的RMSE为4.06 m/s,平均绝对误差(MAE)为3.23 m/s,与之前研究中的结果相当。各种云组织模式、风暴漩涡模式和特征图中的TC结构用于解释模型训练过程。对高估偏差和低估偏差的分析表明,模型的性能受初始云产品的高度影响。此外,一些使用其他深度学习架构的受控实验表明,我们设计的模型有助于估计TC强度,从而为其他TC指标的预测提供洞察。
1. 介绍 热带气旋 (TCs) 是最具破坏性的自然灾害之一,威胁着生命和财产 [ 1 ]。TC的影响包括强风、大雨、龙卷风和登陆附近的大风暴潮。TC 的破坏主要取决于其强度、大小和位置[ 2 , 3 ]。因此,准确估算 TC 强度在业务 TC 预报和防灾减灾中发挥着重要作用。在过去的几年里,TC 强度估计受到了广泛的关注,但仍然是业务 TC 预报中最困难的任务之一 [ 4 , 5 , 6 , 7]。其主要原因是与热带气旋发展相关的复杂的海洋大气物理和动力过程尚未得到很好的理解[ 8 ]。由于大部分 TC 都是在海洋上空形成的,因此仅使用地面观测来估计 TC 强度是极其困难的 [ 9 ]。气象卫星传感器系统取得的稳步进展为改进 TC 强度估计提供了新的机会。
近年来,基于卫星的观测,例如来自极轨或地球静止卫星的微波数据,已被视为估计 TC 强度的主要数据源[ 10 , 11 ]。极轨卫星获得的上行微波辐射可以转化为亮温,进一步用于测量台风暖芯的强度和台风的降水[ 12 ]。与极轨卫星相比,地球静止卫星虽然无法监测 TC 的近地表结构,但可以提供更高时空分辨率和更好质量的图像 [ 13]。最有价值的 TC 相关信息,例如其成因、位置、风速和诱导降水,可以从地球静止卫星图像中间接观测到。最近的研究已经探索了使用地球静止卫星图像来估计 TC 强度,并显示出潜在的效用 [ 13 , 14 , 15 , 16 ]。
一种广泛使用的估计 TC 强度的方法是 Dvorak 技术 (DT)。它本质上是一种手动模式识别技术,根据地球静止卫星红外图像观察到的云模式估计 TC 的强度 [ 17 , 18 ]。DT 高度依赖 TC 预报员和卫星分析员的专业水平;因此,它是主观的和时间密集的 [ 9 , 10 ]。已经提出了几个改进版本的 DT,例如数字 Dvorak 方法、客观 Dvorak 技术 (ODT) 和先进的 ODT (AODT [ 19])。这些技术不是经验判别分析,而是基于计算机,减少了 TC 强度估计的不确定性和可变性。此外,先进的德沃夏克技术(ADT)对 AODT [ 20 ]提出了一些补充和修改,偏差角方差技术(DAVT)通过云动态分析和红外卫星图像的对称结构研究来估计 TC 强度 [ 21、22 ]。_ 上述方法已在不同的业务 TC 预报中心使用;然而,主观规则和约束可能导致 TC 强度估计的不一致。
最近,已经进行了许多尝试使用深度学习 (DL) 技术来估计 TC 强度。作为最常用的 DL 技术,卷积神经网络 (CNN) 技术具有三个主要特征,局部感受野、权重偏差共享和池化 [ 23 , 24 ],适用于基于卫星图像的 TC 强度分析。不同版本的 CNN 可以通过改变输入数据、连接模式和层数等来构建。例如,使用单个红外图像,[ 16] 设计了一种 CNN 架构来对不同强度级别的飓风进行分类,结果表明估计精度高于最先进的技术 DAVT。使用基于卫星的无源微波传感器数据,[ 25 ] 开发了一个 2D-CNN 模型,与侦察辅助的最佳轨迹相比,估计的 TC 强度的 RMSE 为 4.93 m/s。[ 14 ] 的作者利用 2D-CNN 和 3D-CNN 来分析多光谱地球静止卫星图像与 TC 强度之间的关系,估计 RMSE 为 4.28 m/s。基于CNN框架,[ 13] 提出了一种组合模型,利用红外卫星图像和 TC 最佳轨迹数据执行 TC 强度分类和估计任务,显示平均绝对误差为 3.43 m/s。许多其他研究也记录了使用 DL 和卫星图像估计 TC 强度的进展和成就(例如,[ 26、27、28、29 ])。
然而,在使用卫星图像和 DL 方法时,TC 强度估计仍然存在一些问题/挑战。首先,性能高度依赖于数据集的质量。例如,卫星图像中的网格和海岸线可能会充当噪声,使训练过程复杂化 [ 16 ]。此外,由于 TC 的结构随时间和位置而变化,因此需要在卫星图像中对 TC 的动态运动进行定量指标,以提高估计模型的稳健性,例如,使用数据增强技术 [ 13 , 16 , 30]。其次,基于卫星图像和深度学习的 TC 强度估计本质上是一种非线性特征提取任务,需要大量的计算资源和巨大的时间成本。与大多数 DL 方法一样,CNN 的深层架构存在几个问题,例如梯度消失、梯度爆炸、局部最优、过拟合和收敛缓慢。因此,应在网络架构和设备硬件之间取得平衡[ 31 , 32 ],改进的基于 CNN 的架构值得实验 [ 26 , 27 ]]。第三,与许多气象领域一样,基于 DL 的 TC 强度估计需要由 DL 研究人员、DL 系统开发人员、领域专家、最终用户利益相关者、软件工程师和用户界面设计人员组成的不同团队 [ 28 ]。
Himawari-8 (H-8) 是日本新一代地球静止气象卫星,能够以更精细的时空分辨率监测 TC 活动,自 2015 年以来一直在亚太地区运行 [ 33 , 34 ]。H-8 的二级(L2)云产品已用于 TC 相关研究,并取得了令人鼓舞的初步结果 [ 15 , 30 , 35 , 36]。在这项研究中,我们提出了一种新的基于 DL 的架构,旨在在之前基于 DL 的模型的基础上提高 TC 强度估计的准确性。我们的贡献是 (1) 从 H-8 L2 云产品中挖掘潜在有用的信息,用于北太平洋西部盆地的 TC 强度估计;(2) 开发了一个基于 CNN 的框架,它集成了两种新技术:注意力机制模块 [ 37 ] 和残差学习模块 [ 38 ],降低了计算复杂度,但提高了架构的信息提取能力;(3) 将我们的模型与其他 TC 强度估计技术(例如,DT 系列)进行比较,并讨论其优势、不足和未来的改进。 本文的其余部分组织如下:第 2 节介绍了数据来源、方法和实验设计。我们在第 3 节中描述了模型的发展和评估。讨论和总结分别在第 4节和第 5节中介绍。
2. 数据和方法 2.1 Himawari-8 地球同步卫星云产品 Himawari系列卫星是日本气象厅1977年发射的第一颗地球静止气象卫星。H-8是Himawari系列的新一代,于2014年10月推出,并于2015年7月投入使用[33,34]。H-8有16个观测光谱带,可见光和近红外波段的空间分辨率为0.5或1km,红外波段的空间分辨率为2km。观测区域为60S-60N、80E-160W,覆盖了西北太平洋盆地的大部分地区,并分别提供了10分钟和5公里的时间和空间分辨率的图像。在当前的研究中,使用了2015年至2020年的五种H-8 L2云产品,包括云光学厚度(CLOT)、云顶温度(CLTT)、云顶高度(CLTH)、6波段云有效半径(CLR)和云类型(CLTY)。*从视觉上看,这些产品捕捉到的TC结构与TC强度高度相关。因此,使用基于DL的模型执行一些计算机视觉任务来辅助TC强度估计是可行和值得的。
*由于夜间观测不可用,本研究仅考察了H-8 L2云产品在白天TC强度估计任务中的使用情况。(缺点)
2.2 TC 数据 TC数据集来自浙江省水利厅发布的实时台风路径系统,远洋TC每三小时一次,近岸TC每一小时一次。它包含详细的TC轨迹及其相关时间、经度、纬度、最低海平面气压、最大风速(持续2分钟的平均风速)、移动方向、移动速度和西北太平洋盆地的登陆地点。为了匹配上述五种云产品的时间跨度,共提取了3264个原始TC记录(来自2015年至2020年的147个台风案例)。为简洁起见,使用最大风速作为目标TC强度,这也是下面强度回归任务的标记变量。根据中国气象局的TC强度分类标准(注意,该标准不同于Saffir–Simpson标准),定义了六种TC类型:热带低压(TD)、热带风暴(TS)、强热带风暴(STS)、台风(TY)、强台风(STY)和特强台风(SSTY)(见图1a)。为了便于下面的分析,这些TC还根据其与海岸线的距离分为登陆TC和非登陆(航海)TC(见图1b)。
笔记|2022年热带气旋强度估计论文
文章图片

图1. (a) 不同强度 (m/s) 间隔的 TC 案例数;( b ) 与海岸线不同距离 (km) 的 TC 案例数(虚线左边是登陆后,虚线右边是未登陆的海洋)。
2.3. 数据增强 训练 DL 模型通常需要大量数据;因此,我们利用数据增强技术来扩展初始样本。例如,图 2显示了在 CLTT 云产品上执行的数据增强。对于每张图像,以 +/-15°的旋转增量生成总共 13 个不同的图像(边长:1280 × 1280 km),并位于同一风暴中心(经度和纬度),从而得到一个 13 × 256 × 256 的形状。以类似方式收集 CLOT、CLTH、CLER 和 CLTY 产品。因此,最终的样本量为42432×5×256×256。注意H-8由于使用可见波段,无法在夜间进行监测活动,而且由于硬件故障也存在一些异常数据,所以最终样本规模从 42,432 减少到 39,787。
笔记|2022年热带气旋强度估计论文
文章图片

2.4. 卷积神经网络 (CNN) CNN的详细数学原理和公式推导在研究[ 39 , 40]。CNN 由三个关键层组成:卷积(特征提取)层、池化(下采样)层和密集(全连接)层。在卷积层中,各种具有恒定大小的可训练卷积核(也称为过滤器)具有“参数共享”(权重和偏差)特征,这使它们能够从原始输入模式中提取多个特征。这一步不仅降低了计算成本和参数数量,而且在一定程度上缓解了过拟合。池化层通常插入连续的卷积层之间,保留主要特征并减少参数数量。因此,它们可以降低表示的维数,并创建对小偏移和扭曲的不变性 [ 24],这有助于提高泛化能力,缓解模型的过拟合。卷积层和池化层的灵活组合可以从原始输入中提取一些组织良好的特征。全连接层在 CNN 架构中充当分类器或回归器;换句话说,卷积和池化的结果可以由全连接层集成。CNN 方法非常适合图像处理和模式识别,特别是对于具有平移不变性、旋转不变性和尺度不变性的图像。因为 TC 图像是在 13 个旋转角度下生成的,所以总是以风暴中心为中心(见图 2),并且通常具有各种形状和大小的组织良好的结构(例如,外风带,中螺旋云带,气旋眼壁,内核),可以假设上述三个不变性。使用 CNN 的回归模式,可以将卫星云产品(看起来像图像)的 TC 强度估计转换为非线性特征提取问题。CNN 的基本架构遵循“Oxford Visual Geometry Group(以下简称 VGG;[ 41 ])”的网络,这是计算机视觉任务中广泛使用的技术。本研究中的 VGG 包含四个“卷积块”,滤波器大小从 32 增加到 256(见图 3)。
笔记|2022年热带气旋强度估计论文
文章图片

图3. 本研究中TC强度估计模型的框架,其中Max Pooling表示最大池化层,Avg Pooling表示平均池化层,Conv2D为2-D卷积层,Conv1D为1-D卷积层, ⊕ 是残差学习模块。
2.5. 残差学习 直观地说,VGG 架构通过堆叠多个卷积层和池化层来提取大量特征。然而,如此深的架构会引发三个问题:计算资源的巨大消耗、模型过度拟合和模型梯度消失/爆炸[ 42、43 ]。上述问题可以通过图形处理单元(GPU)集群、扩大样本量、植入正则化层等来解决。在实际训练过程中,堆叠更多层不可避免地会导致网络退化,而这不是由过拟合引起的[ 38、44 ]。_因此,[38]提出了一个深度残差学习框架,建议利用几个堆叠层来拟合来自初始映射的残差映射,而不是直接拟合初始映射。这种深度残差学习可以通过具有快捷连接的前馈网络来实现,因此可以灵活地嵌入到 VGG 架构中。值得注意的是,残差学习有助于加速收敛。本研究将在 VGG 架构中嵌入“双级”残差学习(参见图 3中的 Res1 和 Res2)。
2.6. 注意力机制 请注意,在VGG架构中,每个云产品(通道)的重要性不会在卷积操作之前进行排序。此外,对于每个云产品,不同区域(例如,TC 眼、TC 眼壁、TC 外螺旋雨带)的值在卷积运算中将发挥不同的作用。上述猜想意味着在 VGG 架构中附加一个“注意机制”将获得更强的表示能力。简单来说,注意力机制让架构更加关注云产品的“内容”和“位置”。Ref.[37]提出了一个卷积块注意模块(convolutional block attention module, CBAM),包含两个独立的模块:通道注意和空间注意。CBAM 沿通道和空间维度顺序估计注意力序列,使用内积运算将注意力序列与原始输入特征进行整合,进一步获得自适应特征细化,从而可以无缝地植入 VGG 架构。本研究中的 CBAM 可以进一步增强 VGG 架构的特征表示,帮助网络专注于重要的“特征图”,并抑制卷积层中不必要的特征图。
2.7. TC强度估计模型的框架 综上所述,完整的TC强度估计模型由残差学习和基于VGG架构的CBAM组成,如图3所示. 在模型中,在将输入数据输入到训练过程之前,加入最大池化层,然后在最大池化层的后端进行CBAM。在每个卷积模块处添加第一个残差学习级别(Res1)(包括三个卷积层);第二个残差学习级别(Res2)用于恒等映射,并将第一个和第二个卷积模块以及第三个和第四个卷积模块相互连接。平均池化层在每个卷积模块之前执行。请注意,在所有卷积模块之后,我们使用几个一维卷积层和一个全连接层而不是一个单一的全连接层来完全连接训练标签。这样的操作将有助于减少参数的数量。 最后一层输出估计的 TC 强度,它们与训练标签(目标强度)一一对应。此外,我们还采用了“Batch-Normalization”层和“dropout”层来缓解过度拟合。所有的卷积层 (Conv2D) 都具有leakycorrecy linear unit (LeakyReLU) 激活函数,并且所有相关的内核大小都是4 × 4, 步幅都设置为( 1 , 1 ),并且它们的填充策略都设置为“相同”,它们的内核数分别为 32、64、128 和 256。一维卷积层(Conv1D)的内核大小从 128 减小到 32。模型训练和优化使用自适应动量(Adam)梯度下降优化器和平均绝对误差(MAE)损失函数执行。训练 epoch 总数为 200,提前停止 epoch 数量为 20,有助于缓解过拟合。因此,输入大小为 (256, 256, 5),而输出大小为 1(由模型确定的标量 TC 强度)。
对于模型配置,建模样本(样本长度为 39,798)分为两部分:交叉验证集(前 90%,35,808 个样本)和独立测试集(后 10%,3979 个样本)。具体来说,将交叉验证集进一步划分为 6 个相等的组(每组有 5968 个样本),并在训练过程中使用六折交叉验证的方法来调整模型的可训练参数,这意味着我们训练了使用不同的参数和验证损失建模六次,确保每个样本都验证一次。上述步骤可以通过 Python 语法中的“Tensorflow”包来实现。为了进一步检查模型的泛化能力,我们使用独立的测试集对模型进行了两次测试(在前一个交叉验证步骤中有两个最低的验证损失),并对它们的输出取平均值。
3. 结果 3.1. 交叉验证数据的评估 这里,我们使用交叉验证集来分析模型的可靠性。我们采用了包含CBAM和Res1的DL架构(参见第2.7节和图3)来执行评估。图4a比较了4 m/s间隔内的估计强度( y ^ \hat{y} y^?)和目标强度(y ),并显示了以目标 y ^ \hat{y} y^?为条件的估计强度的概率。直观地说,线性拟合表明y与y高度相关, y ^ \hat{y} y^? = 0.79 × y + 5.48 (R^2 = 0.95)。该模型表明高估了y < 24 m/s时的强度,显示出高概率,特别是对于那些间隔为14 m/s的强度,其概率接近1。相比之下,强度超过30米/秒间隔的热带气旋在不同的概率水平下被模型低估,偏差随着强度的增加而增加。最大的低估发生在强度接近60米/秒的猛烈热带气旋。考虑到大多数热带气旋的强度约为30米/秒(见图1),估计这些边缘热带气旋(如热带低压或台风、强台风)的偏差被认为是可以接受的。这些结果与[27]的发现一致。
笔记|2022年热带气旋强度估计论文
文章图片

此外,我们计算估计强度的标准差(σ)来研究模型的稳定性。在图4b中,当y < 40 m/s时,标准偏差低于1.6 m/s,然后随着y逐渐增加,在y = 56 m/s时达到峰值。总体而言,标准偏差相当低,值在1-2m/s范围内,这表明该模型在再现不同TC强度时相对稳定,尤其是对于那些弱TC。图4c显示了估计强度的bias和RMSE。很明显,偏差与目标强度呈负相关,高估出现在弱热带气旋(热带低压、热带风暴)中,偏差值范围为0-2米/秒,低估出现在强热带气旋中,偏差范围为9-0米/秒。通常,RMSE值在小范围内(< 7米/秒),说明所设计的体系结构和参数对模型训练是有效的。与偏差值一致,该模型在y < 32米/秒的间隔显示出较小的RMSE,但随着目标强度的增加开始退化。强热带气旋中如此大的偏差的可能原因可能是由于用于特征提取的样本集相对较小(例如,六个台风季节中的强台风和超强台风)。
图 5显示了不同区域的估计偏差的箱线图。总体而言,估计的偏差范围从 -10 到 4.5 m/s。尽管模型高估了大多数 TC,但平均偏差在 0 m/s 左右,表明高估几乎与低估相当。 与航海(非登陆)TCs相比,登陆TCs的偏差波动较小。请注意,大多数登陆的 TC 以低强度结束,这些弱 TC 解释了上述低强度 TC 的小偏差。对于航海 TCs,根据各组框的形状,很明显,远洋 TCs(D > 400 km 气旋)比近海 TCs(0 < D < 200 km 和 200 < D < 400 km 气旋)具有更大的偏差,表明估计的偏差随着沿海距离的增加而增加。 由于大多数TC在近海区域的记录频率(1小时采样)比在远洋区域的记录频率(3小时采样)更高,因此我们的模型可以挖掘有用的信息,并通过使用这些丰富的近海TC训练样本,以相对较小的偏差拟合目标强度。
笔记|2022年热带气旋强度估计论文
文章图片

3.2. 独立测试数据的表现 我们使用一个独立的数据集验证了模型的性能。如图4所示,计算了几个统计数据。总体而言,强度估计 y ^ \hat{y} y^?与目标y相匹配,线性拟合 y ^ \hat{y} y^?=0.84×y+4.15 (R2=0.85),略低于交叉验证数据。在图6中,很明显,在y<20 m/s的tc中出现了相对较高的概率的高估。相比之下,在y>30 m/s TC中可以发现不同概率的低估。例如,模型预测y≈48 m/s TC的强度为44 m/s,概率为0.5,而y≈50 m/s tc在46 ~ 50 m/s强度下被低估的概率较低。尽管如此,该模型仍然能够再现最大强度(约50米/秒)。与之前对交叉验证数据的评估类似,当目标强度低(高)时,我们的训练模型有高估(低估)TC强度的倾向。这并不奇怪,因为我们模型的损失函数是MAE,通常可以通过提供平均TC强度输出来最小化。然而,鉴于MAE和RMSE值较小(两者都略大于验证数据),该模型在预测TC强度方面是熟练的。
笔记|2022年热带气旋强度估计论文
文章图片

为了进行全面的性能分析,我们还将所提出的模型与其他现有研究中开发的模型进行了比较。RMSE如表1所示,因为在这些现有的研究中,它被用作评价指标。与以前的版本相比,ADT[45]有许多改进,全球TC预报中心都在使用它。但这取决于多源数据的综合应用,以及客观分析。[22,46]的作者使用DAV技术和红外图像估算了北大西洋和北太平洋东部盆地的TC强度,获得了分别为6.68 m/s和6.55 m/s的均方根误差。DAV获得的相对较高的RMSE值可能是由DAV信号振荡造成的,这种振荡在平滑的最佳轨道强度估计中没有出现。基于cnn的方法采用各种卫星图像作为输入,取得了令人满意的效果。例如,[26]的RMSE为4.31 ~ 4.52 m/s,[13]的RMSE为4.42 ~ 4.93 m/s。[14]作者同时使用2D-CNN和3D-CNN, RMSE最小值为4.27 m/s。在[25]中,“DeepMicroNet”模型与侦察辅助的最佳航迹强度相比,RMSE为4.93 m/s。虽然上述基于cnn的方法在RMSE方面优于DAV和ADT,但它们通过盲目叠加多个卷积层来提取非线性特征,在没有每个特征之间相互关系的情况下,可能会受到影响,并可能引入强度估计误差。注意,通过使用剩余连接和注意机制,我们的模型更有效地提取和重新排序潜在特征,获得了低至4.06 m/s的RMSE,这被认为是一个令人满意的和可比较的结果。
笔记|2022年热带气旋强度估计论文
文章图片

4. 讨论 4.1. 模型的可解释性 与大多数 DL 方法类似,我们的模型也是一个“端到端”的黑匣子,无法解释估计结果。在这里,我们使用所谓的“特征图”来解决这个缺点。众所周知,卷积核(过滤器)是基于 CNN 架构中特征提取的主要算子;因此,我们将一个卷积层的内核的输出可视化,以直观地理解和解释模型的前向过程。图 7展示了从第一个“Conv2D”层(总共 32 个过滤器)的卷积过程中派生的 32 个特征图。从图 7,我们可以直接识别各种TC结构和相关的云带特征。例如,F1~F10 描述了 TC 眼壁云带的形成阶段、发展阶段和回旋模式。就 F1~F10 中的外风带和中间螺旋云带而言,它们的形状似乎是无定形的,大概是因为(1)CBAM 为它们分配了不同的空间注意力,(2)各种过滤器激活了所有像素不同。F9 ~ F12 有明显的外风带和中间螺旋云带,负像素值非常高。该模型似乎侧重于外风带和 TC 眼壁带,而忽略了 F13 ~ F14 中的边缘云(风暴边缘周围的云),而在 F15~F16 中观察到的情况与此相反。而且,F21~F27也描绘了中螺旋云带的加强和风暴的内核结构,F28~F32更关注外风带。以上所有特征图都准确地记录了风暴的螺旋模式和对称结构。
图 7. 图 3 中第一个卷积层的结果可视化(在 [?1,1] 标准化之后)。
由于我们的模型中使用了 CBAM,因此确定特征图如何被五个通道输入(云产品)激活以及它们是否充当气旋强度估计的进一步指标非常重要。例如,F6~F8、F19~F20、F25~F27 和 F31~F32 中的特征图显示了与 CLOT 和 CLTH 相关的 TC 眼壁带和内核结构;F15~F16中的特征图有与CLTT和CLTY相关的外风带;F1~F5 和 F21~F24 中的特征图描绘了与 CLTH 和 CLTY 相关的边缘云;F13~F14中的特征图有可能与CLTH和CLER等相关的TC眼壁带和外风带等。总体而言,由于各种原因,很难详细说明每个特征图与每个单个云产品之间的直接联系。注意 CBAM 对每个输入的关注。
4.2. 不同TC强度下的初始云产品 由于我们的模型使用五种云产品作为训练输入,因此在估算 TC 强度时了解这些产品的工作原理非常重要。众所周知,热带气旋强度受其大小、结构、暖湿空气、对流层上层辐合、对流层下层辐散、对流活动、风切变、地形效应等多方面的影响[ 47 , 48 , 49 , 50 , 51]。在可视化的云产品中,云系统的组织结构和对流活动与TC中心的偏心是分别反映涡度和垂直风切变强度的两个重要动力因素。此外,云类型和云顶温度分别是反映对流活动发展和TC内核发展的两个关键热因素。图 8 显示了与独立测试数据集中观察到的强度不同的 TC 的初始云产品。
笔记|2022年热带气旋强度估计论文
文章图片

图 8. 初始云产品和相应的 TC。
显然,TC 强度随着 CLOT 的增加而增加。尤其是当 CLOT 大于 60 和 100(单位:无量纲)时,STY 和 SSTY 中存在明显的螺旋云带。此外,可以在风暴眼周围找到空区域(无云)。从 TS 到 SSTY,云系统变得更加高度组织化(参见 CLOT、CLTH 和 CLER)。上述分析与我们的背景知识相吻合,外层风带和螺旋云带可能聚集丰富的暖湿空气和对流云团,从而加强对流活动,产生TC。 此外,从TS到SSTY,CLOT和CLTH值都变高,表明对流活动和TC内核的发展。一般来说,CLTT和CLTH与上升气流密切相关,与TC强度间接相关。在对流层,较强的上升气流更容易将对流云提升到顶部,导致云顶温度下降。然而,有时由于高水平分歧处反气旋的抑制,强烈的上升气流不会导致强 TC。考虑到对流活动主要发生在 TC 眼壁外侧和螺旋云带之间的区域,低 CLTT 而高 CLTH 值集中在这些区域,尤其是强 TC 区域,如 TY 、STY 和 SSTY。此外,由于下沉气流在 TC 中心周围盛行,在 STS 和 SSTY 的 CLTH 中可以找到 TC 的眼睛。在 CLER 方面,它可以在一定程度上反映潮湿的空气状况。从弱TC到强TC,对流活动增强,其环状CLER值更明显。这再次证明强对流活动主要发生在TC外眼壁与螺旋云带之间的区域。
4.3. 关于高估和低估的云产品组合 在这里,我们使用云产品组合来了解模型预测行为(高估或低估)。图 9展示了来自独立测试数据的四个云产品渠道的组合。直观上,与高估案例相比,低估案例对应的云产品更加生动。在低估情况下区分不同的云带轮廓和风暴内核(特别是对于 CLOT、CLTH 和 CLER),但在高估情况下则不区分。总体来看,被低估的TC云系结构深且组织良好,内核结构清晰,与被高估的TC相反,这表明估计的热带气旋强度与模拟对流活动和热带气旋内核高度相关。 根据4.2 节的分析,大多数高估(低估)发生在弱(强)TC,对应生动(分类)云产品。该模型的性能受初始云产品的影响很大。
笔记|2022年热带气旋强度估计论文
文章图片

4.4. 模型架构的进一步讨论 该模型的架构由 VGG 网络、残差学习和 CBAM 组成。为了进一步说明所设计架构的必要性,我们实施了几个对照实验(表 2)。从前三个实验中可以看出,VGG + CA 和 VGG + SA 的参数数量与 VGG 的参数数量大致相同,其中 VGG + SA 的运行时间最长。在 MAE 和 RMSE 方面,VGG + CA 略优于 VGG,而 VGG + SA 产生的 MAE 和 RMSE 比 VGG 和 VGG + CA 更大。上述结果表明,将通道注意模块附加到基本 VGG 时,估计性能仅略有提高,但附加空间注意模块时估计性能下降,表明通道注意机制比空间注意机制更有效。 这大概是因为前者同时推导出“平均池化”和“最大池化”来确定哪个特征(在通道轴上)更重要,而后者可以通过确定操作员在每个功能中应该关注的“位置”来弥补前者的不足。因此,我们可以说,当同时使用空间和通道注意模块(VGG + CBAM)时,MAE 和 RMSE 分别降低到 3.40 m/s 和 4.29 m/s,运行时间甚至减少了近一倍。
表 2. 几种深度学习架构的比较。注:CA = 通道注意力;SA = 空间注意力;CBAM = CA + SA;Res1和Res2是两种残差学习模块,如图3所示。运行时间是在一个训练 epoch 上计算的;本研究采用 MAE 和 RMSE 最小的第五种架构(VGG + CBAM + Res1)。上述所有实验代码均在以下环境中执行:Python = 3.8,tensorflow = 2.4.1,GPU = NVIDIA GeForce RTX 3090,显存为 24G。
笔记|2022年热带气旋强度估计论文
文章图片

表 2中最后三种架构的另一个有趣发现是不同的“跳过连接模式”表现不同。仅连接一个卷积块(VGG + CBAM + Res1)的Res1优于连接两个卷积块(VGG + CBAM + Res2)的Res2;虽然 Res1 的运行时间比 Res2 长,但参数数量大幅减少;此外,Res1 中的 MAE 和 RMSE 均小于 Res2 中的 MAE 和 RMSE。
这些现象可以用网络退化效应来解释。 在 VGG 网络中,基于“数据处理不等式”的原理,随着层数的增加,特征图中包含的一些有用信息会逐渐减少。但是,添加更多的残差学习模块(可以认为是“身份映射”过程)将有助于结构在每个特征图上保留更多有用的信息;因此,当一个跳跃连接较长的步骤时,比??跳跃连接较短的步骤所需的运行时间更少,例如在 Res2 与 Res1 中。此外,请注意,对于深度 VGG 网络,某些层或节点的权重太小,会对架构产生微妙的影响。因此,添加适当的残差学习模块(可以被视为“剪枝”过程)将有助于分离梯度反向传播中的参数数量,并将进一步压缩架构。因此,不难理解,Res2 比 Res1 占用更多的参数,但它也产生了更大的 MAE 和 RMSE。此外,如果同时使用 Res1 和 Res2 (VGG + CBAM + Res1 + Res2),则与单独使用 Res2 (VGG + CBAM + Res2) 或 CBAM (VGG + CBAM) 时相比,该模型仅表现出轻微的改进。然而,单独使用 Res1 (VGG + CBAM + Res1) 时没有观察到改善。上述结果表明,残差学习块有利于节省计算成本和提高估计性能。然而,这并不一定意味着一些无意识的残差学习模块会提供更好的 TC 强度估计。
4.5. 案例分析 在这里,我们选择两个具有代表性的台风案例来检验模型的性能(图 10)。第一个台风“Higos”于2020年8月16日产生,于2020年8月19日早上6时左右在珠海南部登陆,上午9时后迅速降级为强热带风暴(STS),随后向西北方向移动以 25 m/s 的速度。这次台风在短时间内造成了巨大的损失。我们的模型略微高估了风暴的强度(登陆后),MAE 为 1.82 m/s,这与模型在目标强度较低(例如,小于 30 m/s)时倾向于高估 TC 强度的事实非常吻合。登陆后的发展得到了很好的把握。第二个台风Saudel于2020年10月19日产生,其强度从28 m/s(10月22日上午09:00)增加到33 m/s(10月22日下午14:00)并被判定为作为快速增强的台风(每 6 小时 +5 m/s)。我们的模型以 1.97 m/s 的 MAE 成功捕捉了其强化特征。请注意,虽然模型通常倾向于在目标强度高时低估 TC 强度,但对于 Saudel 来说,它被略微高估了。
笔记|2022年热带气旋强度估计论文
文章图片

5. 结论 在这项研究中,我们提出了一个基于 DL 的模型,用于使用 H-8 L2 云产品 CLOT、CLTT、CLTH、CLER 和 CLTY 进行 TC 强度估计。该模型以VGG为基本架构,融合了“注意机制”和“残差学习”,减少了参数数量,提高了估计精度。该模型在六折交叉验证数据下进行了训练和优化,并使用独立的测试数据进行了进一步评估。可以得出以下有用的结论:
(a) 对于交叉验证,模型在不同的 TC 强度区间表现不同。 一般来说,强 TC 被低估,弱 TC 被高估。在特定区域,由于记录的 TC 样本不平衡,登陆 TCs 估计强度的偏差比航海 TCs 的波动小,这可能会影响模型的训练和特征表示。对于独立测试,我们的模型产生了 4.06 m/s 的相对较低的 RMSE 和 3.23 m/s 的 MAE,这与使用基于 Dvorak 的技术和各种其他基于 CNN 的 DL 技术的现有研究确定的结果相当。
(b) 通过可视化其中一个卷积层的输出,我们能够清楚地识别各种云组织模式、风暴旋转模式和 TC 结构,这有助于模型表示 TC 强度的复杂变化并产生可靠的估计。 此外,初始云产品能够反映一些与TC强度相关的因素,如暖湿空气、辐合、辐散和对流活动。此外,通过检查不同强度水平下的初始云产品,我们能够确定我们的模型有高估(低估)弱(强)TC的趋势。最后,通过与其他残差学习和基于 CBAM 的架构的比较,证明了本文设计的模型的优越性。
总体而言,所提出的基于 DL 的模型有望用于 TC 强度估计,未来的研究非常需要进一步改进该模型。首先,应考虑更多来自不同红外波段、微波波段、区域和夜间时段的卫星图像,以及 TC 最佳轨迹数据、地面、海洋和航行观测数据,以增加模型的训练样本[ 14、25、31 ] 以提高模型的鲁棒性。其次,因为 TC 强度不仅受其大小和结构的影响,还受环境热力学条件和物理因素的影响 [ 52 , 53],未来的工作应该考虑更多的参数,如地表温度、水汽、海平面压力、垂直风切变、转向流等。第三,所提出的架构被处理为用于 TC 强度估计的特征提取和回归任务。未来可以尝试更多的 DL 架构(例如,ConvLSTM,[ 54 ])用于 TC 轨道或降水临近预报中的时空序列回归任务。
A Conformal Regressor With Random Forests for Tropical Cyclone Intensity Estimation 题目:A Conformal Regressor With Random Forests for Tropical Cyclone Intensity Estimation
用于热带气旋强度估计的具有随机森林的保形回归器
期刊:IEEE Transactions on Geoscience and Remote Sensing 中科院二区
作者:天津大学
笔记|2022年热带气旋强度估计论文
文章图片

摘要:
热带气旋 (TC) 强度估计对于灾害预报和灾害性天气预警至关重要。近年来,各种 TC 强度估计模型的性能逐渐增强,但精度仍有待提高。在本文中,从 TC 的卫星红外图像中提取了 71 个与强度相关的特征。这些特征按眼睛特征、圆圈特征、纹理特征和时间序列特征分组。以随机森林模型作为共形预测(CP)的底层算法,提出了一种强度适用的CP框架。一方面,所提出的网络可以实现 TC 强度的点估计。另一方面,也可以实现满足给定显着性水平的强度区间估计。在实验中,点估计算法的均方根误差为7.86 kt(1 kt ≈ 0.51 m/s),提出算法的性能优于对比算法。此外,区间估计丰富了决策信息。实验结果表明,所提出的模型是一种有竞争力和有前途的 TC 强度估计方法。
3. 方法 tc的生命周期可分为三个演化阶段:发展期、成熟期和耗散期。TC云的结构通常由混沌向旋转对称发展。对称性的程度通常随着强度的增加而增加,云在消散阶段返回到一个相对凌乱的组织。
数据输入:
(1)Eye Features
【笔记|2022年热带气旋强度估计论文】笔记|2022年热带气旋强度估计论文
文章图片

(2)Circle Features
笔记|2022年热带气旋强度估计论文
文章图片

(3)纹理特点
笔记|2022年热带气旋强度估计论文
文章图片

(4)时间序列特征
笔记|2022年热带气旋强度估计论文
文章图片

4. 讨论 A.特征重要性分析 特征重要性表示每个特征对估计结果的贡献,这对模型的可解释性和改进至关重要。
基于树的模型可以根据杂质含量的平均减少量来衡量特征的重要性。 在RF构建过程中,每棵决策树选择的样本和特征都不相同,这就使得每棵决策树的特征重要性不同。计算特征对每棵树的贡献后,对特征的平均贡献进行比较和排序,得到模型的特征重要性。IACP_T模型的前20个重要特征如图8所示,表VIII列出了这20个特征的名称和简短描述。最重要的特征是AD (TY眼和TY眼周围的云之间的平均BT差)。TY眼的出现一般表明TC已达到成熟阶段,且强度较高。这与现有的研究是一致的。第二和第三个最重要的特征是80 - 120公里圈和120- 160公里圈24小时前的平均BT。对于TC来说,BT的平均值反映了云的整体实力。结果表明,这两个特征是强度发展的重要指标,这在以往的研究中似乎没有得到体现。因此,气象预报员在决策或研究TC的发展机制时可以关注这两个特征。此外,AY反映了云的纹理分布,DT反映了TC存在的时间,这也有助于强度估计。值得注意的是,强度估计的准确性来自于多种特征的综合作用加粗样式
笔记|2022年热带气旋强度估计论文
文章图片

    推荐阅读