深度学习模型在长江口叶绿素a浓度预测中的应用研究

陈炜1,韩震1,2*

(1.上海海洋大学 海洋科学与生态环境学院,上海 201306;2.上海河口海洋测绘工程技术研究中心,上海 201306)

摘要为研究深度学习模型在预测叶绿素a浓度中的作用,使用长短期记忆网络(LSTM)、门控循环单元网络(GRU)和卷积神经网络(CNN)3种深度学习模型比较分析长江口叶绿素a浓度预测精度。结果表明:GRU的RMSE为1.452 9 mg/m3,MAPE为15.171 6%,GRU可以有效地捕捉短期依赖关系;LSTM的RMSE为1.493 1 mg/m3,MAPE为14.759 1%,LSTM更能捕捉到关键的长期依赖关系;CNN的RMSE为1.756 1 mg/m3,MAPE为16.936 6%,CNN在分析具有空间局部性的特征数据方面效果较好。研究表明,本文提出了一种模型注意力得分计算方案,优化了GRU模型并提高了预测精度,总体RMSE为0.921 9 mg/m3,MAPE为11.209 4%。

关键词深度学习;叶绿素a浓度;LSTM;GRU;CNN;注意力机制;长江口

深度学习模型通过模拟人脑神经网络的结构和功能实现对数据的自动学习和特征提取。目前,该模型被广泛应用于数据的建模和预测[1]。叶绿素a浓度是水质状况监测的重要指标[2],对其浓度进行监测成为预防水质恶化和浮游植物过度增长的有效手段[3-4],卫星遥感技术在该监测中的应用不仅提高了监测的效率,还为更全面的水体环境保护提供了坚实的科学基础。而深度学习技术为利用遥感数据监测和预测叶绿素a浓度提供了有效的手段。

作为深度学习的核心,神经网络算法被证实在遥感数据处理方面具有优势。如丛丕福[5]利用长时间序列SeaWiFS和MODIS数据对中国陆架海叶绿素a浓度的变化情况进行了研究,论证了对于Ⅱ类水体叶绿素a浓度反演这种非线性的过程,研究表明,神经网络算法比传统算法更加具备优势。Xu等[6]利用贝叶斯网络(Bayesian network,BN)模型对渤海湾沿海地区叶绿素a的生长进行建模,模型预测的平均准确率为65%。在大范围、长时间线的数据处理方面,深度学习也展现出优势。如于博文[7]利用深度学习模型预测了全球海洋叶绿素a浓度,比较了CNN模型和浅层模型支持向量回归SVR,证明了CNN模型可以准确、快速且稳健地反演全球海洋叶绿素a浓度。Cho等[8]利用叶绿素a浓度的日数据,通过与监测站和辅助环境数据比较发现,深度学习模型在预测目标区域的叶绿素a浓度上表现优于传统模型。石绥祥等[9]对单个站点的连续监测资料分别计算与叶绿素a浓度的相关性,并以此优化模型结果,再利用多种神经网络预测模型对比预测效果,证明了长短期记忆网络(Long Short-Term Memory,LSTM)预测海水叶绿素a浓度的可行性。深度学习模型因其可根据数据特征进行相关优化,具有较强的可塑性。如Srisuksomwong等[10]提出了一种使用双向长短期记忆(Bi-LSTM)神经网络模型来模拟安达曼海叶绿素a浓度的方法,其决定系数为0.999 18,且均方误差(Mean square error,MSE)和均方根误差(Root mean square error,RMSE)值较小,显示出良好的预测能力。Fan等[11]提出了一种基于一维卷积神经网络的CHLNET的深度学习模型,并发现CHLNET在处理噪声和沿海区域的细节变化时表现得更为稳定,显示出更高的噪声容忍度和空间分辨率下的细节捕捉能力。Salah等[12]提出了一种B1D-CNN的卷积神经网络算法,利用Sentinel-2卫星数据估计叶绿素a浓度,结果表明,B1D-CNN在精度评价RMSE、绝对平误差(Mean absloute error,MAE)和平均绝对百分比误差(Mean absolute percentage error,MAPE)等指标上优于传统模型,尤其是在识别有害藻华事件中的高叶绿素a浓度区域时表现出色。

传统的叶绿素a浓度的测量方法往往依赖于实验室分析或现场采样,这些方法虽然精确但耗时长且成本较高[9]。对于环境监测和生态保护而言,需要实时、准确地获取叶绿素a浓度信息,传统方法无法满足这一需求,而深度学习模型可实现对水体中叶绿素a浓度的快速反演,为环境监测提供实时数据支持。同时,深度学习模型可预测叶绿素a浓度的变化趋势,帮助在生态保护、水资源管理、渔业生产等领域做出更加科学的决策[7]

深度学习模型能够从大量数据中自动提取有用的特征信息[13],这些信息对于叶绿素a浓度的反演至关重要。与传统方法相比,深度学习模型可以更高效地处理复杂的数据集。深度学习模型可以实现高度自动化的数据处理和分析过程,减少人工干预和误差,这有助于提高工作效率,降低人力成本。此外,深度学习模型在处理复杂非线性关系时具有较高的预测精度[13]。叶绿素a浓度的变化与多种环境因素密切相关,这些因素之间可能存在复杂的非线性关系,深度学习模型能够更好地捕捉这些关系,从而提高反演的准确性。深度学习模型具有较强的适应性,可以针对不同的环境和条件进行训练和优化。这使得模型能够更好地适应各种实际场景,提高叶绿素a浓度反演的可靠性。

深度学习模型已经被充分证明,可以有效地预测海水叶绿素a浓度[12],而已有研究都着重于单一深度学习模型的比较,同类深度学习模型的对比和优化器对于不同的深度模型优化效果比较相对较少。本研究中通过比较不同深度学习模型在长江口叶绿素a浓度预测中的表现,并比较优化器在不同模型下的优化效果,以期对相关模型进行优化,提高预测精度,并为选择合适的模型提供科学参考。

1 研究范围和数据

本研究区位于长江口(30°~32° N,121°~122° E)。叶绿素a浓度是水体中藻类生物量的重要指标,反映了长江口水生态系统的营养状态和生产力水平[2]。叶绿素a浓度的预测可以帮助相关部门更好地了解藻类的生长规律和空间分布,及时发现和应对潜在的水质问题,并采取相应的调控措施,保护渔业资源和生态环境[14]。本研究中使用的是MODIS-Aqua卫星L3级叶绿素a月平均影像数据,下载于美国国家航空航天局提供的水色卫星网站,网址为https://oceandata.sci.gsfc.nasa.gov/。其空间分辨率为4 km,获取时间跨度为2016年1月—2022年12月,共84个月的叶绿素a浓度月平均影像数据。MODIS每1~2 d可重复观测整个地球表面,得到36个波段的观测数据。L3是对L1B数据进行各种应用处理之后所生成的特定应用数据产品。水文实测数据来源于上海海洋环境监测预报中心,数据时间区间为2020年9月—2022年8月,时间分辨率为30 min,为与遥感数据相对应,计算月平均叶绿素a浓度数据后,找到相对应点位补充到数据集。

2 技术流程

技术流程如图1所示。

图1 技术流程

Fig.1 Flowchart of technical process

以MODIS下载的叶绿素a浓度月平均反演数据和实测点数据组成的数据集为原始数据,在原始数据的基础上进行相邻非缺失值的线性插值,以提高MODIS数据的顺滑性,即对2016年1月—2022年12月的数据处理得到总共84组数据,后按7∶3的比例分为训练集、验证集后,再对其进行标准化。Z-score标准化是一种常见的数据标准化方法,主要用于将不同单位或不同量级的数据转化为标准正态分布中的Z-score。该方法通过先将原始数据减去其平均值,再除以其标准差来实现标准化。

具体而言,假设有一个含有n个观测值的数据集X,其中μσ分别为X数据集的平均值和标准差,则X数据集中第i个观测值的Z-score计算公式为

Zi=(xi-μ)

(1)

通过这种标准化方法,可以将原始数据转化为均值为0、标准差为1的标准正态分布中的分数,这样便于对不同变量进行比较和分析。

将预处理后的数据分别带入LSTM、CNN和GRU中进行模型训练。LSTM是一种用于处理和预测时间序列数据的深度学习模型,特别适用于长序列和处理长期依赖关系的任务[9]。LSTM的核心思想是引入了一种称为“记忆单元”的结构,它负责存储和访问长期信息。每个记忆单元都包含一个输入门、一个遗忘门、一个输出门和一个记忆单元状态。

GRU是一种类似于长短时记忆网络的循环神经网络变体,用于处理和建模时间序列数据。GRU通过引入门控机制(类似于LSTM)来解决梯度消失的问题。其核心思想是使用更新门(update gate)和重置门(reset gate)来控制信息的流动。这两个门的存在使得GRU能够更灵活且选择性地更新和重置其内部状态,从而更好地捕捉序列中的长期依赖关系。

CNN是一类在图像处理和模式识别领域取得成功的深度学习模型。其核心思想是通过卷积操作来提取图像中的特征,并通过池化操作降低特征图的维度,最终通过全连接层进行分类或回归。

表1 3种深度学习模型介绍

Tab.1 Description of the three deep learning models

LSTM GRU CNN 关键组成部分keycomponents输入门:it遗忘门:ft输出门:ot记忆单元:ct隐藏状态:ht重置门:rt更新门:zt隐藏状态:ht卷积层:yc池化层:yp全连接层公式formulait=σ(Wxixt+Whiht-1+bi)ft=σ(Wxfxt+Whfht-1+bf)ot=σ(Wxoxt+Whoht-1+bo)ct=ft☉ct-1+it☉tanh(Wxcxt+Whcht-1+bc)ht=ot☉tanh(ct)rt=σ(Wxrxt+Whrht-1+br)zt=σ(Wxzxt+Whzht-1+bz)ht=(1-zt)☉ht-1+zt☉tanh[Wxhxt+Whh(rt☉ht-1)+bh]yc=σ(W∗x+b)yp=pooling(x)参数介绍parameterintroductionxt是当前时间步的输入ht-1是上一个时间步的隐藏状态W是对应的权重矩阵b是对应的偏置σ是Sigmoid激活函数☉是逐元素乘法(Hadamard积)tanh是双曲正切激活函数xt是当前时间步的输入ht-1是上一个时间步的隐藏状态W是对应的权重矩阵b是对应的偏置σ是Sigmoid激活函数☉是逐元素乘法(Hadamard积)tanh是双曲正切激活函数x是输入数据W是卷积核(滤波器)b是偏置项∗是卷积操作σ是激活函数y是输出特征图

本研究中在模型训练部分引入自适应矩估计算法(Adaptive Moment Estimation,Adam)优化器。Adam算法结合了动量梯度下降和均方根传播(Root Mean Square Propagation,RMSProp)的思想,旨在解决学习率在训练过程中需要手动调整的问题[15]

先将参数,包括权重和偏置等初始化;接着初始化动量项m(momentum)和RMSProp项v,将它们初始化为零向量;然后再进行梯度计算,在训练集上计算损失函数对于参数的梯度;接着更新动量项,使用一种梯度的指数加权移动平均,即动量来跟踪过去梯度的信息。动量项m的更新公式为

m=β1×m+(1-β1J(θ)。

(2)

式中:β1为动量的衰减率;J(θ)为当前梯度。再更新RMSProp(一种梯度平方的指数加权移动平均)项,使用RMSProp来跟踪过去梯度平方的信息。RMSProp项v的更新公式为

v=β2×v+(1-β2)×(J(θ))2

(3)

式中:β2表示RMSProp的衰减率;再接着进行校正偏差,由于在初始时动量项m和RMSProp项v都接近零,可能导致估计的期望值偏向于零;因此,需要对它们进行偏差校正,这一步鲁棒性提高了算法的性能;最后更新参数,使用校正后的动量项和RMSProp项来更新参数。学习率α也被称为步长,是一个超参数,可以手动调整。

(4)

式中:表示为了数值稳定性而加的小常数,防止分母为零,但同时要注意学习率α的选择仍然是一个重要的超参数,需要进行调优。所以计划在对完整数据进行深度学习前,先对小份数据集进行学习并验证其效果,确认其有效性。

精度验证主要通过RMSE、R2和MAPE来评估,RMSE为均方根误差,可以量化评估数据在最佳拟合线附近的集中程度;R2为决定系数,是评估模型对数据拟合程度的一个指标;MAPE为平均百分比误差,衡量了模型预测值与实际值之间的百分比误差的平均值,有助于了解预测的相对准确性。

计算公式为

(5)

(6)

(7)

式中:n为数据总量;为第i个数据的预测值;yi为第i个数据的真实值;为数据真实值的平均值。在模型训练结束后,利用验证集和实测数据验证精度,并利用上述精度标准对模型作出评价,最后进行效果比较,并对模型进行优化。

3 结果分析和模型优化

3.1 Adam优化器效果

先对Adam优化器效果进行比较,选取2016年12个月的叶绿素a浓度月平均数据同整体数据同样操作,按7∶3比例分为训练集和验证集,对其进行学习预测。

通过对比表2,计算发现通过Adam优化器,CNN的RMSE性能提升9.16%,训练时间性能提升20.86%;LSTM的RMSE性能提升8.76%,训练时间性能提升22.78%;GRU的RMSE性能提升9.81%,训练时间性能提升25.88%。在叶绿素a浓度预测任务中,使用Adam优化器降低了所有模型的RMSE。在此过程中,更低的RMSE表示模型更准确地预测了实际的叶绿素a浓度,体现了Adam优化器有利于对叶绿素a浓度的预测学习。同时在使用Adam优化器后,得益于不同参数可具有不同的学习率,训练时长也有大幅度减少。

表2 Adam优化器的3个模型性能比较

Tab.2 Comparision among performances by three models of Adam optimizer

模型modelRMSE/(mg·m-3)(无Adam优化器)时间time/h(无Adam优化器)RMSE/(mg·m-3)(有Adam优化器)时间time/h(有Adam优化器)LSTM1.65396h59min1.50935h23minGRU1.64236h54min1.48125h09minCNN1.77527h43min1.61216h11min

3.2 预测结果

训练结束后,以测试集首月的数据,即2021年8月的预测数据为例,将其与原始数据对比处理(图2)。

图2 2021年8月原始数据和预测数据的回归图和残差图

Fig.2 Regression and residual plots of original and forecased data in August 2021

图3 注意力权重热力图

Fig.3 Heat maps of the attention weights

R2为拟合率,RMSE为均方根误差。图2(a)为2021年8月原始数据和LSTM预测数据的回归图,可以更清晰地看见数据分布较为均匀,红点为实测数据,分布也较为均匀。其拟合率为0.690 0,RMSE为1.526 0 mg/m3,证明LSTM在预测叶绿素a浓度方面有较好的效果。图2(b)展示了2021年8月原始数据和GRU预测数据的回归图,数据点分布也较为均匀。其拟合率为0.733 9,RMSE为1.414 0 mg/m3,证明了GRU在预测叶绿素a浓度方面比LSTM效果更好。图2(c)展示了2021年8月原始数据和CNN预测数据的回归图,从图2(c)可见,其拟合率为0.657 3,RMSE为1.604 6 mg/m3,证明CNN在预测叶绿素a浓度方面性能不如GRU和LSTM。

绘制残差图时,为便于观察,已对所有差异值取绝对值。图2(d)展示了2021年8月原始数据和LSTM预测数据残差,误差较大的地方均在近岸地区和原始数据叶绿素a浓度较高点附近,可引入空间相关要素优化模型,提高预测效果。图2(e)呈现了2021年8月的原始数据与GRU模型预测数据的残差图,从图中可以看出,与LSTM模型结果相似,误差较大的区域主要集中在近岸地带及原始数据中叶绿素a浓度较高的点附近。然而,相较于LSTM模型,GRU模型的残差较大值的总量有所减少,这反映在所计算的RMSE值降低和拟合率的提升上。图2(f)展示了2021年8月原始数据和CNN预测数据残差图,与前两种模型结果类似,误差较大的地方均在近岸地区和原始数据叶绿素a浓度较高点附近,但相较于LSTM残差较大值的总量增多,在一些原始数据叶绿素a浓度较低点的残差值也有增加,对应所计算的RMSE值增大和拟合率降低。

各模型的训练结果见表3,从表3可见,LSTM和GRU的性能优于CNN,更适合对海水叶绿素a浓度进行预测。GRU相对于LSTM来说结构更简单,参数更少,更容易训练。对于中等时间尺度的序列任务,尤其是在硬件资源有限的情况下,是一个较好的选择。GRU在2021年8月预测值和真实值的拟合率为0.733 9,而LSTM对相同数据的拟合率只有0.690 0,两者对总数据集的拟合率是相近的。可见GRU和LSTM的差异主要在于捕捉短期和长期依赖关系,通过GRU在2021年8月预测值和真实值的拟合率高于LSTM,可知在短期数据集内GRU更具有优势;且比较LSTM和GRU处理的总数据集后的MAPE,LSTM的MAPE低于GRU,可见LSTM更擅长捕捉长期依赖关系,在对3个模型的误差值统计后发现,LSTM、GRU和CNN的误差值为0~1 mg/m3的区间,占总数据集的占比分别为19.632 4%、18.916 4%和23.365 9%,可见CNN模型在提取局部特征方面表现较好。

表3 各时间序列深度学习模型效果

Tab.3 Effect of the deep learning model for each time series

模型modelRMSE(mg·m-3)R2MAPE/%时间time/hLSTM1.49310.685914.759123h19minGRU1.45290.690115.171620h58minCNN1.75610.642416.936624h12min

3.3 模型优化

综合比较后选取GRU模型为基础模型,并引入注意力机制。长江口为高浑浊度水体,通常包含大量的杂质和颗粒,这可能导致水体中的叶绿素a分布不均匀。通过引入注意力机制,模型可对不同位置的叶绿素a浓度赋予不同的注意力权重,从而更灵活地适应水体中叶绿素a的局部分布。

注意力机制是深度学习模型中的一种技术,它使模型能够在处理输入数据时更加专注于重要的部分。在注意力机制中,通常会计算每个输入位置的权重,这些权重用于加权输入特征。对于一个输入位置i,其注意力权重计算可以使用如下公式

(8)

式中:scorei为与输入位置i相关的分数,通常通过一个学习的参数计算得到。在计算了每个位置的注意力权重后,可以将这些权重应用于原始输入特征,得到加权的输入特征。对于一个输入位置i,其加权特征计算公式为

Weighted_Featurei=Attention_Weighti×Input_Featurei

(9)

最终的加权特征是所有位置加权特征的求和,其计算公式为

(10)

在深度学习模型中,注意力机制的整体计算可以嵌入到网络的不同层中。考虑一个简化的注意力机制,其公式表示为

Output=f(Input,Attention_Weight)。

(11)

式中:f表示注意力机制的函数,可以包含各种形式的权重计算和加权特征汇总。

本文根据LSTM的误差分布重构注意力权重,在考虑计算量、序列长度和精度要求后选择将数据分为5×5的区域来计算注意力得分,将每个小区域里的误差求和后,将误差归一化到0~1区间后作为注意力权重,以此优化GRU模型引入注意力机制。注意力得分计算公式为

(12)

式中:G为注意力得分;q为查询矩阵;k为键矩阵;dqk的矩阵维度。上式除以的原因是为防止注意力得分过大,影响整体运算体量,X为通过LSTM计算的误差分布参数,通过可视化,初始注意力得分主要集中在中部和边缘数据区域。

与上述3种深度学习模型同样,选取2021年8月的数据为例,绘制如图4所示。在引入注意力机制后,通过图4(a)回归图可以发现整体的数据更加平滑,拟合率(R2)为0.922 5也有了显著提升,相较于原GRU模型提高了约25.70%,RMSE为0.763 0 mg/m3,对比原GRU模型也有显著提升。通过图4(b)残差图,可以发现近岸的差异值减少,整体残差更为均匀分布,这意味着引入注意力机制的GRU模型对高浑浊度水体的叶绿素a浓度预测有了显著改善。残差图中无明显大区域的大幅度偏差,这进一步证明了模型的预测能力和稳定性。然后利用完整的训练集进行训练得到完整训练结果。

图4 2021年8月原始数据和引入注意力机制的GRU预测数据回归图和残差图

Fig.4 Regression map and residual plot of GRU prediction data with introduced attention mechanism in August 2021

所有预测结果可视化图如图5所示,可以发现数据的变化更加平缓化,模型对叶绿素a浓度的预测结果更加接近真实值。引入注意力机制后,模型能够更准确地捕捉水体中叶绿素a的局部变化,并更好地适应高浑浊度水体的特性。这使得预测结果更加可靠,并为水质监测提供了有力的支持。

图5 引入注意力机制的GRU预测结果可视化图

Fig.5 Visualization plot of the GRU forecasting results by introducing an attention mechanism

本文经过试验,证明Adam优化器在叶绿素a浓度预测方面具有较好效果,且对于越简单的模型越有更好的优化效果,大大节省了模型训练的效率。经过模型训练和验证,得到了基于LSTM、GRU和CNN的叶绿素a浓度预测模型。对比试验结果表明,这3种深度学习模型在叶绿素a浓度预测中均取得了较好的效果,都可用于对海水叶绿素a浓度的反演,但在不同区域上存在一定差异。试验结果表明,引入注意力机制的GRU模型在预测高浑浊度水体叶绿素a浓度方面取得了显著成果,并提出了一种注意力得分计算优化公式,这为水质监测和水环境管理提供了新的思路和方法。

4 结论

1)研究表明,LSTM模型在捕捉长期依赖关系上有一定优势,而CNN模型在提取局部特征方面表现较好。GRU由于结构更简单,可以减少时间消耗,并更容易捕捉到短时间的变化。且均在近岸地区误差较大。

2)通过可视化分析,发现引入注意力机制后的GRU模型在预测结果上更加平滑,更接近真实值,且残差分布更加均匀。这表明注意力机制有助于模型更好地适应高浑浊度水体的特性,提高了预测的稳定性和可靠性。

3)本研究仍存在一定局限性。首先,试验样本较小,可能无法涵盖各种复杂的水体环境。以后研究中可考虑扩大样本量,以提高模型的泛化能力。未来还可以研究如何将注意力机制应用于多参数水质预测,以提供更全面的水质评估。

参考文献:

[1] GOETZ S J,GARDINER N,VIERS J H.Monitoring freshwater,estuarine and near-shore benthic ecosystems with multi-sensor remote sensing:an introduction to the special issue[J].Remote Sensing of Environment,2008,112(11):3993-3995.

[2] 梁兴飞,郭宗楼.超声辅助热乙醇提取法测定浮游植物叶绿素a的方法优化[J].水生生物学报,2010,34(4):856-861.LIANG X F,GUO Z L.Optimization of the method on determination of phytoplankton chlorophll a by using ultrasound-assisted hot-ethanolextraction[J].Acta Hydrobiologica Sinica,2010,34(4):856-861.(in Chinese)

[3] 张成才,窦小楠,张楠,等.遥感影像分类方法在水体面积估算中的比较研究[J].气象与环境科学,2008,31(3):24-28.ZHANG C C,DOU X N,ZHANG N,et al.Comparative study of the remote sensing image classification method based on water area estimation[J].Meteorological and Environmental Sciences,2008,31(3):24-28.(in Chinese)

[4] NAZEER M,NICHOL J E.Development and application of a remote sensing-based Chlorophyll-a concentration prediction model for complex coastal waters of Hong Kong[J].Journal of Hydrology,2016,532:80-89.

[5] 丛丕福.海洋叶绿素遥感反演及海洋初级生产力估算研究[D].北京:中国科学院研究生院(遥感应用研究所),2006.CONG P F.Study on remote sensing inversion of marine chlorophyll and estimation of marine primary productivity[D].Beijing:Graduate School of Chinese Academy of Sciences (Institute of Remote Sensing Applications),2006.(in Chinese)

[6] XU X F,NIE H T,TAO J H.Modeling the dynamics of chlorophyll-a in Bohai Bay using a Bayesian network approach[J].Advanced Materials Research,2012,610/611/612/613:1056-1059.

[7] 于博文.基于深度学习的VIIRS卫星全球海洋叶绿素a浓度反演[D].北京:中国地质大学(北京),2019.YU B W.Inversion of global ocean chlorophyll a concentration based on deep learning by VIIRS satellite[D].Beijing:China University of Geosciences(Beijing),2019.(in Chinese)

[8] CHO H,PARK H.Merged-LSTM and multistep prediction of daily chlorophyll-a concentration for algal bloom forecast[J].IOP Conference Series:Earth and Environmental Science,2019,351(1):012020.

[9] 石绥祥,王蕾,余璇,等.长短期记忆神经网络在叶绿素a浓度预测中的应用[J].海洋学报(中文版),2020,42(2):134-142.SHI S X,WANG L,YU X,et al.Application of long term and short term memory neural network in prediction of chlorophyll a concentration[J].Haiyang Xuebao,2020,42(2):134-142.(in Chinese)

[10] SRISUKSOMWONG P,HAMMACHUKIATTIKUL P.The chlorophyll-a modelling over the andaman sea using Bi-directional LSTM neural network[C]//2022 37th International Technical Conference on Circuits/Systems,Computers and Communications (ITC-CSCC).Phuket,Thailand.IEEE,2022:955-958.

[11] FAN D L,HE H C,WANG R S,et al.CHLNET:a novel hybrid 1D CNN-SVR algorithm for estimating ocean surface chlorophyll-A[J].Frontiers in Marine Science,2022,9:934536.

[12] SALAH M,HIGA H,ISHIZAKA J,et al.B1D-CNN:a novel convolution neural network-based chlorophyll-a retrieval algorithm for sentinel-2 data[C]//IGARSS 2023-2023 IEEE International Geoscience and Remote Sensing Symposium.Pasadena,CA,USA.IEEE,2023:3950-3953.

[13] 张雪薇,韩震.基于ConvGRU深度学习网络模型的海表面温度预测[J].大连海洋大学学报,2022,37(3):531-538ZHANG X W,HAN Z.Prediction of sea surface temperature based on ConvGRU deep learning network model[J].Journal of Dalian Ocean University,2022,37(3):531-538.(in Chinese)

[14] 徐鹏飞,程乾,金平斌.基于神经网络模型的千岛湖清洁水体叶绿素a遥感反演研究[J].长江流域资源与环境,2021,30(7):1670-1679.XU P F,CHENG Q,JIN P B.Inversion of chlorophyll-a of clean water in Qiandao Lake with remote sensing data using the neural network[J].Resources and Environment in the Yangtze Basin,2021,30(7):1670-1679.(in Chinese)

[15] KINGMA D P,BA J,HAMMAD M M.Adam:a method for stochastic optimization[EB/OL].20 14:1412.6980.http://arxiv.org/abs/1412.6980v9.

Study on application of deep learning models to forecast chlorophyll-a concentration in the Estuary of Changjiang River

CHEN Wei1,HAN Zhen1,2*

(1.College of Oceanography and Ecological Environment,Shanghai Ocean University,Shanghai 201306,China;2.Shanghai Estuary Marine Mapping Engineering Technology Research Center,Shanghai 201306,China)

AbstractTo study the role of deep learning models in forecasting chlorophyll a concentration,we did a comparative analysis of precision with the three deep learning models,namely Long Short-Term Memory (LSTM),Gated Recurrent Unit (GRU),and Convolutional Neural Network (CNN),to forecast chlorophyll a concentration in the Estuary of Changjiang River.The root mean square error (RMSE) and mean absolute percentage error (MAPE) for the GRU model were 1.452 9 mg/m3 and 15.171 6%,respectively,indicating that the GRU model can effectively capture short-term dependencies.The RMSE and MAPE for the LSTM model were 1.493 1 mg/m3 and 14.759 1%,respectively,suggesting that the LSTM model is better at capturing key long-term dependencies.The RMSE and MAPE for the CNN model were 1.756 1 mg/m3 and 16.936 6%,respectively,meaning that the CNN model performs well in analyzing feature data with spatial locality.Based on these findings,we propose an attention score calculation scheme that optimizes the GRU model and improves the forecast precision,with an overall RMSE of 0.921 9 mg/m3 and a MAPE of 11.209 4%.

Key wordsdeep learning model; chlorophyll a concentration; LSTM; GRU; CNN; attention mechanism; Changjiang estuary

中图分类号S 19;TP 18

文献标志码A

DOI10.16535/j.cnki.dlhyxb.2024-168

文章编号2095-1388(2025)02-0330-08

收稿日期2024-08-04

基金项目上海市海洋局科研专项(沪海科2019-03);教育部产学合作协同育人项目(202102245031)

作者简介陈炜(2000—),男,硕士研究生。E-mail:legendskm17158@163.com

通信作者韩震(1969—),男,博士,教授。E-mail:zhhan@shou.edu.cn