应用气象学报  2012, 23 (3): 355-363   PDF    
一种人工神经网络云分类方法的改进与应用
张振华1, 苗春生1, 曾智华2, 师春香3     
1. 南京信息工程大学大气科学系,南京 210044;
2. 中国气象局上海台风研究所,上海 200030;
3. 国家气象信息中心,北京 100081
摘要: 采用2005—2009年FY-2C静止气象卫星可见光和红外自旋扫描辐射计的红外1(IR1)、红外2(IR2) 和水汽 (WV) 亮温资料,选取2449个云分类样本。设计两层嵌套的前向传递后向反馈 (BP) 人工神经网络模型,第1层网络选取IR1,IR2,WV亮温及IR1与WV亮温差和IR2与WV亮温差5个特征量,第2层网络选取特征量IR1与IR2亮温差,两层网络都采用一层隐含层且带有附加动量法的简单网络,降低了网络的冗余度。误差分析表明:嵌套BP人工神经网络模型的分类准确率在中云和薄卷云这两类上分别提高了42.7%和11.3%,整个分类模型的平均平方误差和标准化平均平方误差分别降低了6.1%和44.7%,相关系数提高了3.4%。通过3个个例的对比分析发现,嵌套模型的分类结果比传统模型的分类结果更合理,特别是在中低云和薄卷云的云量和位置分辨能力上有了较大提高。
关键词: 云分类    FY-2C气象卫星    BP人工神经网络    
Improvement and Application of Artificial Neural Networks to Cloud Classification
Zhang Zhenhua1, Miao Chunsheng1, Zeng Zhihua2, Shi Chunxiang3     
1. College of Atmospheric Science, Nanjing University of Information Science & Technology, Nanjing 210044;
2. Shanghai Typhoon Institute, CMA, Shanghai 200030;
3. National Meteorological Information Center, Beijing 100081
Abstract: 2449 cloud classification samples are artificially selected from infrared channel 1, infrared channel 2 and water vapor channel of VISSR on FY-2C geostationary meteorological satellite during 2005—2009. Different linear combination of three channels are selected as feature values, which are brightness temperature of IR1, IR2, WV, and brightness temperature difference of IR1 to IR2, IR1 to WV, IR2 to WV. According to statistical theory, the sample probability distribution is assumed to help to remove some apparent unreasonable data such as outliers, and to understand cloud normal features better. It is found that the brightness temperature difference of IR1 to IR2 is most sensitive to the amount of thin cirrus cloud in 6 selected values. On the other hand, the error of the BP neural network model mostly comes from the contradiction of this feature too. A nested BP artificial neural network model is designed, and it's composed of two layers. The first layer includes five features of brightness temperature of IR1, IR2, WV, and brightness temperature difference of IR1 to WV, IR2 to WV that are used to classify each pixel to one of four categories such as clear, mixed cloud, thick cirrus cloud and strong convective cloud. And the second layer includes just one feature, brightness temperature difference of IR1 to IR2 that are used to classify mixed cloud to low-level cloud, mid-level cloud or thin cirrus cloud. Finally, every pixel is classified into one of total 6 categories corresponding to each color. Both layers adopt a BP neural network, the most widely used algorithm for generating classifiers, with one hidden layer and the additional momentum method, not only accelerating the training speed, but also reducing the redundancy of the networks. Error analysis shows that the accuracy rates of the nested BP artificial neural network for types of mid-level cloud and thin cirrus cloud have increased by 42.6% and 11.3%, respectively. The mean square error and normalized mean square error of the whole classification model have decreased by 6.1% and 44.7% with the correlation coefficient increasing by 3.4%. By comparison of the classification results from 3 tests of tropical, subtropical areas and tropical cyclone, it shows that the nested model identifies thin cirrus cloud more accurately than the traditional model. Therefore, the results of the nested model are more reasonable than the traditional model.
Key words: cloud classification     FY-2C meteorological satellite     BP neural network    
引言

卫星资料已经是大气科学研究中不可或缺的资料,卫星云图作为卫星资料中尤其重要的一部分,也已经被广泛应用,云分类产品则是卫星云图中非常重要的产品之一。Shenk等[1]1976年基于辐射传输理论,运用多通道阈值方法对Nimbus-3卫星上的中分辨率红外辐射计 (Medium Resolution Infrared Radiometer) 资料进行热带海洋云分类。20世纪80年代末,随着人工神经网络方法的发展及其在分类和预测问题上的突出表现,也被渐渐引入到大气科学研究以及其他学科中,比如气候预测、台风预报、降水估计、医学分类等[2-13]。90年代初,云分类开始采用神经网络方法,调整网络类型、网络结构、激励函数、样本形式和特征量,神经网络方法在云分类中取得了不错的结果[14-20]。国家卫星气象中心也有对外发布的业务云分类产品[21],该产品先采用方差和平均值的抛物线拟合方程区分出高云及晴空混合像元和中低云像元,再通过直方图分析出各云类的阈值,最后用欧几里得距离和斜率两个标准进行聚类, 得到6类云以及晴空。

研究已经证明了人工神经网络对非线性关系的模拟能力很强,特别是在分类问题中已被广泛应用[22-23]。由于神经网络对所输入的特征量没有严格的规则,虽然能得到较好的结果,但是训练样本中存在的冲突和矛盾会导致网络的准确性下降。金龙等[24]2004年通过主成分分析法 (PCA) 改善了模型的过拟合问题,俞善贤等[25]2004年通过逐步回归方法找出主要影响因子输入到神经网络中,来降低网络的冗余度,这类方法都取得了一定的效果。本文旨在对FY-2C气象卫星资料运用改进的嵌套BP (back propagation) 人工神经网络模型得到云分类产品,剔除个别通道中的噪音,提高云分类产品的分析精度,并且通过不同个例试验,具体分析新的云分类方法对传统BP人工神经网络方法的改进。

1 资料与检验方法 1.1 资料

FY-2C气象卫星携带有可见光和红外自旋扫描辐射计 (VISSR),表 1列出了VISSR各通道参数, 时间分辨率为每小时获得1次数据。

表 1 VISSR通道特征 Table 1 Specifications of VISSR channels

本文根据陈渭民等[26]主观经验的云类分辨方法,共采集2449个样本,样本时间范围为2005—2009年。表 2为云分类和样本数, 本文中的每个样本包含了所采集像元的红外1(IR1)、红外2(IR2) 和水汽 (WV)3个通道的亮温值。

表 2 云分类和样本信息 Table 2 The information of classes and samples

云图像元分为晴空、低云、中云、薄卷云、厚卷云和强对流云6类。这6类云包含了地面观测中的主要云类。其中,晴空分为海洋和陆地两类。从理论上讲,每一类云的样本数应该相当,但是因为大气中中云往往与高云同时存在,卫星从上向下观测,常常观测不到中云, 所以中云样本数量偏少。而薄卷云和厚卷云虽然同为卷云但是辐射性质不相同,所以将其分开。

1.2 样本特征

本文收集了由红外和水汽通道亮温线性组合得到的6个特征量,IR1,IR2和WV分别为3个通道的亮温,IR1与IR2亮温差,IR1与WV亮温差和IR2与WV亮温差,如表 3所示。需要指出,可见光通道虽然对低云有很好的识别能力,但是在夜间无法获得可用的资料,所以不能在连续时间上应用。而中红外通道IR4在夜间遥感红外辐射,白天不仅遥感红外辐射而且会受到反射的太阳光的影响,所以也无法直接用于云分类中。

表 3 云分类特征量表 Table 3 The selected features of the cloud classification

图 1看出每类云的概率分布基本符合正态分布。7种云分类的特征量分布从高到低分别为晴空海洋、晴空陆地、低云、中云、薄卷云、厚卷云和强对流云。由于晴空的红外亮温特性比较显著,且水汽通道又无法获取低层信息,所以在IR1亮温和IR1与WV亮温差图中,海洋和陆地的特征量明显高于其他5类,而在WV亮温图中,晴空海洋、晴空陆地和低云的特征量分布几乎全部重叠。WV亮温图中,由于该特征量对晴空或者厚的云类没有分辨能力,所以重叠现象严重。从图 1整体来看,处于中间位置的低云、中云和薄卷云在各特征量中的重叠最严重。这种信息冲突是给云分类神经网络带来误差的最大来源,本文的目的就是要将这种误差影响降到最低。另外,厚卷云和强对流云的特征量也明显低于其他几类,由于强对流云中的极端低温较多,水汽的向上输送更强烈,因此从IR1和WV亮温图可以发现,强对流云的特征量呈偏态分布。总的来说,每个特征量的云类在边缘都会出现一定的重叠现象,这是大气中云的复杂性决定的。

图 1. 样本特征量概率分布 Fig 1. The probability distribution of cloud sample features

1.3 模型检验指标

神经网络模型的精度通过以下4个误差统计量来检验,分别是模型整体的平均平方误差 (EMS) 和标准化均方误差 (ENMS),模型输出类型与样本期望输出类型的相关系数 (r) 以及测试样本准确率。

平均平方误差 (EMS):

(1)

式 (1) 中,dij是第i个样本在第j个输出神经元上期望的输出值,yij是第i个样本在第j个神经元的网络输出值,N是样本数,P是输出层神经元数。

标准化均方误差 (ENMS):

(2)

式 (2) 中,EMS代表式 (1) 中的平均平方误差,其他变量同上。

相关系数 (r):

(3)

式 (3) 中,d是样本的期望输出,y是样本的网络输出,其他变量同上。

因为本文的样本量充足,所以为了使模型训练的准确率更加可信,取30%的样本资料作为测试样本,测试样本由一组独立的正确的样本组成。将该组样本输入到经过训练后的网络模型中计算输出结果,然后将输出结果与原始样本进行比较,计算每一个分类的正确率。

测试样本准确率:

(4)

式 (4) 中,RAj是第j个输出神经元上的输出正确率。Rj是第j个输出神经元上的模型输出个数,Sj是第j个输出神经元上的期望输出个数。

2 嵌套BP云分类神经网络模型 2.1 BP人工神经网络

目前用于分类问题最广泛和最成熟的就是前向传递后向反馈人工神经网络。BP人工神经网络由信息的正向传播和误差的反向传播两个过程组成。BP人工神经网络的结构由输入层、隐含层和输出层组成,每一层中都有自身的神经元。神经元的作用函数是反映下层输入对上层节点刺激脉冲强度的函数,又称刺激函数。因为本文处理的是分类问题,所以采用了S型正切激活函数

(5)

式 (5) 中,xlin=βx,由线性转换函数经过缩放和偏移计算得到。

图 2是BP人工神经网络模型图,xn代表n个输入特征量,ym代表m个输出类别,wjiwlj分别代表第j个特征量到第i个隐含层神经元的权重系数和第1个隐含层神经元到第j个输入类别的权重系数。

图 2. BP人工神经网络模型图 Fig 2. The diagram of the BP artificial neural network model

2.2 嵌套BP人工神经网络模型

传统的人工神经网络模型是将所获取的特征量一并输入BP人工神经神经网络模型中,利用神经网络本身的非线性识别能力从大量的特征中获取有用信息,最终得到云分类结果。将表 3的6个特征量全部作为神经网络的输入,建立一个3层的传统BP人工神经网络模型,模型有6个输入和6个输出,中间的隐含层由14个神经元组成,隐含层和输出层的误差调整附加动量都是0.7,步长分别为1和0.1。本文采用附加动量法来减小模型在训练过程中出现局部最小值的可能性[27]

(6)

式 (6) 中,ηi为步长,ρ为动量,ΔWi为前后两次误差调整的差,Wi为误差调整的微分。网络训练停止条件为迭代次数到1000次或者是交叉验证的EMS达到0.01。

表 4为测试样本准确率分布表。从表 4可以发现,准确率平均值超过86%,其中晴空、低云和强对流云的准确率比较高,且均超过了90%。薄卷云和中云的准确率为82.9%和67.7%,中云有31.3%的样本被错判为低云,薄卷云分别有5.7%和9.5%被错判为中云和低云。根据图 1统计分析可以知道,由于多条探测通道中云类特征量有冲突,低云、中云和薄卷云是在卫星探测通道中重复较多的几类云,所以中低云和薄卷云的分类准确率较低。

表 4 测试样本准确率 (单位:%) Table 4 The accuracy rates of test samples (unit: %)

图 3表示各特征量的亮温范围。从图 3可以看出IR1, WV亮温和IR1与WV亮温差 (IR2与IR1类似,IR2与WV亮温差和IR1与WV亮温差类似)3个特征量从晴空到强对流云,亮温和亮温差逐渐降低。郁凡等[28]1997年总结了薄卷云的光谱特征。从IR1与IR2亮温差也不难发现,薄卷云的IR1与IR2亮温差的值明显大于中低云,而中低云的IR1与IR2亮温差没有明显区别,所以这一特点可以专门用来分辨中低云和薄卷云。

图 3. 样本独立特征量 Fig 3. The independent features of cloud samples

因此,设计一个嵌套BP人工神经网络模型用于改善传统BP人工神经网络模型中出现的上述缺陷。首先,利用IR1, IR2, WV亮温, IR1与WV亮温差和IR2与WV亮温差将目标像元分为晴空、中低云和薄卷云混合类、厚卷云和强对流云3大类,然后,通过单独的IR1与IR2亮温差作为特征量构造的BP人工神经网络模型将薄卷云从低云和中云中区分出来。图 4是嵌套BP人工神经网络模型图。

图 4. 嵌套BP人工神经网络模型 Fig 4. The diagram of the nested BP neural network model

目前对于网络参数的选择还没有一种统一的方法,多数采用的是多次试验来确定最优参数。研究表明,神经网络模型的结构在分类效果相当的情况下,网络结构越简单越好[29],本文的每个网络都选用1层隐含层的神经网络模型,隐含层的神经网络个数、附加动量和每一层的步长见表 5

表 5 云分类模型参数 Table 5 The parameters of each cloud classifier

2.3 对比分析

对传统BP人工神经网络模型和嵌套BP人工神经网络模型进行误差统计,从表 6可以看出嵌套网络的误差普遍小于传统神经网络,EMSENMS分别提高了6.1%和44.7%,模型输出和样本期望输出的相关系数也是前者高于后者,提高了3.4%。

表 6 准确率对比表 Table 6 Accuracy rates of the traditional and nested models

经过第1层神经网络分类,分类准确率都较高。其中,低云、中云和薄卷云的混合类达到了95.4%,厚卷云和对流云的准确率平均超过99%。在第2层分类后,低云准确率为92.3%,中云为96.6%,薄卷云达到89.3%。从图 5可以看出,中云和薄卷云的分类精度提高最多,分别为42.7%和11.3%。这是因为第2层网络剔除了IR1与IR2亮温差对中低云分类的噪音,又将薄卷云的信息通过嵌套网络充分保留在神经网络中。

图 5. 传统和嵌套模型准确率对比 Fig 5. The comparison of accuracy rates of the nested and traditional models

3 个例试验

为了对比嵌套BP人工神经网络模型和传统BP人工神经网络模型的云类分辨能力,本文还对不同区域和不同天气系统进行了不同个例试验。试验分别选取了热带和副热带地区以及台风云系共3个个例。

3.1 热带地区

图 6中热带地区为2009年4月30日08:00(北京时,下同) 的热带海洋云图。热带大气的特征是有明显的对流运动,强对流云的特点是云顶高度很高,在云顶周围有大片的卷云毡。从嵌套神经网络模型的云分类结果可以看出,该模型对对流中心的捕捉比较准确,与传统模型的结果基本一致。但传统模型中对流云周围的薄卷云的分类效果不佳,因为从可见光和红外云图来看,对流中心周围的云呈纤维状,是典型的卷云,但是由于受到海洋热辐射的影响,薄卷云的温度又偏高,所以被误判为了中云或者低云。而嵌套BP人工神经网络模型的结果在这一点上有明显改进。但是两种模型的云量较红外云图均偏少,特别是在海洋上且亮温很高的云类被误判成晴空的比例较高,如果能有效利用白天的可见光云图,应该可以对这些误判有所改善。

图 6. 嵌套和传统BP人工神经网络模型云分类对比 Fig 6. The comparison of cloud classification products by the nested and traditional BP neural network models

3.2 副热带地区

图 6中副热带地区为2009年4月30日12:00我国东南部地区的大范围低云区。在传统方法的结果图中几乎整片云区都被判为低云,但是从原始云图看,云区东部的边缘应该为薄卷云, 嵌套模型则较好地反映了这种情况。但这两种模型在东部洋面上有部分晴空被误判为低云,这是因为水汽通道无法准确得到大气低层信息,而嵌套模型也无法将水汽通道对低层云分类的影响去除,所以导致了这个结果。不过,通过对分类特征量的进一步分析,设计出针对低云的嵌套模型,相信可以改善这一结果。

3.3 热带气旋系统

图 6中热带气旋系统为2005年9月10日12:00的台风卡努 (0515) 的云分类,云分类图中的台风云系结构基本合理,两者相差不大。但是,传统模型分辨的台风西北部云系以中低云为主,朱乾根等[30]曾指出,在无云的台风眼外是一个涡旋云区,为环状高耸云墙,云墙外是以卷云为主的螺旋云区。这一点可以从台风原始图中目测得到验证,原始云图的台风边缘可以清晰地看到纤维状的云。所以,嵌套模型在这方面的表现略好于传统模型,但是差别并不明显。

4 小结与讨论

本文通过2005—2009年FY-2C静止气象卫星上的IR1,IR2,WV通道亮温资料的2449个云分类样本,从6个云分类特征量分析中发现:传统BP神经网络云分类模型在中低云和薄卷云上的分类误差主要来源于各特征量的重叠,以及IR1与IR2亮温差对于除薄卷云外其他云类信息不敏感。

结果表明,改进后的嵌套BP人工神经网络模型精度要明显高于传统BP人工神经网络模型,尤其是对薄卷云分辨能力的提升说明该方法对于改善人工神经网络模型的冗余度起到了正效果。通过误差分析发现,嵌套BP人工神经网络模型中的中云和薄卷云的分类精度,分别提高了42.7%和11.3%。

通过个例对比得到嵌套BP人工神经网络模型的结果在热带地区、副热带地区以及台风云系的中低云和薄卷云的表现都要略优于传统BP人工神经网络模型的结果,说明嵌套模型提高了对混淆性较强的云类,如中云、低云和薄卷云等的辨别能力。但是两者在云量的判断上均偏少,忽略了许多在可见光通道中较明显、但在红外和水汽特征上与晴空很接近的云,也有由于某些特征值的影响,而将一些晴空被误判为云的情况。但是根据现象推测,可以通过增加一些指定的特征值或者设计更多的嵌套模型来改善结果。

本文使用的FY-2C气象卫星资料的分辨率较低,限制了云分类的精度。如果使用分辨率更高的卫星资料,或者极轨卫星,则可以得到更好的分类结果。目前使用的特征量也较少,所以得到的云类类型较少。下一步工作的重点是继续对分类特征量进行挖掘,并将卫星云分类的资料用于各种天气系统分析和研究中。

参考文献
[1] Shenk W E, Neff R A, Holub R J. A multispectral cloud type identification method developed for tropical ocean areas with Nimbus-3 MRIR measurements (Medium Resolution Infrared Radiometer). Mon Wea Rev, 1976, 104, (3): 284–291. DOI:10.1175/1520-0493(1976)104<0284:AMCTIM>2.0.CO;2
[2] 张承福. 神经网络系统. 力学进展, 1988, 18, (2): 145–160.
[3] 张承福. 人工神经网络在天气预报中的应用研究. 气象, 1994, 20, (6): 43–47. DOI:10.7519/j.issn.1000-0526.1994.06.008
[4] 蔡煜东, 汪列, 姚林声. 人工增雨有利条件的神经网络识别与估价. 应用气象学报, 1994, 5, (1): 125–128.
[5] 张韧, 蒋国荣, 余志豪, 等. 利用神经网络计算方法建立太平洋副高活动的预报模型. 应用气象学报, 2000, 11, (4): 474–483.
[6] 师春香, 卢乃锰, 张文建. 卫星面降水估计人工神经网络方法. 气候与环境研究, 2001, 6, (4): 467–472.
[7] 梁益同, 胡江林. NOAA卫星图像水体信息神经网络识别方法的探讨. 应用气象学报, 2001, 12, (1): 85–90.
[8] 熊秋芬, 胡江林, 夏军. 神经网络方法在静止卫星多通道资料估算降水中的应用. 气象, 2002, 28, (9): 17–21. DOI:10.7519/j.issn.1000-0526.2002.09.004
[9] 樊晓平, 彭展, 杨胜跃, 等. 基于多层前馈型人工神经网络的抑郁症分类系统研究. 计算机工程与应用, 2004, 40, (13): 205–208. DOI:10.3321/j.issn:1002-8331.2004.13.067
[10] 金龙, 吴建生, 林开平, 等. 基于遗传算法的神经网络短期气候预测模型. 高原气象, 2005, 24, (6): 981–987.
[11] 邵利民, 傅刚, 曹祥村, 等. BP神经网络在台风路径预报中的应用. 自然灾害学报, 2009, 18, (6): 104–111.
[12] 黄小刚, 费建芳, 陈佩燕. 利用神经网络方法建立热带气旋强度预报模型. 应用气象学报, 2009, 20, (6): 699–705. DOI:10.11898/1001-7313.20090607
[13] 闵晶晶, 孙景荣, 刘还珠, 等. 一种改进的BP算法及在降水预报中的应用. 应用气象学报, 2010, 21, (1): 55–62. DOI:10.11898/1001-7313.20100107
[14] Lee J, Weger R C, Sengupta S K, et al. A neural network approach to cloud classification. IEEE Transactions on Geoscience and Remote Sensing, 1990, 28, (5): 846–855. DOI:10.1109/36.58972
[15] Bankert R L. Cloud classification of a AVHRR imagery in maritime regions using a probabilistic neural network. J Appl Meteor, 1994, 33, (8): 909–918. DOI:10.1175/1520-0450(1994)033<0909:CCOAII>2.0.CO;2
[16] Baum B A, Tovinkere V, Titlow J, et al. Automated cloud classification of global AVHRR data using a fuzzy logic approach. J Appl Meteor, 1997, 36, (11): 1519–1540. DOI:10.1175/1520-0450(1997)036<1519:ACCOGA>2.0.CO;2
[17] Tian B, Shaikh M A, Azimi-Sadjadi M R, et al. A study of cloud classification with neural networks using spectral and textural features. IEEE Transactions on Neural Networks, 1999, 10, (1): 138–151. DOI:10.1109/72.737500
[18] Liu Y, Xia J, Shi C X, et al. An improved cloud classification algorithm for China's FY-2C multi-channel images using artificial neural network. Sensors, 2009, 9, (7): 5558–5579. DOI:10.3390/s90705558
[19] 师春香, 瞿建华. 用神经网络方法对NOAA-AVHRR资料进行云客观分类. 气象学报, 2002, 60, (2): 250–256. DOI:10.11676/qxxb2002.031
[20] 师春香, 吴蓉璋, 项续康. 多阈值和神经网络卫星云图云系自动分割试验. 应用气象学报, 2001, 12, (1): 70–78.
[21] 国家卫星气象中心. 风云二号C卫星业务产品释用手册. 2005: 61-66.
[22] 金龙. 人工神经网络技术发展及在大气科学领域的应用. 气象科技, 2004, 32, (6): 385–392.
[23] Hsieh W W, Tang B. Applying neural network models to prediction and data analysis in meteorology and oceanography. Bull Amer Meteor Soc, 1998, 79, (9): 1855–1870. DOI:10.1175/1520-0477(1998)079<1855:ANNMTP>2.0.CO;2
[24] 金龙, 况雪源, 黄海洪, 等. 人工神经网络预报模型的过拟合研究. 气象科技, 2004, 62, (1): 62–70.
[25] 俞善贤, 钟元, 滕卫平. 热带气旋路径人工神经元预报方法对比试验研究. 热带气象学报, 2004, 20, (5): 523–529.
[26] 陈渭民, 夏浣清, 陈光宇. 卫星气象学. 北京: 气象出版社, 2003.
[27] 胡金滨, 唐旭清. 人工神经网络的BP算法及其应用. 信息技术, 2004, 4, (4): 1–4.
[28] 郁凡, 陈渭民. 双光谱云图的云分类探讨. 南京气象学院学报, 1994, 17, (1): 117–124.
[29] 吕砚山, 赵正琦. BP神经网络的优化及应用研究. 北京化工大学学报, 2001, 28, (1): 67–69.
[30] 朱乾根, 林锦瑞, 寿绍文, 等. 天气学原理和方法. 北京: 气象出版社, 2000: 515–521.