应用气象学报  2009, 20 (6): 713-721   PDF    
基于自适应阈值的地基云自动检测方法
杨俊1, 吕伟涛1, 马颖1, 姚雯1, 李清勇2     
1. 中国气象科学研究院, 北京 100081;
2. 北京交通大学计算机与信息技术学院, 北京 100044
摘要: 云的高精度检测是云量计算的基础,利用晴朗天空下天空呈蓝色、云呈白色的属性, 该文提出一种基于最大类间方差的自适应阈值云检测方法, 并分别基于蓝红波段比值、差值和归一化差值处理进行试验。相比固定阈值的云检测方法, 自适应阈值具有更大的通用性, 且定量的评估结果表明:归一化差值处理在云检测的正确率和精确度方面都获得了令人满意的检测效果。
关键词: 云量    云检测    自适应阈值    最大类间方差    归一化差值    
An Automatic Ground-based Cloud Detection Method Based on Adaptive Threshold
Yang Jun1, Lǜ Weitao1, Ma Ying1, Yao Wen1, Li Qingyong2     
1. Chinese Academy of Meteorological Sciences, Beijing 100081;
2. School of Computer and In formation Technology, Beijing Jiaotong University, Beijing 100044
Abstract: Clouds affect the energy balance of the earth by means of absorbing and scattering radiation, and they have notable influences on global climate. It is very important to monitor clouds and there are several meteorological satellites providing sky-based large-scale scope clouds observations round-the-clock. However, the ground-based cloud observations mainly depend on visual judgments of the meteorological observers, which have become a bottleneck of automatic meteorological observation.Computing cloudage automatically is very important, and cloud detection is the basis of cloudage computation. Up to now, the mature ground-based cloud detection methods are still based on thresholds.For instance, the threshold 1.3 is recommended for ratio of ground-based blue band and red band observations. However, considering the complexity of clouds, a fixed threshold obviously cannot obtain satisfactory detection effect for different types of clouds. In clear sky, clouds are white against the blue background, so an automatic ground-based clouds detection method can be established in terms of the maximum interclass variance adaptive threshold selection. Ratio, difference, normalized difference of blue band and red band are calculated respectively, then bimodal distributing can be found in the image gray histogram, and then an adaptive threshold can be obtained using the maximum interclass variance method. Compare the band operation result with the adaptive threshold pixel by pixel, a pixel whose gray value is less than the adaptive threshold can be regarded as cloud pixel, else non-cloud pixel.Using this rule, the cloud regions can be separated from the sky background.Three different types of ground-based clouds are analyzed, and the proposed adaptive threshold method performs more appropriately comparing with fixed threshold cloud detection method.The blue band and red band ratio method can detect the maximum cloudage, and the difference operation method can detect the minimum cloudage. But quantitative assessment results show that, the ratio method mistakes many non-cloud pixels into clouds, while the norm alized difference processing is satisfactory both in correctness and accuracy. It should be pointed out that the proposed method applies only to clear sky, as for other weather conditions, more researches are needed.
Key words: cloudage     cloud detection     adaptive threshold     maximum interclass variance     norm alized difference    
引言

云的形成和演变不仅反映了当时大气的运动、稳定程度和水汽状况, 而且也是预示未来天气变化的重要征兆之一。同时, 云的变化决定了地球的辐射收支状况, 是全球气候变化的一个重要影响因子。因此, 云的观测具有极其重要作用。目前已有多颗气象卫星源源不断地提供大尺度范围的云监测信息, 成为天基云观测的重要资源。在卫星云图的云类识别方面国内外已经做了大量的研究工作[1-7]。云的地基观测长期依赖气象观测员目视判断, 因而云的地基自动化观测也倍受关注。Davis等[8]采用滤波来提取云的边界, 再通过区域填充来获得云检测结果, 但该算法云边界提取的精度有限。Souzaecher等[9]通过在高纬度地区试验, 提出了一种基于饱和度及阈值的云识别方法, 该方法利用云具有低饱和度而天空具有高饱和度的特性, 采用高阈值和低阈值来检测云, 但该方法只适用于高纬度地区。地基全天空云成像系统WSI (Whole Sky Imager) [10-11]和TSI (Total Sky Imager) [12]以及中国科学院大气物理研究所的全天空云观测[13-15]采用的云检测方法则是以两波段(蓝色波段和红色波段)的图像灰度比值作为依据, 再利用经验阈值或固定阈值来识别云。这种方法在晴朗天空下对厚云的检测效果较好, 但考虑到天空云图的复杂性, 经验阈值或固定阈值并不能使所有图像获得好的检测效果。

本文针对当前地基云检测采用固定阈值的不足, 提出了一种基于自适应阈值的地基云检测方法, 并探讨了蓝红波段比值、差值和归一化差值在自适应阈值情况下晴空地基云检测效果。

1 基于固定阈值的蓝红波段比值地基云检测方法

蓝红波段比值识别法的物理依据是基于大气分子散射与波长的四次方成反比, 使得晴朗天空呈蓝色, 而在可见光波段云粒子散射与波长关系并不密切, 使得云在天空中呈现出白色。比值运算可以突出不同波段间光谱的差异, 提高对比度。霍娟等[15]通过辐射传输模式数值模拟, 认为蓝红波段比值处理后的阈值设为1.30时, 可以获得比较好的云检测效果, 即大于1.30为天空, 小于1.30则判断为云。

本文在进行方法介绍时采用了3幅由Canon G7相机拍摄的原始云图, 大小均为371×495像素。为便于叙述, 文中将其分别标注为CI1, CI2和CI3。其中CI1是2007年5月16日15:22(北京时, 下同) 在北京拍摄的, CI2是2008年9月7日09:37在广州获取的, CI3是2007年7月27日10:42拍摄于广东从化。图 1为CI1和CI2在经过蓝红波段比值处理后采用1.30的阈值时的云检测效果。其中白色区域为识别出的云, 从结果图像可以看出, 采用1.30的固定阈值时, CI1的检测效果较好, 但CI2的检测效果则很差。这与文献[14]的结论是一致的, 即选择1.30的阈值对光学厚度τ>5以上的云检测效果较好, 而对于光学厚度较薄的云层并不适用。针对这一问题, 本文采用最大类间方差算法来计算自适应阈值, 获得了较好的结果。

图 1. 固定阈值地基云检测 (a)CI1, (b)CI1检测结果, (c)CI2, (d)CI2检测结果 Fig 1. Ground-based cloud detection based on fixed threshold (a)cloud image 1, (b)result of cloud image 1, (c)cloud image 2, (d)result of cloud image 2

2 基于自适应阈值的地基云自动检测方法 2.1 最大类间方差自适应阈值

假设图像由具有单峰灰度分布的目标和背景组成, 处于目标或背景内部相邻像素间的灰度值高度相关, 但处于目标和背景交界处两边的像素在灰度值上有很大差别。如果一幅图像满足这些条件, 其灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合构成的。如果这两个分布大小(数量)接近且平均值相距足够远, 而且两部分的均方差也足够小, 则直方图应为较明显的双峰, 对应的图像常可采用阈值法来较好地分割。在众多阈值分割算法中, 由Otsu[16]提出的基于类间方差最大的分割算法一直被认为是分割阈值自动选取的最优方法。其基本思想如下:

设一幅图像的灰度级为L, 灰度值为i的像素数为ni个, 则总的像素数为 , 各灰度值出现的概率为Pi=ni/N。假定用阈值T将图像分成背景CB∈{1, …, T}和CO∈{T+1, …, L}目标两类, 则各类发生的概率分别为:

(1)
(2)

两类的平均灰度值分别为:

(3)
(4)

而整幅图像的平均灰度值又可表示为:

(5)

图像背景和目标两类的类间方差为:

(6)

将式(5)代入式(6)中可得:

(7)

则满足的阈值T为分割目标和背景的最佳阈值

2.2 地基云自动检测方法

地基观测的云图上一般只有天空和云两类, 根据前面的分析可知, 在晴朗天空下, 云一般呈白色, 而天空呈蓝色。考虑到比值和差值处理具有类似的效果, 本文对蓝红波段比值处理、差值处理和归一化差值分别进行了试验。在地基观测的云图上, 可以将天空当作背景, 云当作目标, 在对云图蓝红波段进行处理后, 可进一步拉大目标和背景的均值, 直方图呈现双峰分布, 满足最大类间方差自适应阈值分割的条件。据此, 本文提出了一种基于最大类间方差的自适应阈值晴朗天空下地基云检测方法, 并分别基于蓝红波段比值、差值和归一化差值处理进行试验。

图 2是本文采用的地基云自动检测的通用流程。首先对云图进行蓝红波段处理, 再对波段处理后的结果进行基于最大类间方差的自适应阈值计算。然后用波段处理后的灰度值与自适应算出的阈值进行比较, 若小于阈值则该像素为云, 反之, 若大于阈值则该像素为天空。在检测出云和天空之后, 算出云和天空各占整个云图的百分比, 就可以自动计算出当前的云量。

这里的波段处理是指蓝红波段比值、差值和归一化差值中的一种。其具体计算公式如下:

(8)
(9)
(10)

其中, B指的是蓝色波段的灰度值, R是红色波段的灰度值, D比值, D差值D归一化差值分别是蓝红波段比值、差值和归一化差值处理后的灰度值。

图 2. 地基云自动检测流程图 Fig 2. The flow chart of ground-based cloud automatic detection

3 实验结果及讨论

为验证所提出算法的有效性, 本文对多幅不同类型的云图进行了自动检测。图 3是对CI1分别进行蓝红波段比值、差值和归一化差值处理后, 再利用自适应阈值分割的结果, 其中白色区域是检测出的云。为便于显示, 这里将蓝红波段处理后的结果都转为无符号8位格式, 即灰度值在0~255之间。

图 3可以看出, 比值处理后的结果误将部分天空识别成了云(见图 3b左下角), 而差值处理后的结果则是将部分卷云漏检了。这是因为比值运算是突出不同波段间地物差异, 提高了对比度, 直方图偏向高端一侧(图 4a), 自动计算的阈值会较理想状况下阈值稍大。而差值运算有利于目标与背景反差较小的信息提取, 但处理后的结果对比度偏小, 且直方图偏向低端一侧(图 4b), 这样自动算出来的阈值相比理想状况下的阈值会偏小。归一化差值处理既利用了差值处理的优势, 又通过归一化处理调整了对比度和直方图(图 4c), 使得计算的自适应阈值和理想状况下的阈值十分接近, 获得了更好的检测效果。这里需要说明的是图 4中的纵坐标---归一化后的像素数的表示方式, 通过统计图像的灰度分布, 将出现次数最多的灰度值用1.0表示, 再将其他灰度值与该灰度值作比值, 结果用0. 0~1. 0表示, 形成直方图中归一化后的像素数。

图 3. CI1 自适应阈值检测 (a)比值处理结果, (b)比值的自适应阈值检测结果, (c)差值处理结果, (d)差值的自适应阈值检测结果, (e)归一化差值处理结果, (f)归一化差值的自适应阈值检测结果 Fig 3. Adaptive threshold detection for cloud image 1 (a)ratio operation, (b)adaptive threshold detection result of ratio, (c)difference operation, (d)adaptive threshold detection result of difference, (e)normalized difference operation, (f)adaptive threshold detection result of normalized difference

对CI1的检测结果统计可发现, 比值处理、差值处理和归一化差值处理检测出的云占全图的百分比分别为44.22%, 25.05%和29.69%。也就是说比值处理检测出的云最多, 差值处理检测出的云最少, 而归一化差值处理方法检测出的云介于两者之间。

图 4. 蓝红波段处理后的直方图 (a)比值处理, (b)差值处理, (c)归一化差值处理 Fig 4. Histograms after blue and red band processing (a)ratio operation, (b)difference operation, (c)normalized difference operation

图 5图 6则是对CI2和CI3分别进行蓝红波段比值、差值和归一化差值处理后, 再利用自适应阈值分割的结果。从统计结果来看, 比值处理、差值处理和归一化差值处理检测出的云占CI2的百分比分别为42.84%, 28.76%和32.17%, CI3检测出的云所占百分比则分别为38.06%, 31.59%和35.08%。这和图 3的结论是一致的。

图 5. CI2 自适应阈值检测 (a)CI2, (b)比值检测结果, (c)差值检测结果, (d)归一化差值检测结果 Fig 5. Adaptive threshold detection for cloud image 2 (a)cloud image 2, (b)detection result of ratio, (c)detection result of difference, (d)detection result of normalized difference

图 6. CI3 自适应阈值检测 (a)CI3, (b)比值检测结果, (c)差值检测结果, (d)归一化差值检测结果 Fig 6. A daptive threshold de tection for cloud image 3 (a)cloud image 3, (b)detection result of ratio, (c)detection result of difference, (d)detection result of normalized difference

在云检测出之后, 对检测的精度进行评估是一个很关键的部分。考虑到云检测实际上是一种二值分类问题, 影像上每一个像素仅有以下4种可能的分类情况:真正(True Positive, TP), 影像上为云且被检测为云的像素数;真负(True Negative, TN), 影像上为非云且被检测为非云的像素数;伪正(False Positive, FP), 影像上为非云但被检测为云的像素数;伪负(False Negative, FN), 影像上为云但被检测为非云的像素数。

因此, 本文参考Shufelt[17]在建筑物检测中采用的精度评价方法, 采用如下两个指标来评价地基云检测的精度:正确率TP/(TP+FN);精确度TP/ (TP+FP+FN)。

正确率表明了影像上的云被正确检测的程度, 而精确度则将FPFN考虑进去, 表明了总的检测精度。一个好的云检测算法, 这两个指标都应该是高的。要计算正确率和精确度这两个指标, 必须要有标准的云模板。图 7是通过人工解译获得的标准云模板。

表 1给出了比值处理、差值处理和归一化差值处理方法云检测的定量精度评估结果。从表 1可以看出, 比值处理获得了最高的正确率, 但精确度却是最低的。归一化差值处理获得了最高的精确度和与比值处理相近的正确率。而差值处理在正确率和精确度方面都表现得较差。也就是说, 比值处理将云都尽量检测出, 但同时也将很多非云像素误检测为云, 而归一化差值处理在将云检测出来的同时也很好地控制了将非云像素不会误检测为云。这与视觉观察结果也是一致的。

图 7. 人工解译的云模板 (a)CI1模板, (b)CI2模板, (c)CI3模板 Fig 7. Cloud masks of manua l interpretation (a)mask of cloud image 1, (b)mask of cloud image 2, (c)mask of cloud image 3

表 1 云检测精度评估 Table 1 Precision assessment for cloud detection

4 结语

云的地基自动化观测是当前气象部门迫切需要解决的问题。云量自动计算是一个很重要的内容, 云的高精度检测是云量计算的基础和前提。经验阈值或固定阈值仍是目前进行地基云检测的主要手段。本文提出了一种完全自动、无需人工干预的基于最大类间方差的自适应阈值计算方法, 并分别在蓝红波段比值、差值和归一化差值情况下对晴朗天空下地基云进行试验。自适应阈值较固定阈值具有更好的通用性, 且在比值处理的情况下检测出的云最多, 差值处理检测出的云最少。但定量评估结果表明, 比值处理检测出的云最多是因为它不仅将云像素检测出, 也将很多非云像素误检测为云。也就是说, 虽然比值处理云检测的正确率很高, 但精确度却很低。而归一化差值处理则获得了最高的精确度, 其正确率与比值处理相比, 对试验图像都获得了令人满意的检测效果。需要指出的是, 当天空中的云量很高或很低时, 有可能使得经蓝红波段处理后的云图直方图不呈双峰分布, 这样自适应算法得到的阈值会有一定偏差, 可能影响云检测精度。当然, 对于全天空都是云或者全天无云的特殊情况, 云图经蓝红波段处理后, 灰度值呈现较明显的单峰分布, 且前者的灰度值偏向“0”一端, 后者的灰度值偏向“255”一端, 这样就可以通过设定一个低阈值和一个高阈值将这两种特殊情况区分开来。另外, 本文提出的方法只适用于晴朗天空下的地基云自动检测, 如何进行其他天气状况下地基云的识别需要更多研究。

参考文献
[1] Baum BA, Vasanth T, Tay T, et al. Automated cloud classification of global AVHRR data using a Fuzzy logic approach. JAppl Meteor, 1997, 36, (11): 1519–1535. DOI:10.1175/1520-0450(1997)036<1519:ACCOGA>2.0.CO;2
[2] Bin T, Shaikh M A, Azimi-Sadjadi M R, et al. A study of cloud classification with neural networks using spectraland textural features. IEEE Trans Neural Networks, 1999, 10, (1): 138–151.
[3] Hulley G C, Hook S J, A new methodology for cloud detec-tion and classification with ASTER data. Geophys Res Lett, 2008, 35. DOI:10.1029/2008GL034644
[4] 师春香, 瞿建华. 用神经网络方法对NOAA-AVHRR资料进行云客观分类. 气象学报, 2002, 60, (2): 250–255.
[5] 刘希, 许健民, 杜秉玉. 用双通道动态阈值对GMS-5图像进行自动云检测. 应用气象学报, 2005, 16, (4): 434–444.
[6] 马芳, 张强, 郭铌, 等. 多通道卫星云图云检测方法的研究. 大气科学, 2007, 31, (1): 119–128.
[7] 刘瑞云, 罗敬宁, 郭陆军. 利用TOVS资料测雪. 应用气象学报, 1999, 10, (1): 88–93.
[8] Davis G B, Griggs D J, Sullivan G D, Automatices timation of cloud amount using computer vision. J Atmos Ocean Technol, 1992, 9, (1): 81–85. DOI:10.1175/1520-0426(1992)009<0081:AEOCAU>2.0.CO;2
[9] Souza-echer M P, Pereira E B, Bins L S, et al. A simple method for the assessment of the cloud cover state in high-latitude regions by a ground-based digital camera. J Atmos Ocean Technol, 2006, 23, (3): 437–447. DOI:10.1175/JTECH1833.1
[10] Buch K A Jr, Sun C H , Thorne L R. Cloud Classification U-sing Whole-sky Imager Data. 9 th Symposium on Meteoro-logical Observations and Instrumentation. Charlotte , North Carolina , 1995
[11] Slater D W, Long C N, Tooman T P. Total Sky Imager/ Whole Sky Imager Cloud Fraction Comparison ∥ Eleventh ARM Science Team Meeting Proceeding.Atlanta, Georgia, 2001.
[12] Kassianov E, Long C N, Ovtchinnikov M, Cloud sky cover versus cloud fraction:Whole-sky simulation sand observa-tions. J Appl Meteor, 2005, 44, (1): 86–98.
[13] 霍娟, 吕达仁. 全天空数字相机观测云量的初步研究. 南京气象学院学报, 2002, 35, (2): 242–246.
[14] 霍娟, 吕达仁. 晴空与有云大气辐射分布的数值模拟及其对全天空图像云识别的应用. 气象学报, 2006, 64, (1): 31–38.
[15] 霍娟, 吕达仁, 王越. 全天空云识别阈值法的数值模拟初步研究. 自然科学进展, 2006, 16, (4): 480–484.
[16] Otsu N, A threshold selection method from gray level histo-grams. IEEE Trans Systems, Man and Cybernetics, 1979, 9, (1): 62–66.
[17] Shufelt J A, Performance evaluation and analysis of monocular building extraction from aerial imagery. IEEE Trans Pattern Analysis and Machine Intelligence, 1999, 21, (4): 311–326.