应用气象学报  2010, 21 (1): 70-75   PDF    
中国区域典型大气廓线样本库的一种选择方法
漆成莉, 刘辉, 马刚, 张鹏, 吴雪宝     
中国气象局中国遥感卫星辐射测量和定标重点开放实验室国家卫星气象中心, 北京 100081
摘要: 在模拟大气辐射传输过程、发展大气透过率模式及反演大气参数等许多应用中,大气状态廓线是重要的输入参数,为方便使用,建立具有一定代表性的样本数据库十分必要。目前,国际上有几十种各具特色的大气样本库,但包含中国区域的样本极少。为了弥补国际大气样本库中缺少中国区域大气廓线的不足,以中国区域2002年气象探空资料为基础,利用拓扑学方法建立了包含30条大气温度和湿度廓线的中国区域大气廓线样本库2。通过对所选样本的覆盖区域、观测时间、海拔高度、廓线垂直分布等特征分析,结果表明:该样本库具有样本时空分布均匀、样本独立性和气候代表性好等特点,符合大气样本库建立的基本原则,可为辐射传输研究和业务应用提供大气样本支持。
关键词: 大气廓线    拓扑学    大气样本库    取样    
A Sampling Technique of Typical Atmospheric Profiles Database in China
Qi Chengi, Liu Hui, Ma Gang, Zhang Peng, Wu Xuebao     
Key Laboratory of Radiometric Calibration and Validation for Environmental Satellites, National Satellite Meteorological Center, China Meteorological Administration, Beijing 100081
Abstract: Atmospheric profiles are important input parameters in simulation of atmospheric radiative transfer, emulation of new satellite instruments spectral characteristics, development of transmittance model, retrieval of atmospheric parameters and the assimilation of satellite data in numerical weather prediction. It is very necessary that built a sampled atmospheric profiles database to meet many kinds of application requirements. The quantity, covering region, and source of atmospheric profiles affect the efficiency and results of application a lot. A major attempt to sample atmospheric profiles on a global scale has been the constitution of successive versions of the Thermodynamic Initial Guess Retrieval database (TIGR), despite the high dimensionality. Each version groups together hundreds of profiles sampled from mass soundings observations of the atmosphere. There are dozens of atmospheric profiles database currently, but profiles in China region are very deficient. An atmospheric profiles database with samples in China region can enhance the accuracy in calculation of radiative transfer and profiles retrieval. 61308 profiles of year 2002 are collected as a preparatory database that includes 124 radiosond station measurement distributing in China region through Meteorological Data Storage System, and a database is set up comprising 30 atmospheric temperature and humidity profiles and named it CRASD 2 (China Regional Atmospheric Sample Database 2) with topology method. It is classified by surface pressure and divided into 5 groups and their respective surface pressure are 500 hPa, 700 hPa, 850 hPa, 925 hPa, 1000 hPa. The CRASD 2 covers the four seasons of one year and the two radiosond observation time of 00:00 and 12:00, so that it has characteristics of well proportioned time and season range. Considering the vertical height range it contains the samples located in stations with the altitude of several to several thousand meters. Besides, the profiles in this database distribute in large overcast geographical region of China, and the profiles with large discrepancy distribute in north—east, north—west and south region, while samples with relative less difference mostly are located in south of the Yangtze River and Yellow and Huai River region. The diversity between profiles mainly exist in the different height of tropopause, discrepancy in atmospheric temperature and humidity condition of the same pressure level, and the existence of temperature inversion layer. With the independency between profiles and good climate representative, the CRASD 2 database is accord with the principle of a sampled database, so it can support the application of atmosphere samples in research of radiative transfer and remote sensing retrieval. This elementary employment of topology sampling technique in extracting regional profiles database implies it may support sampling database from longer time serial observation data, and adding more profiles variables in sampling method in the future work.
Key words: atmospheric profiles     topology technique     sampled atmospheric database     sampling technique    
引言

在研究地球大气辐射过程,进行新型卫星仪器光谱特性仿真,反演大气参数[1]以及卫星资料在数值天气预报同化试验研究中均需要有一定代表性的大气状况廓线,即大气样本库,包括典型大气的温度、湿度廓线,臭氧和其他痕量气体含量.多年来辐射传输模式和大气透过率模式不断发展,模式开发和精度验证所用大气廓线样本库也在不断更新.

目前国际上常用的大气样本库有多个版本,由于应用目的不同,各个样本库包含的大气廓线的数量和内容均有差异,更主要的是都缺少能够代表中国地区的大气样本.例如,在美国NESDIS日常大气垂直探测业务反演系统中使用的快速透过率模式和回归算法中,其系数计算选用了统计的19条大气廓线样本[2],但均由1条美国标准大气廓线派生 (如温度在各气压层±10,±20,±30 K等) 一些廓线.其中,16条作为计算系数用的非独立样本,3条用作检验回归系数和算法精度的独立样本.由于该样本库的大气廓线均是人为假设,因此包含的大气状态信息量有限;欧洲TIG R (Thermodynamic InitialGuess Retrieval database) 是法国动力气象实验室建立的一个大气廓线数据库,主要用于大气廓线反演时的初估值,包含大气温度和湿度廓线.这些廓线是利用拓扑学方法从不同时期、全球范围内大量大气样本中精选出来的,共有3个版本,其中第3版本TIGR-43加入一些卫星反演廓线,其他版本均来源于探空观测.与前者比,显然TIGR样本库更具有代表性.NESS-35大气样本库的特点是增加了臭氧信息,红外大气辐射传输模式RTTOV-5及后续模式中O3透过率计算使用了该大气样本库[3-5],使大气透过率的计算精度得到提高.随着辐射传输模式和大气参数反演对大气样本垂直分辨率要求的提高,基于欧洲中期数值预报中心ECMWF的6 h预报系统所产生的全球范围内大气廓线,采用与TIGR库相同的拓扑学方法选取,建立了包含13766条大气样本的样本库即50L-SD[6-8],以及基于ECMWF的40年再分析资料建立的包含了13495条大气廓线,分60层的大气廓线样本库60L-SD[9-12],可应用于统计回归和模式验证;之后又产生了包括7547条火箭探空廓线的NOAA88大气廓线样本库,变量有气压、温度、水汽;以及包括52条大气温度、湿度、臭氧廓线的ECMWF-52样本库,是RTTOV8用于计算透过率回归系数所使用的训练样本库,有60层和101层大气分层两种格式[13-15].

对目前国际上公开使用的大气样本库分析发现,只有TIGR-43样本库中包含1条位于中国浙江省大陈岛的大气廓线.我国地形复杂,气候多样,大气廓线,尤其是青藏高原上空的大气,明显有别于其他地区,因此建立中国区域的大气样本库非常有必要.漆成莉等[16]利用中国典型7个台站4个季节的2年探空资料建立了中国区域大气廓线样本库1(China Regional Atmospheric Sample Database 1,CRASD-1),大气样本为月平均廓线均值,仅选用7个气象探空台站资料,季节限制在1,4,7,10月,区域和时间代表性有限.

大气廓线的来源包括探空观测、卫星反演和数值天气预报产品,主要参数包括大气廓线地理位置和时间信息,如经度、纬度、地面海拔高度、年、月、日、时次等;以及大气分层数、各分层气压,大气廓线本身的状态信息,如各气压层次上的大气温度、大气湿度、臭氧以及痕量气体成分等参数信息.样本库的主要特点是,样本间较为独立,气候代表性好,同时时空分布较均匀.本文基于上述分析,利用拓扑学方法从2002年我国六万多条地面探空资料中选取了具有样本特征的大气温度和湿度廓线,建立了中国区域大气廓线样本库2(China Regional Atmospheric Sample Database 2,CRASD-2).这些样本可为科研和业务应用服务.

1 取样方法

根据大气廓线样本库需要满足覆盖范围广、相互之间较为独立的特点,要建立适用的大气样本库,关键是如何从海量的大气廓线库中选取样本.随机取样方法最简单,但避免不了会选择类似的样本,拓扑学方法是目前使用较为成功的方法.

1.1 随机取样

随机取样是较为简单的方法,一般适用于独立性不是很强的样本库.从大量样本中随机取样,如对规则格网的分析场数据库60L-SD随机取出77条廓线,增加3条廓线构成80条的60L-SDR数据库,其特点是方法简单,但由于取样没有改变它们的分布却扩大了格网,所以极端值被选中的几率很小.

1.2 拓扑学方法取样

拓扑学方法取样是目前使用最广泛的一种大气廓线取样方法,在建立TIGR廓线库时成功应用,又在ECMWF 50L-SD数据库及60L-SD数据库取样时使用.该方法分两步:第一步,建立初始廓线库,即从廓线数目巨大的数据库中提取一个数量大大减小、且相异程度很大的样本,这些样本组成的数据库称为初始样本库S,如TIGR-2选择的是80000条探空廓线作为初始样本库,60L-SD选择48 d的全球700万条廓线作为初始样本库.第二步,样本数据库形成,即用拓扑学方法对初始廓线库进行筛选.为了挑选出变量均值差异不大,但不同层次上分布差异较大的廓线,Chevallier等根据分层取样的概念对取样方法进行了改进,即TIGR-like方法[8],将不同层次上的温度和湿度变量加入距离指数计算中考虑了温度与湿度变量的不同权重,把变量范围从二维空间扩充到三维空间,获得了较好效果,该方法在ECMWF得到广泛应用.计算距离指数D如式 (1) 和式 (2),式 (3) 为迭代条件.DTm为温度距离指数,Dqm为湿度距离指数,m为迭代次数,sisj代表两条大气廓线,E为初始样本库,N为大气廓线变量分层数,Ti (k) 和Tj (k) 分别为第ij两条大气廓线的逐层温度值,qi(k) 和qj(k) 分别为两条大气廓线的逐层湿度值,σT(k) 为第k层温度的标准差,σq(k) 为第k层湿度的标准差,μ为湿度距离指数权重值,d为迭代阈值.

(1)
(2)
(3)

本文将该方法用于中国区域样本库建立,经分析证明该方法建立的样本库特征符合使用要求.

2 建立中国区域大气样本库

为了尽量保持真实的大气廓线特征,更好地挑选出时空分布较为均匀,且相互较为独立的中国区域大气廓线,采用TIG R-like取样方法对中国区域大气廓线进行取样[7].

选择中国区域2002年共124个探空观测站的61308条有效大气廓线样本 (国家气象信息中心气象资料服务网提供),作为初始大气样本库进行拓扑学方法取样.由于中国地势西高东低,西部有世界上最高大的青藏高原,平均海拔4000 m以上,第二级阶梯为内蒙古、新疆地区、黄土高原、四川盆地和云贵高原,东部大部分则为丘陵和平原,因此中国区域大气廓线季节、区域性特点很显著,一条或几条观测廓线很难代表.

中国大气廓线气压层范围有很大差异.例如仅地面气压就可分5种:500 hPa (类别1),700 hPa (类别2),850 hPa (类别3),925 hPa (类别4),1000 hPa (类别5)(详见表 1).首先,按照这5种地面气压的大气样本廓线数目比例来确定中国大气廓线样本库CRASD-2中5种大气样本的数目,然后按照拓扑学方法对初始大气廓线样本库进行取样,挑选出了30条中国区域典型大气廓线,其中地面气压为500 hPa2条,700 hPa 4条,850 hPa 6条,925 hPa 10条,1000 hPa 8条.

表 1 中国区域探空廓线典型的气压层范围 (单位:hPa) Table 1 Typical pressure level of radiosondeprofiles in China region (unit :hPa)

中国大气廓线气压层范围有很大差异.例如仅地面气压就可分5种:500 hPa (类别1),700 hPa (类别2),850 hPa (类别3),925 hPa (类别4),1000 hPa (类别5)(详见表 1).首先,按照这5种地面气压的大气样本廓线数目比例来确定中国大气廓线样本库CRASD-2中5种大气样本的数目,然后按照拓扑学方法对初始大气廓线样本库进行取样,挑选出了30条中国区域典型大气廓线,其中地面气压为500 hPa2条,700 hPa 4条,850 hPa 6条,925 hPa 10条,1000 hPa 8条.

3 样本库特征

CRASD-2选出的大气样本对应的探空台站属性列于表 2.由表 2可见,时间上选出的大气样本基本包含了中国典型的春、夏、秋、冬4个季节;空间上覆盖了中国大部区域 (图 1);垂直分布上包括了从几米到三千多米的海拔区域;差异程度较大的大气廓线位于我国的东北、西北、东部以及华南地区,江南、黄淮地区的大气廓线变量差异程度相对较小.

表 2 中国区域大气廓线样本库2对应的探空台站属性 Table 2 Information about radiosond station in CRASD-2

图 1. 30条大气样本地理位置图 Fig 1. The location of the 30 sample database

为方便分析,图 2给出了所选中国区域30条大气样本温度廓线.由图 2可知,这些样本之间差异较大,作为区域样本合理.由于探空站提供的大气温、湿度廓线仅在15个标准气压层上有数据 (表 1),因此廓线的平滑程度没有TIG R-43样本库大气廓线那么高.另外廓线之间的差异主要体现在如下几个方面:对流层顶高度不同,常见的大气廓线对流层顶一般出现在100 hPa高度附近,如第2,6,22,29,30条廓线,也有对流层顶高度不在100 hPa高度附近的大气廓线,如第4,7,24,26条廓线,也有大气廓线状态无明显对流层顶特征的,如第13,17条大气廓线;同一气压高度层上温度的差异,第11~15条廓线组温度在300 hPa以上高度差异大于300 hPa以下高度,而第21~25条廓线组的温度在300 hPa以上高度差异小于300 hPa以下高度,其他组廓线不同高度上温度差较一致;不少大气廓线,尤其边界层较低的低层可能存在逆温层,如第8,21,23,29条大气廓线均出现逆温层,这类大气廓线与没有逆温层的样本差异较大.

图 2. 中国区域大气廓线样本库CRASD-2温度廓线 Fig 2. The a tmospheric temper ature profiles in CRASD-2

图 3是所选的30条湿度廓线样本.可以看出大气湿度廓线之间的差异程度也较大,近地面湿度从低于0.05 g/kg到18 g/kg之间的各种分布值,水汽廓线从地表到200 hPa, 数值迅速减小.样本廓线的差异性主要体现在各高度气压层上水汽含量的大小,水汽含量最多的,例如台北和西沙的近地面层湿度分别达到15 g/kg和18 g/kg;而辽宁锦州、陕西渝中、内蒙古锡林浩特、甘肃武都和新疆伊宁近地面层湿度不超过2 g/kg.上述分析说明用拓扑学方法选取样本,并建立数据库,其样本之间差异较大,符合使用要求.

图 3. 中国区域大气样本库CRASD-2湿度廓线 Fig 3. The a tmo spheric humidity profiles in CRASD-2

4 小结

分析目前国际上使用的几十种不同的大气廓线样本库,发现均缺少中国区域内的大气廓线样本,而中国区域地域广袤,地形、气候多样,用国际样本库或随机选取中国区域大气样本进行辐射传输计算、大气传输模式研究和业务应用开发都不具有很好的代表性,利用TIG R-like拓扑学方法基于中国区域2002年4个季节六万多条大气探空廓线初始样本库进行取样试验,得到如下结果:

1) 从初始样本库中进行取样前,需要对样本进行严格的质量控制,剔除无效样本和不符合实际大气状态规律的大气廓线样本.

2) 以大气廓线之间温度和湿度变量的距离指数为样本独立性迭代条件,建立了具有中国区域特点的CRASD-2.该样本库包含30条大气温度和湿度廓线.

3) 对CRASD-2分析结果表明:这些廓线全部为中国区域内样本,基本覆盖了我国东部平原到西部高原地区,气候代表性较好,与全球范围样本库相比具有更好的区域代表性,可用来支持中国区域大气过程研究应用.

在中国区域样本库样本选取方面的初步应用说明TIGR-like方法可以支持从更长时间探空观测资料中选取更多的样本,也为增加更多廓线变量,补充样本到该样本库中奠定了基础.

参考文献
[1] 漆成莉, 董超华, 张文建. FY-3A气象卫星红外分光计温度廓线模拟反演试验. 应用气象学报, 2005, 16, (5): 18–24.
[2] Weinreb M P, Fleming H E, McMillin L M, et al. Transmittances for the TIROS Operational Vertical Sounder. NO-AA Technical Report NESS 85, 1981: 56–59.
[3] Matricardi M, Saunder R W, A fast radiative transfer model for simulation of IASI radiances. Applied Optics, 1999, 38: 5679–5691. DOI:10.1364/AO.38.005679
[4] Matricardi M, Chevallier F, Tjemkes S.An Improved General Fast Radiative Transfer Model for the Assimilation of Radiance Observations.ECMWF Research Dept Tech Memo 345, 2001.
[5] Saunders R, Matricardi M, Brunel P.A Fast Radiative Transfer Model for Assimilation of Satellite Radiance Observations-RT-TOV-5.ECMWF Research Dept Tech Memo 282, 1999.
[6] Saunders R, Matricardi M, Brunel P, An improved fast radiative transfer model for assimilation of satellite radiance observations. QJR Meteorological Society, 1999, 125: 1407–1425. DOI:10.1002/qj.497.v125:556
[7] Simmons A J, Gibson J K.The ERA-40 Project Plan.ERA40 Project Report Series NO.1, 2000 :62.
[8] Chevallier F, Cheden A, Cheruy F, et al. TIGR-like atmospheric profile databases for accurate radiative-flux computation. Quarterly Journal of the Royal Meteorological Society, 2000, 126: 777–785. DOI:10.1002/qj.v126:563
[9] Matricardi M, Saunders R W, A fast radiative transfer model for simulation of IASI radiances. Applied Optics, 1999, 38: 5679–5691. DOI:10.1364/AO.38.005679
[10] Tjemkes S, Schmetz J, Synthetic satellite radiances using the radiance sampling method. Journal of Geophysical Research, 1997, 102: 1807–1818. DOI:10.1029/96JD02684
[11] Fortuin J P, Langematz U, An update on the global ozone climatology and on concurrent ozone and temperature trends. PROCEEDINGS OF THE SPIE, 1994, 23, (11): 207–216.
[12] Chevallier F.Sampled Databases of 60-level Atmospheric Profiles from the ECMWF Analyses.NWPSAF-Ec-TR-004, 2002.
[13] Saunders R W, Brunel P, English S, RTTOV-8 Sci-ence and Validation Report.NWPSAF-MO-TV-007, http:∥www.metoffice.gov.uk/research/interproj/nwpsaf/rtm/rtm_rttov8.html, 2006.
[14] Chevallier F, TIGR-like Sampled Database of Atmospheric Profiles from the ECMWF 50-level Forecast Model NWP SAF.Research Report No.1, 1999 :18.
[15] Eyre J R A.Fast Radiative Transfer Model for Satellite Sounding Systems.ECMWF Research Dept Tech Memo 176, 1991.
[16] 漆成莉, 董超华, 张文建. 基于辐射传输模式的中国典型区域大气样本库特征分析. 气象科技, 2004, 32, (5): 357–362.