陈凯师资料同化的更多故事-气象周刊
陈凯师
《气象周刊》这是诈尸了?是的!它又重新回来了!小编西北汪今年考试成功,为了庆祝,所以特此重开气象周刊。过去一年的离别,看到之前的一些文章仍然活跃在大家的视野里,其中不少还获得了一些知名教授学者的分享,顿时心中感慨:原来这些小文并不会那么容易被人遗忘,确确实实能给大家带来些帮助。所以,看来可以考虑重开周刊,继续上路了! --序言
之前的文章提到了不少有关资料同化的内容,今天我们不!推!公!式!也不说深入具体的理论方法层面剖析!让我们这次站的稍微高一点,看看资料同化里的更多故事。
目前无论是获得准确的数值预报结果亦或者构建再分析资料数据集,都需要将预报模式背景场和大量观测资料融合起来,这既是所谓资料同化。然而,由于模式变量和格点众多众多,模式自由度一般都会达到10^8-10^9量级。因此我们必须在同化理论上做出一定的近似才能满足世纪业务计算需求(即通常在1h以内完成同化计算)。目前主要有以下几条近似:
假设误差的分布是Gaussion型的
假设资料对背景场的纠正足够小,以至于简化的线性模型在一段时间的发展中仍然可以很好的保存这些信息。
假设10^8量级的模式状态变量的误差协方差可以由10^2量级的集合数来近似实现。
采用以上不同的假设就发展出不同的资料同化理论。
一、变分同化(Variational data assimilation)
变分同化的分析过程是对代价函数(costfunction)求极小化的过程。代价函数中一般会包含三部分:观测适应项、背景场适应项、约束项,约束项中包含有非平衡的物理约束和模式状态可估计的噪音(noice)。当我们准备好背景误差协方差(Backgroud)、观测误差协方差(Observation)和观测算子(Observation Operater)之后,就可以利用变分方法开始同化。观测算子是模式状态向观测空间转化的桥梁,三维变分中的算子是三维的,而四维变分是包含时间维的四维算子,预报模式的切线性模式(tangent linear, TL)和伴随(adjoint, AD)也是组成观测算子的一部分。与三维变分(3D-Var)单时次同化不同,四维变分(4D-Var)假设一系列的模式状态都准确地匹配预报模式,四维变分方案是与模式紧密结合的。目前还有一些方案中加入了所谓的“弱物理约束”,他们承认预报模式的不完美(imperfact),在代价函数中加入了模式误差项。
图1. 变分方法中代价函数求极小化问题
二、集合资料同化(Ensemble data assimilation)
集合资料同化利用蒙特卡洛方法来呈现一段时间内的同化分析和预报的不确定性。一般地,利用积分一段时间过后的一组集合成员来代表真实大气状况的先验(prior pdf)概率分布,同化资料后的集合成员代表后验(posterior pdf)分布。基于贝叶斯理论,通过先验分布和边缘分布可以求出后验分布,整个集合同化求解就是求解贝叶斯方程的过程。集合同化方案的开发代价很低,虽然同样隐含时间维,却做到了与模式独立的特性,不需要诸如伟伟变分中的TL和AD的开发和维护。集合同化方案在时间窗内不仅预报模式变量,同时预报变量之间的相关(误差协方差),使得同化过程资料在模式格点上的权重随时间而变化(“随流型依赖”),对于小尺度运动和高分辨率资料同化有很突出的优势。然而,有限集合成员数远远低于预报模式的自由度,由此带来的采样误差却会严重制约集合资料同化的效果。因此,局地化(Localization)和膨胀算法(Inflation)就必须与集合同化算法协同工作,通常对于不同的观测资料这些算法的细节都不近相同。
经过不断的迭代更新,集合资料同化出现了非常多的变种。在这里简单罗列:
1994年的Evensen提出的集合卡尔曼滤波方案(Ensemble Kalman Filter, EnKF),这是集合同化的祖师爷。
Burgers等人1998年提出了集合同化中避免集合离散度过低而造成滤波发散的观测扰动理论基础,使得集合资料同化理论更加坚实
Anderson 2001年Ensemble Adjustment Kalman Filter(EAKF)
Whitaker和Hamill在2002年提出了EnsembleSquare Root Filter(EnSRF),该方案避免了对观测的扰动,该方案在后续对流可分辨(Cloud Permitting)模式的资料同化中被广泛应用。
Bishop等人2001年提出Ensemble Transform Kalman Filter,该方案后续被WRFDA资料同化系统采用。
Ott等人2004年提出了Local Ensemble Kalman Filter(LEKF),该方法在不同局地区域同时进行资料同化。
Hunt等人2007年在上述两方案的基础上提出了Local Ensemble Transform Kalman Filter(LETKF),该方案中利用了ETKF中扰动更新(Perturbation Update)的优势。
三、集合变分混合同化方案(Ensemble-Variational dataassimilation)
为了结合变分灵活加入观测资料的优势和集合同化显示“流依赖”的优势,混合同化方案在近些年越来越受到科研和业务工作的关注。简单的混合方案既是将三维变分和集合同化进行混合。比如NCEP就采用了如下的混合同化方案(图2):在粗分辨率上进行集合同化,而在高分辨率上进行变分同化,集合同化估计的“流依赖”协方差与变分静态协方差进行混合,经过同化后,将变分得到的高分辨率分析场替换进集合成员的mean,最后加入协方差的膨胀来完成整个同化流程。整体思路上,集合给变分提供具有“流依赖”特性的协方差矩阵,变分给集合成员正确的集合平均。
图2.NCEP 混合同化系统流程
还有两种四维混合同化方案,将四维变分和集合同化进行混合,分别被称为4DEnVar和En4DVar。4DEnVar方案利用一组集合成员来估计流依赖的协方差来代替四维变分中的切线性和伴随,但是较小数量的集合成员是不是可以足够代替TL和AD的动力效应还有待进一步分析。En4DVar在传统4D-Var方案中加入集合,大多数声音认为这种方案的效果应该优于所有其他各种方案,但同化窗内模式都反复正逆向积分以及大量的集合样本所带来的计算量应该是目前制约该方法在业务中实现的最大障碍。另外,En4DVar不可避免的需要模式TL和AD,这给模式研发带来了许多挑战。
图3. 4DEnVar示意图(Courtesy of Andrew Lorenc)
四、非线性资料同化(Non-Gaussian data assimilation)
随着数值模式时空分辨率的不断提高,大气、海洋、海浪耦合模式的发展,数值模式的非线性特性越来越明显,上述所有方案都是线性或者准线性的方案,同时他们都假设误差分布为高斯分布,这些条件在真实大气状态和很多非常规观测资料上都不能严格满足。对于更小尺度运动和耦合物理过程,非线性发展问题十分突出,线性同化方案可能并不能给出给出很好的效果,非线性资料同化理论的发展日益成为新的研究热点。新的非线性同化方案主要是粒子滤波(Particle Filter)以及Multivariate Rank HistogramFilter。粒子滤波利用一组粒子(即集合成员)经行非高斯概率发展,并复制其中概率分布较为密集的部分粒子替换孤立的粒子,实现非线性资料同化。目前,这些非线性同化方案在实际天气预报中的表现还需要更多的研究。
图4. 粒子滤波示意图(Courtesy of Peter Jan van Leeuwen )
以上就是各种方案的宏观概览,如果你是第一次接触资料同化,可以点击“往期回顾”,里面有更多有关资料同化细节的内容可以参考。
参考文献:
Seamless Prediction of the Earth System: fromMinutes to Months, World Meteorological Organization, 2015