编辑: xiong447385 2013-04-14
A.

7 EOF分分分析 析析经验正交函数分析方法(empirical orthogonal function, 缩写为EOF),也称特征 向量分析(eigenvector analysis),或者主成分分析(principal component analysis,缩写PCA),是一种分析矩阵数据中的结构特征,提取主要数据特征量的一种方 法.Lorenz在1950年代首次将其引入气象和气候研究,现在在地学及其他学科中 得到了非常广泛的应用.地学数据分析中通常特征向量对应的是空间样本,所以 也称空间特征向量或者空间模态;

主成分对应的是时间变化,也称时间系数.因 此地学中也将EOF分析称为时空分解. 原原原理 理 理与 与 与算 算 算法 法法?选定要分析的数据,进行数据预处理,通常处理成距平的形式.得到一个数 据矩阵Xm*n ? 计算X与其转置矩阵XT 的交叉积,得到方阵 Cm*m =

1 n X * XT 如果X是已经处理成了距平的话,则C称为协方差阵;

如果X已经标准 化(即C中每行数据的平均值为0,标准差为1),则C称为相关系数阵 ? 计算方阵C的特征根(λ1,...,m)和特征向量Vm*m,二者满足 Cm*m * Vm*m = Vm*m * ∧m*m 其中∧是m * m维对角阵,即∧=??????λ1

0 . . .

0 0 λ2 . . .

0

0 0 . . . λm ? ? ? ? ? ? 一般将特征根λ按从大到小顺序排列,即λ1 >

λ2 λm.因为数 据X是真实的观测值,所以λ应该大于或者等于0.每个非0的特征根对应

42 一列特征向量值,也称EOF.如λ1对应的特征向量值称第一个EOF模态, 也就是V 的第一列即EOF1 = V (:, 1);

第λk对应的特征向量是V 的第k列, 即EOFk = V (:, k). ? 计算主成分.将EOF投影到原始资料矩阵X上,就得到所有空间特征向量对 应的时间系数(即主成分),即PCm*n = V T m*m * Xm*n 其中PC中每行数据就是对应每个特征向量的时间系数.第一行PC(1,:)就是 第一个EOF的时间系数,其他类推. 上面是对数据矩阵X进行计算得到的EOF和主成分(PC),因此利用EOF和PC也 可以完全恢复原来的数据矩阵X,即X=EOF * PC 有时可以用前面最突出的几个EOF模态就可以拟合出矩阵X的主要特征.此外,EOF和PC都具有正交性的特点,可以证明1 n PC * PCT = ∧;

即不同的PC之 间相关为0.E * ET = I.I为对角单位矩阵,即对角线上值为1,其他元素都 为0.这表明各个模态之间相关为0,是独立的. 由上面的计算过程可以看出,EOF分析的核心是计算矩阵C的特征根和特征向 量.计算矩阵特征根和特征向量的方法很多,下面具体给出Matlab中进行EOF分 析的两种不同的方法.具体步骤可参考下面两个框图中的实例. 方法1:调用[EOF,E]=eig(C),其中EOF为计算得到的空间特征向量,E为特 征根.然后计算主成分PC = EOFT * X.需要指出的时,当数据量很大时,例 如分析高分辨率的资料(如1km分辨率的NDVI资料),空间范围很大维数m很容易 超过数万个点,则矩阵C的维数是个巨大量,需要占用大量内存,也会导致计算 速度异常缓慢.而且很可能超出计算机的计算极限而死机. 方法2:直接对矩阵X进行奇异值分解 X = U V T 其中 为奇异值对交阵( 对角线上的元素为奇异值),奇异值与特征根成倍数关 系.

43 ? 如果矩阵C =

1 n XXT ,C的特征根为λ,则有 = √ nλ;

? 如果矩阵C = XXT ,C的特征根为λ,则有 = √ λ;

由于该方法是直接对矩阵X进行分解,所以对内存的要求远小于方法1.计算速度 很快. 两种方法对比练习. 显显显著 著 著性 性 性检 检 检验 验验可以证明 m i=1 X2 i = m k=1 λk = m k=1 PC2 k 这说明矩阵X的方差大小可以简单的用特征根的大小来表示.λ越高说明其对应的 模态越重要,对总方差的贡献越大.第k个模态对总的方差解释率为 λk m i=1 λi * 100% 即使是随机数或者虚假数据,放在一起进行EOF分析,也可以将其分解成一 系列的空间特征向量和主成分.因此,实际资料分析中得到的空间模态是否是随 机的,需要进行统计检验.North等(1982)的研究指出,在95%置信度水平下的特 征根的误差 ?λ = λ

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题