编辑: bingyan8 | 2017-09-19 |
1
1 4 ] , 更有人将相似预报的思想引入到数 值预报中.任宏利等[ 6] 利用 L o r e n z模式开展了大 量理论分析和数值试验, 发现在初始状态相似性持 续的情况下, 动力预报结果及其预报误差行为具有 相似性, 进而提出动力预报的相似性原理: 在初始状 态相似性持续的情况下, 基于某一模式的动力预报 第3 7卷第1 1期2011年11月气象ME T E O R O L O G I C A L MONTHL Y V o l .
3 7 N o .
1 1 N o v e m b e r
2 0
1 1
2 0
1 0年9月2 9日收稿;
2 0
1 1年3月2 6日收修定稿 第一作者:罗阳, 主要从事中短期天气预报工作. E m a i l : l u o
8 8
8 y a n g @1
6 3. c o m 结果及其误差行为具有相似性.据此建立了一个相 似动力集合预报试验性系统, 并实施了长达3 1个 月的实时准业务月动力延伸预报试验, 与同期国家 气候中心的业务集合预报相比, 显示出令人鼓舞的 结果和非常好的业务应用前景.制作相似预报, 除 了要有好的方法、 好的因子外, 还要有适用的相似性 度量, 为此许多气象工作者对不同的相似性度量进 行了预报检验.阎惠芳等[
7 ] 对常用相似性判据进行 了降水预报检验, 各相似量从优至劣排序为: 相关系 数、 相似系数、 欧氏距离、 海明距离和相似离度[
8 ] ;
万 日金等[
9 ] 的检验结果从优至劣排序为: 海明距离、 相 似离度、 欧氏距离、 相似系数;
陈磊等[
1 0] 的相似性测 度对比分析结果为: 灰关联度较好, 其次为相关系数 和相似系数, 最差为欧氏距离和相似离度.目前, 很 多人在没有比较各相似性度量优劣的情况, 会选用 相似离度作为相似判据, 因为它 具有 所谓 的 形 、 值 判断能力, 而上述的相似量研究结果表明事实 并非如此.为了找到更好的相似量, 一些人将相似 系数或相关系数与所谓 值系数 ( 或称距离系数) 相 乘或相加, 作为新的相似量[ 7,
1 1
1 2 ] .本文 主要 对相似离度、 海明距离、 相关系数等相似量的性质进行分 析探讨, 指出它们使用的局限性.
1 海明距离与相似离度的关系 由于篇幅所限, 以下仅对海明距离和相似离度 进行分析. 1.
1 海明距离 如以 表示两样本间的海明距离, 则其表达 式为: =∑=1 - (1)式中, 椤瓯硎玖礁鲅, 表示因子数值, 表示因 子数量, 氡硎疽蜃有蚝( 各符号意义下同) . 甑闹涤蛭[ 0, 荦) , 荦 为一不定的数, 当其为0时两样本 最相似, 荦 越大越 不相似.而 所谓 的欧 氏距 离(见公式2 ) 的表达式与海明距离相近, 因此两者具 有相同的性质. =∑=1 ( - ) 2(2)从海明距离的表达式可见, 它反映的是两个样 本的空间距离, 而对形状差异反映不明显, 而形状差 异才是相似的关键.比如, 从表1中的4个样本( 每 个样本有5个因子, 平均值相同为6 ) 及其在图1中 的对应曲线可以明显看出, 样本1与样本
2、 样本3 与样本4比较相似, 但实际计算结果表明, 样本1与 样本
2、
3、
4 的海明距离是一样的, 即1
2 =1
3 =
1 4=1 2, 这显然是不对的;
而样本3与样本
1、
2、
4 的海明距离(
3 ) 是正确的.可见, 海明距离有时反 映不出样本的形状差异. 表1 海明距离、 相似离度与相似量 的对比分析
1 状 状 嶙, , 遄 样本序号
123451 113 331368586―――122.
4 0.
2 9
4 2
1 8
1 2 2.