编辑: bingyan8 | 2017-09-19 |
5 6.
5 6
1 2 2.
4 0.
5 2
0 2
3 4.
6 0.
1 1
5 3
5 4 4.
5 9 7.
5 6
1 2 2.
4 0.
2 9
4 ― ― ―
4 8 5.
5 3.
5 6
7 6
1 2 2.
4 0.
1 4
3 9 1.
8 0.
4 0
0 图1 相似性比较示意图 F i g .
1 S k e t c hm a po f s i m i l a r i t yc o n t r a s t 1.
2 相似离度
1 9
8 6年, 李开乐[ 8] 提出了一个相似量― ― ―相似 离度, 认为可以反映样本的 形 与 值 , 因此, 目前 使用者较多.但是, 相似离度并不能真正地反映样 本的 形 与 值 , 它的相似选择能力与海明距离并 无明显差异, 后面将看到, 相似离度实际上也是一种 广义的海明距离;
而阎惠芳等[
7 ] 、 陈磊等[
1 0 ] 的相似
4 4
4 1 气象第3 7卷 预报试验表明, 相似离度是各相似量中表现最差的. 如以 瓯硎玖窖椤 昙涞南嗨评攵, 则其表 达式为: =12(犁+ ) (
3 ) 式中, 犁昙此降 形系数 , 昙此降 值系数 , 若以 表示两样本椤 甑牡 个因子差, 则犁=1怼 =1 - (
4 ) =1怼 =1 (
5 ) = - (6)=1怼 =1 (7)甑闹涤蛭[ 0, 荦) , 荦 为一不定的数, 当其为0 时两样本最相似, 荦 越大越不相似.式中 值系数 甑 值 并不是前面提到的平均值, 它反映的不是 两样本平均值的 差异程度.从式( 5) 和( 6) 可以看 出, 它实际上是两样本的海明距离对因子总数 砬笃骄, 不妨称其为 平均海明距离 , 所以 攴从车 是两样 本空间距离的大小, 而这种距离是 形 与 值 共同影 响造 成的, 因此, 瓴⒉皇鞘裁 值系数 . 晔导噬鲜茄 与样本 的平均值的差, 因为, 若以 表示平均值, 昕梢杂孟率奖硎. =1怼 =1 =1怼 =1 ( - )= - (
8 ) 将式(
6 ) 和式( 8) 代入式( 4) , 则 形系数 犁甑牧硪恢直泶锸轿: 犁=1怼 =1 - =
1 怼 =1 ( -) - ( -) (9)可见, 犁晔导噬鲜 样本距平 的海明距离对因 子总数 砬笃骄, 不妨称其为 平均距平海明距离 , 因此, 犁暌参薹ǚ从吵 样本距平 的形状变化. 特别地, 如果 =, 即两样本的平均值相等, 则 =0, 犁=, 晖杀湮桓 平均海明距 离 .所以, 相似离度 实 际上 是一种广 义的 海明 距离.如图1中的各条曲线, 它们的平均值均为6, 相 似离度变为平均海明距离, = /5, 分辨不出目 标样本1与样本
2、
3、 4间的相似差异.尤其重要的 是, 在相似样本的选择过程中, 样本间的平均值往往 很接近, 因此, 相似离度与海明距离的相似选择能力 几乎没有什么区别. 1.
3 相似量 下面给出罗阳提出的一个相似量[
1 3] , 其表达式 为: =1- ∑ =1 ( - ) - ( - ) =1 ( - + - ) (
1 0 ) 甑闹涤蛭[ 0,
1 ] , 当其为1时两样本最相似. 当 晡0时, 是不相似, 而不是最不相似.因为当 两样本每个因子的距平符号相反时, 有| ( - ) - ( - ) |=| - |+| - |, 辍0, 这时, 尽 管距平相差越大越不相似, 但昃0.这并不影 响相似样本的选取, 因为我们找的相似样本都是 暝酱笤胶, 晖笥0. 从表1中可以看出,
1 2=0.
5 2 0,
3 4=0.
4 0 0相 对较大, 这与样本1与样本
2、 3与4较相似是一致 ........