编辑: bingyan8 2017-09-19

5 6.

5 6

1 2 2.

4 0.

5 2

0 2

3 4.

6 0.

1 1

5 3

5 4 4.

5 9 7.

5 6

1 2 2.

4 0.

2 9

4 ― ― ―

4 8 5.

5 3.

5 6

7 6

1 2 2.

4 0.

1 4

3 9 1.

8 0.

4 0

0 图1 相似性比较示意图 F i g .

1 S k e t c hm a po f s i m i l a r i t yc o n t r a s t 1.

2 相似离度

1 9

8 6年, 李开乐[ 8] 提出了一个相似量― ― ―相似 离度, 认为可以反映样本的 形 与 值 , 因此, 目前 使用者较多.但是, 相似离度并不能真正地反映样 本的 形 与 值 , 它的相似选择能力与海明距离并 无明显差异, 后面将看到, 相似离度实际上也是一种 广义的海明距离;

而阎惠芳等[

7 ] 、 陈磊等[

1 0 ] 的相似

4 4

4 1 气象第3 7卷 预报试验表明, 相似离度是各相似量中表现最差的. 如以 瓯硎玖窖椤 昙涞南嗨评攵, 则其表 达式为: =12(犁+ ) (

3 ) 式中, 犁昙此降 形系数 , 昙此降 值系数 , 若以 表示两样本椤 甑牡 个因子差, 则犁=1怼 =1 - (

4 ) =1怼 =1 (

5 ) = - (6)=1怼 =1 (7)甑闹涤蛭[ 0, 荦) , 荦 为一不定的数, 当其为0 时两样本最相似, 荦 越大越不相似.式中 值系数 甑 值 并不是前面提到的平均值, 它反映的不是 两样本平均值的 差异程度.从式( 5) 和( 6) 可以看 出, 它实际上是两样本的海明距离对因子总数 砬笃骄, 不妨称其为 平均海明距离 , 所以 攴从车 是两样 本空间距离的大小, 而这种距离是 形 与 值 共同影 响造 成的, 因此, 瓴⒉皇鞘裁 值系数 . 晔导噬鲜茄 与样本 的平均值的差, 因为, 若以 表示平均值, 昕梢杂孟率奖硎. =1怼 =1 =1怼 =1 ( - )= - (

8 ) 将式(

6 ) 和式( 8) 代入式( 4) , 则 形系数 犁甑牧硪恢直泶锸轿: 犁=1怼 =1 - =

1 怼 =1 ( -) - ( -) (9)可见, 犁晔导噬鲜 样本距平 的海明距离对因 子总数 砬笃骄, 不妨称其为 平均距平海明距离 , 因此, 犁暌参薹ǚ从吵 样本距平 的形状变化. 特别地, 如果 =, 即两样本的平均值相等, 则 =0, 犁=, 晖杀湮桓 平均海明距 离 .所以, 相似离度 实 际上 是一种广 义的 海明 距离.如图1中的各条曲线, 它们的平均值均为6, 相 似离度变为平均海明距离, = /5, 分辨不出目 标样本1与样本

2、

3、 4间的相似差异.尤其重要的 是, 在相似样本的选择过程中, 样本间的平均值往往 很接近, 因此, 相似离度与海明距离的相似选择能力 几乎没有什么区别. 1.

3 相似量 下面给出罗阳提出的一个相似量[

1 3] , 其表达式 为: =1- ∑ =1 ( - ) - ( - ) =1 ( - + - ) (

1 0 ) 甑闹涤蛭[ 0,

1 ] , 当其为1时两样本最相似. 当 晡0时, 是不相似, 而不是最不相似.因为当 两样本每个因子的距平符号相反时, 有| ( - ) - ( - ) |=| - |+| - |, 辍0, 这时, 尽 管距平相差越大越不相似, 但昃0.这并不影 响相似样本的选取, 因为我们找的相似样本都是 暝酱笤胶, 晖笥0. 从表1中可以看出,

1 2=0.

5 2 0,

3 4=0.

4 0 0相 对较大, 这与样本1与样本

2、 3与4较相似是一致 ........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题