编辑: You—灰機 | 2015-08-20 |
0 调整到 b'
――表示我们对假设的不信度(用b表示信任度),这样也可
13 鲁晨光,广义信息论,中国科学技术大学出版社,
1993 年.p.37.
14 Karl Popper, Conjectures and Refutations. 1963;
Repr 2005. London and New York: Routledge. p. 526.
15 Peter Milne. 1996. log[P(h/eb)/P(h/b)] Is the One True Measure of Confirmation. Philosophy of Science 63:21-26. 以避免负无穷大信息. 适当调整 b'
可以使平均语义信息达最大, 等于 Kullback-Leibler 信息. 有了优化的不信度,记为 b'
*, 我们就可以得到优化的信任度,即可信度(或确证度)b*. 下一节谈不信度优化.下面先谈为什么最优真值函数往往是模糊的.式(6)可以写成两 个Kullback-Leibler 信息差的形式: log - ( | )log i j i j j i j i j i i i i j p e h p e h I E h p e h p e h p e p e A ? ? ? (7) 因为 Kullback-Leibler 信息总是大于 0,所以上式第二项为
0 的时候,平均信息量最大.容 易证明,当理论预测和样本统计符合的时候,即p(E|Aj)= p(E|hj), 或T(hj|E)正比于 P(hj|E) 时,第二项等于 0,这时平均信息量达最大.令T(hj|E)的最大值是 1,可以得到 T(hj|E)=P(hj|E)/P(hj|ej*)=P(E|hj)/P(E)/[p(ej*|hj)/p(ej*)] (8) 其中 ej*是使 P(hj|E)达最大的 E.上式似乎反映了贝叶斯学派和似然度学派的统一.不过上 式中没有逻辑概率,也没有预测的概率,只有客观统计得到的概率.条件概率 P(hj|E)可被称 之为选择概率,反映预测者选择语句的规律,一般是一条曲线,所以最好的真值函数也应是 一条曲线.这就是为什么听众对天气预报和股市预测一般按模糊方式理解. 上面所有公式对于模糊真值函数也是合适的.特别是对于数字预测或估计 hj= E 大约 是ej ,比如 hj= 指数大约会涨到
10000 点 ,真值函数可假设为 T(hj|E)=exp[-(E-ej)2 /(2d2 )](其中d是标准偏差),其信息量随 E 变化如图
2 所示. 图2.预测信息随偏差增大而减小,随逻辑概率减小而增大 温度表,GPS 和手表读数或指针都可以看做估计,也都可以用上述公式计算信息.什 么样的预测信息量大?1)误差要小;
2)逻辑概率要小.什么样的预测逻辑概率小?根据公式 (2),首先,外延小的预测逻辑概率小,比如 股市涨幅大概是 10% 就比 股市会涨 逻 辑概率小.第二,事件要出乎意外,比如 指数会有翻倍涨幅 就比 指数会涨 10% 逻 辑概率小.股市常见的模糊假设比如: 指数可能会涨 , 如果没有利空,指数会持续缓慢 上涨. 这些预测逻辑概率大,信息极少. 当然,逻辑概率小的预测,比如 指数今年会涨一倍 ,也容易错,或者说容易被证伪. 对于预测者来说,如果你预测不准,你用的语言就要更加模糊些.一种方法是用 ...大约会 涨到… 这样的语言,等于用标准差 d 较大的真值函数.第二种方法是降低听众信任度,比 如说 指数有涨一倍的可能 ,言下之意是不排除其他可能.下面我们就讨论如何通过降低 信任度 b 提高平均语义信息,并得到优化的信任度――即可信度 b*. 3. 优化不信度得到可信度――以股市涨跌和医学检验为例 为简化起见,我们把 E 分为两类:e1 和e0, e1 使h1 为真,e0 使假设 h1 为假.我们简记 P1=P(e1), P0=P(e0), Q1=P(e1|h1),Q0=P(e0|h1). 我们用 hj b 表示可信度为 b 的hj(注意 hj
1 =hj),其真值函数定义为(假设 b>
0): T(hj b |E)= b'
+bT(hj|E) (9) 其中 b'
是不信度,b'
=1-|b|,它表示一个假设中含有永真句的比例.那么就有 T(hj b |e1)=1, T(hj b |e0)= b'