编辑: liubingb 2013-04-17

则当,即为相等关系,每一个自成一个等价类时,粒度达到最小值.当,即为论域关系时,粒度达到最大值.一般情况下,有,知识的粒度可以表示知识的分辨能力,当时,表示对象在下不可分辨,属于同一个等价类(知识粒度),否则可分辨,属于不同的等价类.因此也表示在中的两个对象不可分辨的可能性大小,愈大,不可分辨的可能性愈大. 熵值也是知识颗粒的一种度量.知识的粒度越大,其对对象的划分越粗糙,则熵值越小;

知识的粒度越小,其对对象划分越细,则熵值越大.因此按照信息论中的信息熵来定义知识的粒度熵. 定义2[8] 设是论域上定义的知识,知识的粒度熵为 从上式可以看出,知识颗粒提供的信息是一个确定的数值,这就为定量化信息粒度提供了方便.不同的分类,对应不同的粒度熵.计算中对数log通常选取2为底,计算出的粒度 熵对应以比特(bit)为单位,也可以选取其它数为底,只是计算出的粒度熵所对应的单位有所不同. 定义3[8] 知识相对于知识的相对粒度熵定义为 式中 . 经典的粗糙集理论是通过知识粗糙度区分不同知识的分类精度,但是有时并不能完全区分不同知识的分类精度. 例如:一个粗糙集合,它的上、下近似定义为,,

这些近似区域可分别由下面的几个等价类得到: 它们具有相同的上、下近似,根据粗糙集的粗糙度计算公式,可知它们的粗糙度是一样的.但是很明显,,

,所表示的知识粗糙性(知识粒度)是不一样的,因此粗糙集所定义的知识粒度具有局限性.如果用粒度熵来计算上面所举的例子,便可区分各个粒度所包含的信息量. 计算结果表明:相对于传统的粗糙集而言,粒度熵作为评价信息粗糙性的标准优于传统的粗糙集理论,使 粒 具有层次概念,实现信息量的定量分析,从而将论域信息约简为最小最优,也表明了随着粒度熵的增大,越能得到更精细的分类,从而解决了原来经典粗糙集粗糙度刻画信息粒度的局限性. 定义4[8] 给定是一个知识表达系统,,

为条件属性,为决策属性,,

任意属性的相对决策属性的重要度为 上述定义表明属性关于决策属性集的重要性由中添加后所引起的信息量的变化大小来度量.的值愈大,说明属性对决策属性愈重要. 根据属性相对重要性的概念,约简时先把最重要的属性加入约简集中,直到其对决策属性的相对粒度熵等于全部条件属性集对决策属性的相对粒度熵为止. 基于粒度熵的知识约简算法 约简是粒度计算理论中重要的概念之一,其知识约简包括属性约简和属性值约简两部分.属性值约简是进一步简化最终形成的规则,使之更加具有一般性.属性约简就是在保持信息系统的分类能力不变的前提下,删除其中的冗余属性,用尽量少的属性来描述整个信息系统[9].一般情况下,一个信息系统的属性约简并不是惟一的,因此人们很期望找到具有最小最优属性的约简.本文提出的基于粒度熵的约简算法没有经过计算属性核,经过此算法对决策表约简后的条件属性集不但是最小约简,而且是最优约简. 具体约简步骤如下: 计算原始故障征兆集对故障原因集的贡献.即计算故障诊断决策表中条件属性集对于决策属性集的粒度熵(信息量),将计算所得的粒度熵值作为原始故障征兆集对故障原因集的贡献.公式说明:计算,其中为决策属性,为条件属性. 计算条件属性集中最大信息量所对应的条件属性.即计算条件属性集中各个条件属性的粒度熵,将最大粒度熵值所对应的条件属性作为约简集的参数.公式说明:计算,,

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题