编辑: liubingb | 2013-04-17 |
0 0 D9
13 *
2 * D10
14 0
1 0 D11
15 0
1 1 D12 注: * 表示不能确定的属性值. 7)属性值约简 由可知,即,,
,所以条件属性中,,
中的值可以省略.同理可知:条件属性中,,
,,
,,
,中的值可省略;
条件属性中的,,
,中的值可以省略.属性值约简后的决策表如表5所示: 表5 冗余属性值约简后的决策表 样本X 条件属性C 决策 属性 D
1 0
0 0 D0
2 2 - - D1
3 1 - - D1
4 *
1 - D2
5 0 - * D3
6 0
2 0 D3
7 0
0 1 D4
8 *
0 - D5
9 * -
1 D6
10 1 -
2 D7
11 0 -
2 D8
12 1 -
0 D9
13 *
2 * D10
14 0
1 0 D11
15 -
1 1 D12 注: * 表示不能确定的属性值, - 表示冗余的属性值. 说明:由计算可得条件属性中的第13个属性值为冗余属性值,但由于,中第13个属性值均不能确定,故保留条件属性中的第13个属性值. 得到最简最优规则: 1. if c1 is
0 and c2 is
0 and c8 is
0 then D is D0;
2. if c1 is
2 then D is D1;
… 15. if c2 is
1 and c8 is
1 then D is D12. 结果分析 以文[11]中提出的基于粗糙集的约简算法对电力变压器故障诊断决策表进行约简得到142种约简,如表6所示. 表6 条件属性的142种约简 编号 约简 冗余属性
1 C1,C5,C9,C11 C2,C3,C4,C6,C7,C8,C10,C12,C13,C14 … … …
47 C3,C4,C5,C12,C14 C1,C2,C6,C7,C8,C9,C10,C11,C13 … … …
142 C8,C9,C11,C13,C14 C1,C2,C3,C4,C5,C6,C7,C10,C12 使用该算法虽然对原始故障诊断决策表实现了约简,对诊断速度也有所提高,但由于最后得到142种属性约简,其最终构成的诊断规则集仍然相当庞大,要完成故障诊断仍需较长的时间.而使用本文的算法最后得到的是最小最优约简集,故可以大大提高故障诊断的速度和准确性. 结论 本文针对粗糙集理论中以粗糙度来刻画信息粒度所存在的局限性(即当某几个不同等价类具有相同的上下近似时,根据粗糙度的定义所得的知识粒度应该是相同的,而实际并不相同,此时粗糙度就不能正确反映知识粒度),研究了信息论观点下的信息粒度概念,提出以粒度熵作为评价信息粗糙性的标准,并提出了一种基于粒度熵的属性约简算法,运用该算法可以实现对属性及属性值的约简,最终得到最小最优的约简属性集,实例验证该方法是有效的. [参考文献] 郭林鹏.基于粗糙集和粒度计算的不确定信息度量及知识约简研究[D].河南师范大学,2008. 李秀红,史开泉.一种基于知识粒度的属性约简算法[J].计算机应用,2006,26(6):76-77. 苗夺谦,范世栋.知识的粒度计算及其应用[J].系统工程理论与实践,2002,1(1):48-56. 梁吉业,曲开社,徐宗本.信息系统的属性约简[J].系统工程理论与实践,2001,12:76-80.. Yao Y Y. Granular Computing:basic issue and possible solutions[C].Proceedings of the 5th Joint Conference on Information Sciences,2000:........