编辑: liubingb | 2013-04-17 |
com|03516011493|13133019926|2|刘艳红|LIU Yanhong|太原理工大学信息工程学院,太原(030024)|College of Information Engineering,Taiyuan University of Technology,Taiyuan(030024)|||||||3|谢刚|XIE Gang|太原理工大学信息工程学院,太原(030024)|College of Information Engineering,Taiyuan University of Technology,Taiyuan(030024)||||||基于粒度熵的知识约简算法及其应用|Knowledge Reduction Algorithm Based on Granularity Entropy and Its Application|国家自然科学基金(60975032) 太原理工大学信息工程学院,太原(030024) 摘要:针对现有知识约简算法中存在的不完备性问题,提出了一种基于粒度熵的启发式知识约简算法,该算法不需要求核,对无核的这种特殊信息系统计算约简更加有效.将该算法应用于电力变压器故障诊断决策表的约简,结果表明该约简算法可以从各约简集中选择最小最优的属性约简,避免了选择约简集的盲目性,同时也大大提高了故障诊断的效率. 关键词: 粒度熵;
知识约简;
故障诊断 中图分类号:TP18,TP206 Knowledge Reduction Algorithm Based on Granularity Entropy and Its Application ZHANG Jing, LIU Yanhong, XIE Gang (College of Information Engineering,Taiyuan University of Technology,Taiyuan(030024)) Abstract: In view of the incomplete questions which existed in existing knowledge reduction algorithms,we propose a new heuristic knowledge reduction algorithm based on granularity entropy.More,this algorithm is effective not only to the information system with core,and especially effective to the information system without core.Use the algorithm in transformer fault diagnosis decision table reduction.The results show that the minimalist and optimal reduction set can be selected from all reduction sets and the blindness of selecting reduction set is avoided.Moreover,the algorithm can greatly improves the efficiency of fault diagnosis. Key words: granularity entropy;
knowledge reduction;
fault diagnosis 引言 粒计算理论是一种新的处理模糊和不确定知识的数学工具.知识约简是粒计算理论中的重要内容之一,它刻画了信息系统中知识的本质部分.所谓知识约简,就是在保持信息系统的分类能力不变的前提下,删除其中的冗余属性.因为通过信息系统发现知识,主要是用属性来表达知识的分类.各种属性在表达知识的分类中的作用是不同的.有些属性是绝对不必要的,去掉这些属性并不影响知识的发现;
有些属性是绝对必要的,去掉这些属性必然会影响知识的发现;
有些属性是相对必要的,它与所有绝对必要的属性搭配起来才不会影响知识的发现;
甚至有些属性是冗余的,冗余属性的存在,不仅会造成资源的浪费,而且会干扰人们做出正确的决策.因此,信息系统中的属性关于知识的发现的重要性应该有个度量[1]. 针对现有的知识约简算法[2-4]中存在的不完备性问题,本文从信息论的信息熵理论出发,对经典的知识粒度及信息熵理论进行推广,研究了信息系统中知识的粒度原理,揭示了知识粒度和粒度熵原理的本质和关系,以粒度熵作为属性重要性的度量,为进一步研究知识的粒度计算提供了理论基础,最后提出了基于粒度熵的知识约简算法,该算法以粒度熵最大的属性为启发信息,把最重要的属性加入约简集中,直到其对决策属性的相对粒度熵等于全部条件属性集对决策属性的相对粒度熵为止.且该算法不需要求核,对无核的这种特殊信息系统计算约简更加有效.通过该算法可以从其它约简算法得到的最小约简集中筛选出最优最小的约简集.该算法应用于故障诊断决策表的约简过程中可以有效的提高故障诊断的速度和可靠性. 粒度的基本理论 粒计算(Granular Computing)[5-7]是一种基于问题概念空间划分的新的智能计算理论和方法,它能有效地分析和处理模糊、不精确、不一致和部分真值的问题,覆盖了所有有关粒度的理论、方法论、技术和工具的研究,它是模糊集理论、粗糙集理论、商空间理论等的超集,现已成为人工智能领域中一个重要的研究分支,而且具有广泛的应用前景. 定义1[8] 设为一个论域,为上的一个等价关系,集合是上的一个关于知识的一个划分,根据的基本集合的描述来划分可得到(基本知识),等价类(基本知识颗粒),即设在上导出的划分为: ,即基本知识的粒度为 式中表示集合的基数. 命题1[8] 设R为知识库中的知识,,