编辑: 思念那么浓 | 2013-08-24 |
一、单选题
1、分析某网上客户的购买数据后发现,购买数据挖掘书籍的用户过了一段时间还会买大数据方面的书籍,这个问题可用哪种数据挖掘方法?(C) A.
关联规则发现 B. 聚类 C. 序列模式分析 D. 文本处理 2. 下面哪种可视化方法比较适合聚类分析?(B) A.直方图 B.散点图 C.条状图 D.箱图 4. 下列说法正确的是(B) A.具有较高的支持度的项集含有的项目数一定比较小 B.分类是这样的过程:它找出描述并区分数据类或概念的模型,以便能够使用模型预测类标记未知的对象类 C.分类和回归都可用于预测,分类的输出是连续数值,而回归的输出是离散的类别值 D.关联规则挖掘的目的是发现满足最小支持度的所有项集 5.通过聚集多个决策树模型来提高分类准确率的技术称为 (C) A.合并 B.聚集 C.集成 D.加权求和 6.下列说法错误的是(C) A.在聚类分析中,簇之间的相似性越大,簇内样本的差别越大,聚类的效果就越好 B.聚类分析可以看作是一种非监督的分类过程 C.K均值算法是一种常用的聚类算法,簇的个数算法不能自动确定 D.K均值算法的计算耗时与初始假设聚类中心的位置无关 7. 以下关于人工神经网络(ANN)的描述正确的说法是 (C) A.神经网络对训练数据中的噪声不敏感,因此数据质量可以差一些也没关系 B.不能确定输入属性的重要性 C.训练ANN是一个很耗时的过程 D.只能用于分类 8.以下说法正确的是(B) A.数据挖掘的目的在于从数据中发现有用的信息. B.数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好地完成描述数据、预测数据等任务. C.数据挖掘是对计算机仿真方法产生的业务数据进行模式的发掘. D.数据挖掘可以用一定的可视化方法展示数据中的多维度信息. 9. 数据挖掘的过程下面哪种理解是正确的(C) A.使用开源的数据挖掘软件挖掘的结果比商品化的数据挖掘软件要差 B.数据挖掘过程需要遵守CRISP-DM标准 C.数据挖掘项目数据越多挖掘质量越好 D.数据挖掘过程需要懂业务的人员参与 10.有关K-means下列说法正确的是(B) A.可以确定样本属性的重要性 B.可以处理凸型分布数据的聚类 C.适合任意数据集的分组 D.聚类的结果与初始选择的假设聚类中心有关 11.下面哪个通常不是关联算法的应用领域(D) A.分析某些用户一次访问网站购买的商品 B.分析文档集是否有一定数量的文档含有某2个主题 C.分析信用卡欺诈 D.分析论坛用户是否在一次访问中浏览了不同版面的帖子 12. 有关决策树的分类方法正确的是(B) A.决策树不能确定对决策属性起重要影响的变量 B.决策树可以用于发现各类样本的特征 C.决策树可用于确定相似的样本 D.决策树结构越复杂越有效 13.有关关联算法正确的是(A) A.关联规则挖掘的目的是发现满足最小支持度和最小置信度的所有关联规则 B.如果一个项集不是频繁的,那它的子项目集也不是频繁的 C.具有较低支持度的项集不能生成较高置信度的关联规则 D.关联规则的前向和后项位置替换后的关联规则支持度不变 14.数据预处理对数据挖掘是很重要的,下面说法正确的是(A) A.数据预处理的效果直接决定了数据挖掘的结果质量 B.数据噪声对神经网络的训练没什么影响 C.对于有问题的数据都直接删除即可 D.预处理不需要花费大量的时间 15. 下面哪个回归分析的说法是正确的(D) A.回归分析是分析一个变量与其他一个(或几个)变量之间的线性关系的统计方法 B.回归分析不需要样本训练 C.可以预测非数据型属性的类别 D.非线性回归问题一般要转化为线性回归