编辑: 思念那么浓 | 2016-03-23 |
1
一、单选题
1、某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的【 】问题.
A:关联规则 B:聚类 C:分类 D:自然语言处理 答案:A
2、将原始数据进行集成、变换、维度规约、数值规约是【 】步骤的任务. A:频繁模式挖掘 B:分类和预测 C:数据预处理 D:数据流挖掘 答案:C
3、当不知道数据所带标签时,可以使用【 】技术促使带同类标签的数据与带其他标签 的数据相分离. A:分类 B:聚类 C:关联分析 D:隐马尔可夫链 答案:B
4 200
160 130 级110 人.则年级属性的众数是【 】 . A 一年级 B 二年级 C 三年级 D 四年级 答案:A
5、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值,这属于数据挖 掘的【 】任务. A:根据内容检索 B:建模描述 C:预测建模 D:寻找模式和规则 答案:C
6、假设
12 个销售价格数据排序后为:5, 10, 11, 13, 15, 35, 50, 55, 72, 91, 204, 215,使用等频 分箱法将它们划分成四个箱.则15 在【 】箱子内. A:第一个 B:第二个 C:第三个 D:第四个 答案:B
7、假设
12 个销售价格数据排序后为:5, 10, 11, 13, 15, 35, 50, 55, 72, 91, 204, 215,使用等宽 分箱法将它们划分成四个箱.则15 在【 】箱子里. A:第一个 B:第二个 C:第三个 D:第四个 答案:A 《计算思维导论题库》
2
8、设X={1,2,3}是频繁项集,则可由 X 产生【 】个关联规则. A:4 B:5 C:6 D:7 答案:C
9、以下【 】算法是聚类算法. A:ID3 B:C4.5 C:K-Mean D:Apriori 答案:C
10、以下【 】算法是关联规则算法. A:DBSCAN B:C4.5 C:K-Mean D:Apriori 答案:D
二、 多选题
1、数据挖掘的预测建模任务主要包括【 】大类问题. A:分类 B:回归 C:模式发现 D:模式匹配 答案:AB
2、以下【 】学科和数据挖掘有密切联系. A:统计学 B:计算机硬件 C:矿产挖掘 D:数据库技术 答案:AD
3、在现实世界的数据中,记录在某些属性上缺少值是常有的.描述处理该问题的各种方法 有【 】 . A:忽略记录 B:使用属性的平均值填充空缺值 C:使用一个常量填充空缺值 D:使用最可能的值填充空缺值 答案:ABCD
4、对于数据挖掘中的原始数据,存在的问题有【 】 . A:不一致 B:重复 C:不完整 D:含噪声 E:维度高 答案:ABCDE
5、下列属于有序数据的有【 】 . A:时序数据 B:序列数据 C:空间数据 D:事务数据 《计算思维导论题库》
3 答案:ABC
三、分析计算题
1、假定给定的数据集的值已经分组为区间.区间和对应的频率如下: 年龄 频率 1~5
200 5~15
450 15~20
300 20~50
1500 50~80
700 80~110
44 计算数据的近似中位数值. 解答: 先判定中位数区间:N=200+450+300+1500+700+44=3194;
N/2=1597 ∵ 200+450+300=950